한국어 음성검색에 초대규모 AI 기술이 적용된 사례는 이번이 처음이다.
하이퍼클로바는 기존 AI와 달리 높은 연산 능력을 바탕으로 네이버의 블로그, 지식인(iN), 뉴스 등의 데이터를 학습해 다양한 표현들을 스스로 인식하고, 긴 문장을 요약하거나 새로운 문장을 생성할 수 있는 게 특징이다. 앞서 하이퍼클로바는 네이버 검색, 쇼핑, 클로바노트 등 다양한 서비스에 적용됐다.
이번에는 네이버앱 음성검색 질의의 약 30%에 하이퍼클로바 기술이 적용됐다. 사용자 발화 맥락에 대한 이해도를 높였다. 음성인식 오류 감소 등으로 음성검색 성능을 개선했다.
긴 구어체나 이해하기 어려운 질의도 키워드형 질의로 자동 요약·변환해 네이버 콘텐츠 검색, 지식스니펫 등 정답형 검색결과를 바로 찾아주는 방식으로 개선됐다.
하이퍼클로바가 적용된 음성검색에선 음성인식 오류나 무의미어가 포함된 질의에 대해서도 자연스러운 문장을 학습한 결과를 토대로 정확한 질의로 변환 후 검색결과를 안내한다. ‘가령, ‘춤법검사기’만 인식되더라도 ‘맞춤법검사기’로 변환해 검색결과를 찾아주고, ‘제고 186회 로또 번호’처럼 순서가 섞이고, 무의미어가 포함된 문장이더라도, ‘로또 186회 당첨번호’로 질의를 변환한 후 맞춤결과를 안내하는 식이다. 네이버는 자체 평가결과, 발화가 불분명해 저품질 결과가 제공되던 질의의 정확도가 약 50% 개선됐다고 밝혔다.
네이버는 음성검색에 하이퍼클로바 뿐만 아니라 자체 개발한 서비스 필터도 함께 적용해, 하이퍼클로바가 사용자의 발화를 잘못 인식하거나, 부정확한 답변 생성 가능성까지 최소화했다.
김현욱 네이버 클로바 CIC 대화서비스리더는 “네이버는 ‘모두를 위한 AI’가 되겠다는 하이퍼클로바의 방향성에 맞게, 기술개발에 그치지 않고 이를 통해 새로운 서비스 가치를 창출해 내는데 앞장서고 있다”며 “앞으로도 사용자에게 혁신적인 서비스를 제공할 수 있도록 하이퍼클로바 적용 범위를 확대하며 기술 상용화를 선도할 것”이라고 밝혔다.