하이퍼커넥트, ‘인터스피치 2019’에서 음성인식 AI 연구 성과 발표

2019-08-13 09:09
특정 단어 발화 감지에 템퍼럴 컨볼루션 도입, 인식 속도 385배 증가 및 정확도 0.3% 향상

하이퍼커넥트가 다음달 오스트리아 그라츠에서 열리는 `인터스피치 2019`에 참가해 음성인식 분야 AI 연구 성과를 발표한다고 13일 밝혔다.

올해로 20회를 맞는 ‘인터스피치(INTERSPEECH)’는 음성언어처리 분야에서 세계 최고 권위를 인정받고 있는 국제 학회이다. 매년 2천 명 규모의 전 세계 연구진이 모여 음성인식과 음성합성, 음성통신 관련 연구 성과를 공유한다. 올해 행사는 9월 15일부터 19일까지 오스트리아 그라츠에서 개최되며, 구글, 페이스북, 아마존, 엔비디아, 알리바바 등 글로벌 유수 기업과 대학이 발표자로 나선다.

하이퍼커넥트는 ‘인터스피치 2019’에서 논문 “Temporal Convolution for Real-time Keyword Spotting on Mobile Devices”의 연구 성과를 발표할 예정이다. 하이퍼커넥트 머신러닝팀은 이번 연구를 통해 모바일 기기에서 음성인식으로 특정 키워드를 검출하는데 `템퍼럴 컨볼루션(Temporal convolution)`을 적용, 기존 최고 성능 모델 대비 음성인식 AI의 키워드 검출 속도를 385배 높이는 동시에 정확도는 0.3% 높이는 성과를 달성했다. 키워드 검출은 사용자의 자연어 발화에서 특정 키워드를 인식해내는 기술로, “오케이 구글”, “헤이 시리” 등의 음성 명령을 실행하는데 흔히 쓰이는 중요 기술 중 하나이다.

하이퍼커넥트는 2016년 머신러닝 기반의 실시간 음성 번역 기능을 아자르 앱에 도입한 것을 시작으로, 자체 머신러닝 연구 조직을 갖추고 모바일 딥러닝 분야 연구에 투자해왔다. 특히 서버와의 통신 없이 스마트폰 기기 내에서 가볍고 빠르게 구동 가능한 온디바이스 AI를 만드는 데 집중해 지난해 ‘CVPR 2018’에서 진행된 ‘저전력 이미지 인식 챌린지(LPIRC)’에서는 국내 기업 최초로 2위에 오르는 성과를 거두기도 했다. 하이퍼커넥트는 기존 이미지·영상 처리 분야에서 쌓아온 기술력을 바탕으로 음성, 텍스트 등으로 AI 연구 분야를 확장해 나간다는 계획이다.

하이퍼커넥트 용현택 CTO는 “음성인식 분야로 AI 연구 도메인을 확장한 후 단기간에 가시적 연구 성과를 달성하고, 이를 세계 최고 권위 학회에서 글로벌 IT기업들과 나란히 공유하게 되어 기쁘다”며 “앞으로 영상, 음성, 텍스트 등 다양한 분야에서 최첨단 온디바이스 AI 모델을 연구하고 개선하여 전 세계 사용자들에게 더 많은 가치를 제공할 수 있도록 노력하겠다”라고 밝혔다.
 

[사진=하이퍼커넥트 CI]