카카오미니 '음성엔진' 고도화... 주인 목소리 구별하고, 영어도 구사한다

2018-04-25 15:16

카카오의 음성인식 인공지능(AI) 스피커 '카카오미니'가 음성엔진 고도화를 통해 더욱 똑똑해진다. 카카오는 상반기 중에 목소리 주인을 인식해 맞춤형 서비스를 제공하는 화자인식 기능을 추가하고, 영어 음성인식을 탑재한다. 특정 상황에 유명인 등 연예인 목소리를 제공하는 서비스도 선보인다. 

카카오는 25일 종로구 마이크임팩트스퀘어에서 열린 AI 미디어 스터디에서 카카오의 음성엔진 기술을 소개하고 향후 서비스 계획을 공개했다. 김훈 카카오 음성처리 파트장은 "카카오의 음향 모델 학습 데이터는 약 2만 시간, 음성인식기 어휘 수가 100만 형태소에 달한다"고 설명했다. 
 

김훈 카카오 음성처리파트장이 25일 열린 카카오 AI 미디어 스터디에서 카카오의 음성인식 기술을 설명하고 있는 모습. (사진=한준호 기자) 


카카오는 상반기 중으로 카카오미니에 화자인식 기술을 탑재한다. 화자인식 기술은 등록된 화자(말하는 사람)의 목소리를 인식해 구별하는 기술이다. 목소리에서 나오는 음성 신호에서 특징을 추출해 등록된 화자 정보와 비교해 누가 누군지를 구별하고 동일 인물인지를 인식한다.

카카오미니가 화자를 구별할 수 있게 되면 다양한 개인화 서비스 제공이 가능해질 전망이다. 목소리 주인공의 취향에 맞는 음악을 골라주고, 관심사를 파악해 맞춤형 뉴스를 제공할 수도 있으며, 쇼핑에서 상품을 추천할 수도 있다. 이를 더욱 고도화시키면 결제 서비스에서 보안을 더욱 강화할 수도 있게 된다. 목소리와 암호를 조합하면 더욱 강안 보안을 유지할 수 있다.

이를 위해 카카오는 보이스 프로필을 업데이트 한다. 카카오미니에 자신의 목소리를 등록해 보이스 프로필을 만들면 이용자 기반의 맞춤형 서비스를 제공할 수 있게 된다. 이와 함께 카카오는 카카오톡 메시지를 읽어주는 기능도 추가한다. 

올해 음성인식 가능 언어에 영어도 추가된다. 영어는 번역 엔진과 결합해 카카오미니에 영어로 말을 걸면 한국어로 번역해주는 음성 번역 기능을 제공한다. 향후 일본어와 중국어도 추가한다는 계획이다. 

카카오미니 목소리에 유명인, 연예인의 목소리를 추가한다는 계획도 밝혔다. 카카오는 특정한 상황이 발생하거나 특정 대화에서 연예인 목소리를 적용하는 서비스를 준비 중이다. 
 

(사진=한준호 기자) 


카카오는 지난 2010년부터 모바일 다음앱 음성검색을 시작으로 꾸준히 음성 기술을 발전시켜왔다. 음성인식, 음성합성, 화자인식 등 음성처리기술 전 과정에서 자체 기술을 확보하고 있으며, △카카오내비 △카카오T △멜론 △카카오미니 △브런치 △카카오치즈 △카카오버스 △카카오스탁 △현대차 음성인식까지 다양한 앱과 디바이스에 카카오의 음성엔진이 적용됐다. 

김 파트장은 "카카오의 음성인식 기술이 카카오미니라는 스피커를 출시한 이후 사용률이 늘었지만, 새로운 분야에 적용할 수 있는 서비스가 있는지도 고민하고 있다"며 "카카오 검색과 결합된 새로운 서비스를 중심에 두고 신규 운용 분야가 있지 않을까 생각하고 있다"고 말했다.