음성 기술은 2017년 전세계 IT 업계의 화두인 인공지능 및 모바일 개인 비서 서비스의 근간을 이루는 핵심 기술로 떠오르면서 카카오는 이번 결정이 올 한 해 국내 인공지능 기술 발전의 촉매가 될 것으로 기대하고 있다.
카카오가 음성 API 무료 이용량을 기존 하루 5000건에서 4배까지 대폭 확대한 것은 지난 3년 간, 음성 기술을 필요로 하는 기업 및 개인의 다양한 요구를 확인했기 때문이다.
김재범 카카오범 미디어처리파트장은 "모바일 기기의 발전과 인공지능에 대한 관심 등에 힘입어 음성 기술에 대한 필요가 계속 증가하는 추세"라며 "음성 검색이나 음성 합성을 기반으로 한 서비스를 개발 및 상용화하는데 제약이 없는 수준을 검토한 끝에 하루 2만 건으로 음성 API 무료 이용량을 확대하게 됐다"고 설명했다.
카카오는 입력된 목소리를 문자로 변환, 음성 검색 서비스를 가능케 하는 음성 인식 엔진 '뉴톤'을 자체 개발한 바 있다.
2014년 2월 API를 처음 개방했으며, 같은 해 6월 입력된 문자를 음성으로 변환해서 사람이 읽어주는 것처럼 자연스럽게 들려주는 음성 합성 엔진 '뉴톤 톡'을 개발, 기존 음성 인식 API에 해당 기능을 추가해 인식과 합성이 모두 가능한 음성 API를 완성했다.
다년 간 구축해 온 방대한 양의 데이터베이스와 고도화된 딥러닝 경험 등을 바탕으로 완성한 한국어 음성 엔진을 개방한 것은 국내 최초다. 개방 당시 기업 및 개발자 누구에게나 하루 최대 5000건을 무료 제공함으로써 스타트업의 혁신적인 모바일 서비스 개발과 음성 기반 서비스 편의 제공 등을 가능하게 했다.
이미 470여 기업 및 개인이 카카오 음성 API를 이용 중으로, 업종 역시 쇼핑, 교육, 병원 등 다양하다. 특히 장애인 관련 서비스 및 기업에서 음성 API를 적극적으로 활용하고 있다.
배달 대행 업체 제트콜은 카카오 음성 API를 앱에 적용, 배달 주문이 접수되면 이를 음성으로 변환해 매장과 배달 담당 직원에게 안내한다. "점주와 직원들이 바쁜 업무 중 일일이 주문을 확인하지 않아도 음성으로 내역 알림을 받기때문에 편리하고 시간도 절약된다"는 평이다.
카카오 음성 API를 이용해 도로명주소와 새 우편번호 등의 검색 정보를 제공하는 코리아크레딧뷰로는 "주소는 한글, 특수기호, 숫자 등의 조합이라 스마트폰 자판으로 입력하기 번거로워서 음성 검색 중심의 서비스를 기획했고, 카카오의 음성 API가 개방돼 있었기때문에 이 서비스를 실제 구현하는 것이 가능했다"고 밝혔다.
알람톡을 운영 중인 삼팔청춘 역시 "우수한 음성 기술을 모두에게 개방한 카카오의 노력 덕분에 스타트업들이 다양한 아이디어를 생각해 낼 수 있다. 음성을 이용해 알람을 끄는 알람톡의 기능도 카카오 음성 API 없이 자체 구축하기는 쉽지 않았을 것"이라고 설명했다.