​가상 인플루언서 '로지' 목소리 생겼다...라디오 생방송에서 첫 공개

2022-05-06 10:44
AI 통해 음성 합성...사전 녹음 없이도 자연스러운 대화 가능
소셜 미디어 넘어 라이브 커머스, 도슨트, 행사 사회자로도 활동 기대

디지털 휴먼 인플루언서 로지[사진=네이버]

네이버가 디지털 휴먼 인플루언서 '로지'의 목소리를 인공지능(AI)으로 만들었다고 6일 밝혔다. 목소리는 오는 8일 방송되는 SBS 파워FM '두시탈출 컬투쇼'에서 공개된다.

로지는 이날 방송에 특별 게스트로 출연해 DJ 김태균과 인플루언서로서의 활동에 대한 이야기를 나누고, 청취자 사연도 직접 읽을 계획이다.

목소리는 네이버 클로바에서 자체 개발한 NES(Natural End–to-end Speech Synthesis) 기술로 제작했다. 40분 수준의 짧은 녹음만으로 사람에 가까운 자연스러운 목소리를 구현할 수 있다는 설명이다. MZ세대에 적합한 목소리를 싸이더스 스튜디오 엑스가 선택하고, 네이버는 이를 NES 기술을 활용해 AI 목소리로 제작했다.

사전 녹음 없이도 AI를 통해 생성한 음성으로 자유롭게 소통할 수 있는 것이 장점이다. 이에 따라 소셜 미디어 활동, 광고 등에 주력했던 로지의 활동 영역도 한층 넓어질 전망이다. 라디오 DJ뿐만 아니라, 도슨트, 사회자, 라이브 커머스 진행자 등 목소리를 필요로 하는 다양한 영역에서의 활동이 가능할 것으로 보인다.

네이버는 AI 음성합성을 통해 동영상을 더빙할 수 있는 '클로바더빙'을 통해 관련 기술을 선보이고 있다. 클로바더빙에서는 다양한 성별, 연령대, 스타일의 105개 보이스를 자유롭게 사용할 수 있으며, 영어, 일본어, 중국어, 스페인어 등 외국어 목소리도 제공된다.

또, 네이버는 누구나 자신의 목소리로 손쉽게 개성 있는 AI 목소리를 제작할 수 있는 '보이스메이커' 서비스도 지난해 11월 시범 서비스로 개설했다.

김재민 네이버 클로바 보이스 책임리더는 "버추얼 인플루언서 로지의 목소리를 클로바 AI 기술로 제작하게 돼 의미가 깊다"며 "네이버는 로지와의 협업을 활발히 이어가는 한편, '클로바 AI 보이스'의 활용 범위를 계속해서 넓혀나갈 것"이라고 말했다.