로봇 실내 자율주행에 음성합성까지...KT AI 원팀 2번째 성과 냈다
2022-04-14 09:08
로봇 실내 공간지능 기술, 로봇 소셜 인터랙션 기술로 KT 로봇 개발 예정
보이스 클로닝 기술과 트랜스퍼 러닝 기술로 KT AI 서비스도 고도화
보이스 클로닝 기술과 트랜스퍼 러닝 기술로 KT AI 서비스도 고도화
인공지능(AI) 산·학·연 협의체인 'AI 원팀'이 두 번째 공동 연구개발(R&D) 성과를 공개했다. KT는 AI 서비스 등 산업 현장의 풍부한 데이터를 바로 연구기관에 제공할 수 있었기에 가능한 성과라고 평가했다. 공개한 4종의 AI 기술은 이른 시일 내로 KT AI 사업에 적용될 예정이다.
KT가 AI 원팀의 산학연 공동연구를 통해 4종의 AI 기술을 개발했다고 14일 밝혔다. 4종의 기술은 △로봇 실내 공간지능 △로봇 소셜 인터랙션(Social Interaction) △보이스 클로닝(Voice Cloning) △한국어 E2E 음성인식 트랜스퍼 러닝(Transfer learning) 등으로 구성되어 있으며, KT AI 사업 및 서비스에 활용할 예정이다.
AI 원팀은 지난 2020년 2월 출범 이후 40여명의 국내 AI 전문가 그룹인 'AI 구루(Guru) 그룹'을 구성해 현안 해결 프로세스 '라운드테이블'에서 기업의 난제 해결을 논의해왔다. 그 결과 산학연 공동 연구과제가 결정돼 지난 해 무빙 픽처, 딥러닝 음성합성 등 4개 기술을 개발해 공개한 바 있으며, 이번엔 4개 AI 기술을 추가로 개발하는 성과를 냈다.
이번에 개발한 로봇 실내 공간지능 기술은 KT와 명현 KAIST 교수가 함께 개발했으며, 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하는 기술이다. 로봇이 공간 내에서 특정 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하고, 실시간 업데이트를 할 수 있게 만든다. AI 원팀은 이 알고리즘을 바탕으로 실내 자율주행에 접목하는 2차년도 연구를 지속할 예정이며, KT의 로봇 실내 자율 주행 정밀도를 끌어올릴 계획이다.
'로봇 소셜 인터랙션(Robot Social Interaction)' 기술은 KT와 윤성의 KAIST 교수 연구진이 함께 개발했다. 사용자의 얼굴 및 행동을 인식한 후, 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
'보이스 클로닝(Voice Cloning)' 기술은 KT와 김회린 KAIST 교수가 공동 연구했다. 개인화 음성합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다. 연구진은 지난해 비용은 4분의 1 수준으로 줄이고, 속도는 10배 가량 향상 시키는 CPU 기반 음성합성 알고리즘 개발에 성공한 바 있다. 이번 연구에서는 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축한 것이다. KT는 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 '커스텀 개인화 TTS 서비스'를 상용화할 예정이다.
'한국어 End-to-End 음성인식 트랜스퍼 러닝(Transfer Learning)' 기술은 KT와 한양대 장준혁 교수가 개발했다. 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였다. 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 검증한 것이다. 또한 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다. KT는 이 기술을 활용해 KT의 AI 서비스를 고도화한다는 계획이다.
AI 원팀은 KT를 비롯해 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, 한진, KAIST, 한양대, 한국전자통신연구원(ETRI) 등 총 10개 산·학·연이 참여하고 있다.
특히 AI 원팀에선 KT, KAIST, 한양대, ETRI가 협력해 '초거대 AI'를 개발 중이다. 초거대 AI란 대용량의 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 인공지능을 의미한다. KT는 인간에 가깝게 구현된 초거대 AI를 기가지니와 AI CC등의 인공지능 고도화에 활용한다는 계획이며, 향후 2000억 파라미터 이상 모델로 점진적으로 확장할 예정이다. 나아가 초거대 AI 모델을 AI 원팀 참여기업의 다양한 산업분야에 활용하여 AI 혁신을 이끌 계획이다.
송재호 KT AI/DX융합사업부문장(부사장)은 "AI 연구 전문성을 갖고 있는 대학과 산업을 이끌고 있는 기업의 산학 연구는 AI 경쟁력을 강화하는 길"이라며 "올해도 AI원팀에서 연구기관, 기업, 스타트업 간의 협력을 통해 시너지를 내고 AI 국가 경쟁력을 높이도록 최선을 다하겠다"고 말했다.
KT가 AI 원팀의 산학연 공동연구를 통해 4종의 AI 기술을 개발했다고 14일 밝혔다. 4종의 기술은 △로봇 실내 공간지능 △로봇 소셜 인터랙션(Social Interaction) △보이스 클로닝(Voice Cloning) △한국어 E2E 음성인식 트랜스퍼 러닝(Transfer learning) 등으로 구성되어 있으며, KT AI 사업 및 서비스에 활용할 예정이다.
AI 원팀은 지난 2020년 2월 출범 이후 40여명의 국내 AI 전문가 그룹인 'AI 구루(Guru) 그룹'을 구성해 현안 해결 프로세스 '라운드테이블'에서 기업의 난제 해결을 논의해왔다. 그 결과 산학연 공동 연구과제가 결정돼 지난 해 무빙 픽처, 딥러닝 음성합성 등 4개 기술을 개발해 공개한 바 있으며, 이번엔 4개 AI 기술을 추가로 개발하는 성과를 냈다.
이번에 개발한 로봇 실내 공간지능 기술은 KT와 명현 KAIST 교수가 함께 개발했으며, 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하는 기술이다. 로봇이 공간 내에서 특정 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하고, 실시간 업데이트를 할 수 있게 만든다. AI 원팀은 이 알고리즘을 바탕으로 실내 자율주행에 접목하는 2차년도 연구를 지속할 예정이며, KT의 로봇 실내 자율 주행 정밀도를 끌어올릴 계획이다.
'로봇 소셜 인터랙션(Robot Social Interaction)' 기술은 KT와 윤성의 KAIST 교수 연구진이 함께 개발했다. 사용자의 얼굴 및 행동을 인식한 후, 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
'보이스 클로닝(Voice Cloning)' 기술은 KT와 김회린 KAIST 교수가 공동 연구했다. 개인화 음성합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다. 연구진은 지난해 비용은 4분의 1 수준으로 줄이고, 속도는 10배 가량 향상 시키는 CPU 기반 음성합성 알고리즘 개발에 성공한 바 있다. 이번 연구에서는 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축한 것이다. KT는 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 '커스텀 개인화 TTS 서비스'를 상용화할 예정이다.
'한국어 End-to-End 음성인식 트랜스퍼 러닝(Transfer Learning)' 기술은 KT와 한양대 장준혁 교수가 개발했다. 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였다. 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 검증한 것이다. 또한 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다. KT는 이 기술을 활용해 KT의 AI 서비스를 고도화한다는 계획이다.
AI 원팀은 KT를 비롯해 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, 한진, KAIST, 한양대, 한국전자통신연구원(ETRI) 등 총 10개 산·학·연이 참여하고 있다.
특히 AI 원팀에선 KT, KAIST, 한양대, ETRI가 협력해 '초거대 AI'를 개발 중이다. 초거대 AI란 대용량의 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 인공지능을 의미한다. KT는 인간에 가깝게 구현된 초거대 AI를 기가지니와 AI CC등의 인공지능 고도화에 활용한다는 계획이며, 향후 2000억 파라미터 이상 모델로 점진적으로 확장할 예정이다. 나아가 초거대 AI 모델을 AI 원팀 참여기업의 다양한 산업분야에 활용하여 AI 혁신을 이끌 계획이다.
송재호 KT AI/DX융합사업부문장(부사장)은 "AI 연구 전문성을 갖고 있는 대학과 산업을 이끌고 있는 기업의 산학 연구는 AI 경쟁력을 강화하는 길"이라며 "올해도 AI원팀에서 연구기관, 기업, 스타트업 간의 협력을 통해 시너지를 내고 AI 국가 경쟁력을 높이도록 최선을 다하겠다"고 말했다.