네이버, 외국인 韓 발음 데이터 수집…과기정통부 'AI 데이터 구축사업' 참여

2022-04-01 18:12
  • 글자크기 설정

4000시간 분량의 데이터 수집 계획…언어 교육용 데이터셋 구축 목표

[사진=네이버]


네이버 웨일은 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 진행하는 '인공지능(AI) 학습용 데이터 구축 지원사업'에 참여한다고 1일 밝혔다.

해당 사업은 정부의 디지털 뉴딜 사업 중 데이터 댐 프로젝트의 일환이다. 네이버 웨일은 엔에스데블과 서울대학교, 한국음성학회 등 총 8개 기업·기관으로 이뤄진 엔에스데블 컨소시엄에 구성사로 참여하게 된다.

컨소시엄은 언어교육용 데이터셋을 구축하며, 외국인이 발음하는 한국어 음성 데이터를 수집하고 가공한다. 이날 1일부터 오는 11월 30일까지 사업 기간동안 4000시간 분량의 발음 데이터를 확보하고, 이를 AI 학습에 적합한 형식으로 다듬는다.

이번 사업을 통해 생성된 데이터셋은 향후 국내 여러 한국어 교육평가 솔루션이 개발·고도화 되는 과정에 쓰일 전망이다. 네이버는 외국인의 발음 체계를 고려한 맞춤형 교육자료가 부족하다는 점을 고려, 이를 해결하기 위한 계획을 수립했다고 설명했다.

네이버는 웨일 스페이스 플랫폼과 웨일북을 통해, 데이터를 편리하게 수집·관리 할 수 있는 환경을 조성한다. 웨일 스페이스는 각종 프로그램을 웹에 모아두고, 로그인만 하면 어디서나 프로그램을 활용해 업무를 진행할 수 있게 돕는 플랫폼이다. 관리자는 구성원 별로 사용 가능한 프로그램의 종류나 권한 등을 설정할 수 있다.

외국인의 한국어 발음 소리는 웨일북을 활용해 녹음된다. 웨일 스페이스로 현재 사용 중인 웨일북을 일괄 제어하고, 각 웨일북에서 생성되는 데이터도 통합 관리할 수 있다. 웨일북으로 접근하는 프로그램과 인터넷 환경도 관리할 수 있어, 보안상 안전한 환경을 조성할 수 있다는 설명이다.

김효 네이버 웨일 책임리더는 "국내 AI 기술의 역량 증진과 경쟁력 강화를 위한 사업에 참여할 수 있어 기쁘다"면서 "웨일의 웹 기술력은 분야를 가리지 않고 다양한 환경에 적용될 수 있는 범용성이 특장점이며, 이를 바탕으로 활용처의 폭을 넓혀 나갈 것"이라고 말했다.

한편, 네이버 웨일과 엔에스데블은 지난 1월, KMA한국능률협회와 함께 온라인 기반 교육환경 고도화를 목표로 3자 업무협약을 체결한 바 있다.


©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기