롯데정보통신, 정부 AI학습데이터 구축 참여…유통분야 응용서비스 발굴

2020-10-19 15:13
상품 이미지, 고객주문 질의응답 데이터셋 구축
비대면결제 지능화, 무인매장·T커머스 접목 계획
NHN·비디·테스트웍스·슈퍼브에이아이도 수행중

과학기술정보통신부가 한국정보화진흥원(NIA)을 통해 추진하는 인공지능(AI) 학습용 데이터 구축사업에 롯데정보통신이 참여한다. 앞서 AI 학습용 데이터 구축사업에 참여해 분야별 과제를 수행 중인 곳으로 NHN, 비디, 테스트웍스, 슈퍼브에이아이 등이 알려져 있었다.

롯데정보통신은 NIA의 AI 학습용 데이터 구축사업 가운데 '상품이미지 구축 및 고객주문 질의응답 AI 데이터 구축' 과제를 총괄하며 이를 위해 1만여개 상품 이미지 데이터 및 질의응답 텍스트 데이터셋을 구축할 예정이라고 19일 밝혔다.

롯데정보통신에 따르면 이 과제로 구축되는 학습 데이터와 편집도구를 활용해 누구나 AI 응용 서비스를 개발할 수 있게 된다. 이걸로 코로나19로 매장에서 사용이 증가하고 있는 키오스크·셀프결제 시스템을 지능화할 수도 있다.

롯데정보통신은 정보기술연구소를 주축으로 지속적인 연구개발을 통해 딥러닝 기반 상품인식·음성인식 엔진 기술력을 확보해 왔다고 강조했다. 이를 통해 고품질 AI 학습 데이터를 구축할 수 있을 것이라고 기대 중이다. 영상, 음성인식 기술을 고도화해 무인매장, T커머스(홈쇼핑) 등 유통분야 응용서비스를 개발하고 비대면 무인상점에 접목할 서비스를 발굴할 계획이다.
 

마용득 롯데정보통신 대표.[사진=롯데정보통신 제공]


마용득 롯데정보통신 대표는 "당사가 보유한 역량과 AI 전문기업의 경험을 기반으로 차별화된 데이터를 구축하고, AI 데이터 생태계 조성은 물론 AI 산업 발전에 앞장서나갈 것"이라고 말했다.
 
NHN, AI스피커·음성채팅으로 노인계층·소아 음성대화DB구축

NHN은 지난 6일 AI 학습용 데이터 구축사업 가운데 자유대화 분야 과제 수행을 맡았다고 밝혔다. NHN, NHN다이퀘스트, NHN에듀, 크라우드웍스, 아임클라우드, 셀바스AI, 원더풀플랫폼, 잉글리시헌트, EBS 등이 함께 자유대화 분야 과제를 수행하고 서강대, 성균관대, 건국대, 한국외대 등이 구축된 데이터의 실제 연구를 진행한다.

NHN은 국내에 부족한 노인계층·소아 등의 음성대화DB와 학습데이터를 확보해 필요한 곳에 활용되도록 기여할 계획이다. 크라우드소싱 기반 AI데이터 구축을 통해 기초생활수급자, 자립아동, 독거노인 등 사회적배려대상자 6000여명을 모집한다. 구축된 데이터는 AI허브를 통해 공개하고 연구기간 중 해커톤 등을 개최해 학습데이터 활용 활성화를 도모한다.

AI 및 자연어처리 기술 노하우를 바탕으로 데이터 수집, 가공, 검수, 학습, 유효성 검사 관리 시스템 개발 등 과정을 지원한다. AI 스피커, 음성 기반 채팅서비스 등 방식으로 데이터를 수집하고 EBS 교육채널, NHN에듀 교육서비스 채널 등을 활용해 테스터 및 DB를 확충할 예정이다.

국내 대표 바둑AI '한돌'을 개발한 박근한 NHN기술연구센터장이 프로젝트를 총괄한다. 박근한 센터장은 "자유대화분야 AI 연구를 통해 한국어 음성인식품질을 높이고 자연어처리분야 발전에 기여해나갈 것"이라며 "이번 연구로 구축된 정보가 다양한 곳에 적극적으로 활용되길 희망한다"고 말했다.
 
SKT '누구' 플랫폼 구축한 비디, 의료진·환자 음성 데이터 구축

ICT융합서비스 개발업체 비디(구 '블루다임')는 지난달 21일 '명령어 AI 데이터' 지정과제와 자유공모 분야에 제안한 '의료진 및 환자 음성AI 데이터 구축' 과제 수행사로 선정됐다고 밝혔다. 비디는 SK텔레콤 '누구(NUGU)' 서비스플랫폼 구축 경험이 있는 회사다.

명령어 AI 데이터 과제는 일반·노인·소아 남녀 대상 정형·비정형 명령어 데이터와 차량 내 대화 및 명령어 데이터를 구축하는 과제다. 비디를 중심으로 차량음성플랫폼 분야 경험을 보유한 미디어젠, 크라우드소싱 플랫폼을 보유한 메트릭스리서치와 셀렉트스타가 참여한다. 데이터검증 및 학술연구를 위해 세종대 산학협력단도 컨소시엄에 참여했다.

의료진 및 환자 음성 AI데이터 구축 과제는 비대면 진료 기반이 될 의료진과 환자간 대화 데이터 구축이 목적이다. 미디어젠이 이 과제 주관을 맡고 비디와 메트릭스리서치가 참여한다. 의료진 데이터 수집과 시나리오 검증을 위해 고려대 산학협력단이 컨소시엄에 참여한다.

당시 독고세준 비디 대표는 "이번 사업은 미디어젠과 업무제휴를 맺은지 2개월만에 이뤄낸 결과"라며 "의미있는 사업에 함께할 수 있어 기쁘다"고 말했다.
 
테스트웍스, 신문기사·블로그포스팅 품질측정 데이터 구축

소프트웨어 테스트 및 AI 데이터 수집·가공 전문기업 테스트웍스는 지난 8월 27일 자사가 '문서요약 텍스트 AI 데이터' 과제 참여사로 선정됐으며 이 프로젝트에 참여할 일반인을 공개 모집한다고 밝혔다. 테스트웍스는 사업 주관사 비플라이소프트, WIGO, 에이아이닷엠, 고려대학교 산학협력단과 함께 과제를 수행한다.

문서요약 텍스트 AI 데이터 과제는 AI 요약기술 경쟁력을 확보하고 한국어 요약 데이터 및 모델을 활용하기 위한 검증된 한국어 텍스트 요약 데이터를 확보하는 것을 목표로 한다. 다양한 한국어 원문 데이터의 텍스트 요약·가공에 관심이 있는 주부, 대학생, 일반인을 모집해 AI 개발에 필요한 양질의 데이터를 구축한다는 계획이다.

테스트웍스는 자사 크라우드소싱 플랫폼 '에이아이웍스(aiworks)'를 통해 문서요약 텍스트 AI 데이터 프로젝트를 진행한다. 참여자들은 이 서비스에 회원가입 후 신문기사를 읽고 핵심 문장 3개를 표시한 뒤 한 문장으로 요약하는 방식으로 작업을 수행해 현금 포인트를 보상으로 받을 수 있다. 보상은 건당 500원이며 최대 200만원까지 지급된다.

윤석원 테스트웍스 대표는 "이 프로젝트는 문서요약 AI 모델을 활용해 제품 리뷰 요약, 양산형 기사 품질 측정, 가짜 블로그 포스트 필터링, 커뮤니티 포스트 요약 등 다양한 서비스로 확장할 수 있는 사업"이라고 말했다.
 
슈퍼브에이아이, 위성영상판독·운동자세인식 데이터 구축 참여

AI 데이터플랫폼 업체 슈퍼브에이아이는 자사와 데이터연구소가 AI 학습용 데이터 구축 사업 자유공모 과제에 각각 선정됐다고 지난 6월 24일 밝혔다.

슈퍼브에이아이는 '위성영상 개체 판독 AI 데이터 구축' 사업을 한국항공우주연구원 및 쎄트렉아이애널리틱스(SI Analytics)와 함께 수행한다. 수행 결과 만들어지는 데이터셋은 위성을 활용한 항공우주산업 AI 기술 개발에 활용될 예정이다. 위성영상에 노출되는 사물, 지형, 기후를 탐지해 국내 위성정보 활용산업을 발전시킨다는 구상이다.

슈퍼브에이아이 데이터연구소는 'AI기반 피트니스평가 AI데이터셋 구축' 사업을 슬릭코퍼레이션과 함께 수행한다. 이 데이터가 구축되면 체형이 다양한 사람들이 헬스장이나 집에서 영상으로 자신의 동작을 확인하고 운동효과를 높이는 코칭 AI를 구현할 수 있을 것으로 기대된다.

두 과제 모두 슈퍼브에이아이 머신러닝데이터플랫폼 스위트(Suite)를 활용한 데이터 구축, 가공, 분석이 진행된다. 김현수 슈퍼브에이아이 대표는 "구축된 데이터셋은 AI 개발에 바로 쓰일 수 있는 우수한 품질을 갖추게 될 것"이라고 말했다.