과기부 AI 학습데이터 310종 구축 시작…한국어·자율주행 등에 5800억 투자

2022-01-21 09:53

[사진=아주경제 DB]


과학기술정보통신부가 2022년 인공지능(AI) 학습용 데이터 310종 구축을 시작했다. 오는 3월까지 한국어, 영상·이미지, 교통·물류, 헬스케어, 재난·안전·환경, 농·축·수산, 스포츠, 교육, 로보틱스, 금융, 지식재산 분야를 아우르는 데이터 120종을 구축하는 1차 사업 등 '지정과제(250종)'와 '지역·자유과제(60종)' 공모가 순차 진행된다.

과기정통부는 21일부터 5797억원을 투자하는 2022년도 AI 학습용 데이터 구축사업 공모를 시작한다고 밝혔다. 이 사업은 기업, 연구자, 개인이 시간과 비용의 문제로 구축하기 어려운 AI 학습용 데이터를 정부 과제 형태로 대규모로 구축해 'AI허브'를 통해 개방하는 사업이다. 한국지능정보사회진흥원에 따르면 AI 학습용 데이터 구축 과정은 AI 개발 프로젝트의 80%를 차지한다.

오는 2월 공고되는 지역과제 분야는 30종으로 전년 대비 10종이 늘었다. 이는 지자체와 지역소재 기업의 참여 활성화로 AI의 지역 확산을 촉진하기 위해서다. 오는 3월 공고되는 자유과제 분야는 기존 주제 제안형 과제 10종 외에도 앞서 AI허브에 개방된 데이터를 보완하고 환류(데이터를 서비스 개발에 활용하면서 수집된 새 데이터를 다시 개방)하는 과제 유형이 시범적으로 포함된다.

과기정통부는 지난 2017~2021년 한국어(음성·자연어), 영상·이미지, 헬스케어, 교통·물류 등의 분야에서 총 381종의 데이터를 구축했다. 2021년 6월까지 앞서 구축한 데이터 191종을 개방했고, 2021년에 구축한 데이터 190종은 품질 검증 후 2022년 상반기 중 개방할 예정이다.