과학기술정보통신부가 2022년 인공지능(AI) 학습용 데이터 310종 구축을 시작했다. 오는 3월까지 한국어, 영상·이미지, 교통·물류, 헬스케어, 재난·안전·환경, 농·축·수산, 스포츠, 교육, 로보틱스, 금융, 지식재산 분야를 아우르는 데이터 120종을 구축하는 1차 사업 등 '지정과제(250종)'와 '지역·자유과제(60종)' 공모가 순차 진행된다.
과기정통부는 21일부터 5797억원을 투자하는 2022년도 AI 학습용 데이터 구축사업 공모를 시작한다고 밝혔다. 이 사업은 기업, 연구자, 개인이 시간과 비용의 문제로 구축하기 어려운 AI 학습용 데이터를 정부 과제 형태로 대규모로 구축해 'AI허브'를 통해 개방하는 사업이다. 한국지능정보사회진흥원에 따르면 AI 학습용 데이터 구축 과정은 AI 개발 프로젝트의 80%를 차지한다.
과기정통부는 지난 2017~2021년 한국어(음성·자연어), 영상·이미지, 헬스케어, 교통·물류 등의 분야에서 총 381종의 데이터를 구축했다. 2021년 6월까지 앞서 구축한 데이터 191종을 개방했고, 2021년에 구축한 데이터 190종은 품질 검증 후 2022년 상반기 중 개방할 예정이다.