390억 규모 AI 학습용 데이터 20종 선정... 과기정통부, 디지털 뉴딜 핵심 '데이터 댐' 구축 나선다

강일용 기자 2020-06-21 12:00

올해 추경예산 2925억원 활용해 총 150종 AI 학습용 데이터 추가 구축 계획

과학기술정보통신부가 인공지능(AI) 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축 사업' 관련 20개 과제를 확정했다고 21일 밝혔다.

과기정통부는 △사람의 감성과 문맥을 이해할 수 있는 자연어 처리 분야 △자동차, 드론 등 자율주행기술 분야 △음성, 시각, 언어 등 융합 분야와 같이 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 우선 선정했다.

또한 국민편의를 향상하고 사회적 문제를 해결하기 위해 △질병진단(치매, 구강질병 등), 운동 등 헬스케어 분야 △사람의 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야 △장애인의 삶을 향상할 수 있는 분야도 함께 과제로 선정했다.

[사진=과학기술정보통신부 제공]

올해는 작년보다 예산과 과제를 2배 늘린 20개 과제(10개 지정공모, 10개 자유공모)를 선정했으며, 예산은 작년의 2배인 총 390억원을 책정했다. 총 92개 사업자가 참여를 희망해 평균 4.6대 1의 경쟁률을 보였다.

또한 과기정통부는 누구나 참여해 AI 데이터를 가공할 수 있는 크라우드소싱 방식을 도입, 인력 부족 문제를 해결하면서 양질의 데이터와 일자리를 창출할 계획이다

AI 학습용 데이터를 수집하고 가공하는 데 많은 인력이 필요하다. 이에 과기정통부는 '데이터라벨링' 사업을 추진해 청년, 취업준비생, 경력단절여성, 장애인 등에게 많은 일자리를 제공하고, 데이터 가공 전문성을 쌓을 기회를 제공할 계획이다. 이를 통해 10억당 200명의 일자리 창출 효과가 발생할 것으로 기대 중이다.

아울러 과기정통부는 2020년 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위한 AI 학습용 데이터 구축 사업을 확대 추진할 계획이다. 이를 통해 총 150개 종류의 AI 학습용 데이터를 구축하고, 이를 AI 통합 지원 플랫폼인 'AI 허브'를 통해 무료 개방할 계획이다.

과기정통부 관계자는 "중소기업과 스타트업이 비용부담과 인력부족 때문에 AI 모델 개발에 필요한 AI 학습용 데이터를 직접 확보하는 데 어려움이 많다. 시장에서 요구하는 양질의 AI 학습용 데이터를 많이 확보하는 것이 우리나라 AI 경쟁력을 단기간에 끌어 올릴 수 있는 해결책이 될 것"이라고 강조했다.

이어 "이번 추경을 통해 AI 학습용 데이터를 대규모로 확대·구축해 이를 '데이터 댐'에 모으고, 다양한 AI 기술연구, 상용화 서비스 개발에 활용할 수 있도록 지원하겠다. 양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것으로 기대한다"고 밝혔다.