[곽재원의 Now&Future] '데이터 강국'의 길 …AI 전략에 있다

2023-03-29 06:00

 

[곽재원 논설위원장]



요즘 AI(인공지능)가 만병통치약(panacea)처럼 전 세계에 걸쳐 맹위를 떨치고 있다. AI는 여러 차례 붐을 거쳐 비약적인 발전을 이뤄왔지만 이번에는 마치 절정에 이르는 듯한 폭발적 기대를 뿜어내고 있다.
1956~1960년대 제1차 AI붐은 미국에서 열린 연구자들 회의에서 ‘인공지능’ 개념이 등장하며 시작됐다. 1980년대 제2차 AI붐에선 지식을 겸비해 전문가처럼 행동하는 AI 개발이 성행했다. 제3차 AI붐은 심층학습 혁신, 데이터 증가, 계산능력 확대를 특징으로 2010년대에 나타났다. 영상과 음성의 인식 정확도가 비약적으로 높아졌다. 2020년대 들어서면서 새로운 진화의 단계에 진입한다. 2020년 인간과 같이 문장을 쓰는 ‘GPT-3’가 등장했다. 2022년 문장을 기반으로 정교한 그림을 그리는 AI가 속속 출현했다. 드디어 올해는 ‘챗GPT’ 등 대화 AI의 도입이 본격화하면서 인간의 커뮤니케이션과 창조력을 변혁시키고 있다.

이렇게 보면 현대인의 삶은 AI에 많은 힘을 얻고 있다 해도 과언이 아니다. 시리와 알렉사 등 음성인식 AI를 사용해 검색과 주문을 하는 사람이 많은 것은 그 징표 중 하나다. 최근 등장한 미국 오픈AI의 ‘챗GPT’는 보통 인간이 대답하듯 자연스럽게 복잡한 질문에도 답할 수 있을 정도다. AI가 사회에 널리 침투한 배경에는 사진, 음성, 글 등 다양한 빅데이터가 사용 가능해진 데 있다. 게다가 그것을 분석하는 기계학습(특히 심층학습)의 기술 진보로 음성 데이터를 통해 질문에 대한 대답을 예상하거나 화상 데이터를 통해 적절한 행동을 예측하는 정밀도가 현격히 높아졌다.

예컨대 비즈니스, 특히 마케팅 세계에서도 빅데이터와 AI가 주목받고 있다. 마케팅 업무에서 관심 있는 예측 대상은 고객의 행동과 그 배후에 있는 동기일 것이다. 미국 경영학자 필립 코틀러는 마케팅이란 사람들과 사회의 요구를 특정하고 이를 충족시키는 것이라고 지적했다. 고객의 행동을 이해하고 예측하는 것은 마케팅의 핵심이다. 빅 데이터와 AI를 통한 고객 행동 예측이 마케팅에서 사용되는 사례로는 넷플릭스 추천 엔진이 있다. 고객이 과거 열람한 동영상을 바탕으로 아직 열람하지 않은 동영상 중 어떤 것을 좋아할 것인지 예측해 추천 형태로 표시하고 있다. 전자상거래(EC) 기업도 고객의 과거 행동 데이터를 토대로 쿠폰 등 마케팅 시책을 결정하고 있다. 이들은 데이터를 이용해 어떤 고객에게 어떻게 접근할지 결정하는 좋은 예다. 민간 쪽에서 불던 이러한 바람은 이제 공공부문으로 불기 시작했다.
 
기업에서 정부에 이르기까지 데이터 분석의 영역이 넓어지고 있는 것이다. 민간과 정부 부문의 데이터를 적절히 분석하면 친숙한 문제에서 의외의 해결책을 찾을 수 있으며, 산업정책 등 큰 과제에도 통찰을 제공할 수 있다. 최근 진보가 현저한 데이터 분석을 보다 효과적으로 하기 위한 많은 연구들이 이뤄지고 있다. 정부의 일기예보와 꽃가루 알레르기 경보 발령, 병원 치료와 입원자 통계의 연관성을 분석해 사회적 비용을 줄이려는 연구는 정부 통계를 적극 활용하는 사례다.

일본 도쿄대는 민간 데이터를 분석해 산업정책에 활용하는 사례를 연구하고 있다. 이 연구는 AI의 진보·보급이 노동시장에 미치는 영향에 주목하고 있다. 기존 연구들은 어떤 작업이 AI로 대체되기 쉬운지 가늠하고 AI가 어떤 일자리를 빼앗을지 예측해왔다. 그러나 실제로 AI가 직장에 도입됐을 때 노동생산성에 미치는 영향은 잘 알려지지 않았다. 개별 근로자가 AI를 어떻게 이용하는지에 대한 자세한 미시(微視) 데이터를 입수하기 어렵기 때문이다.

도쿄대 연구팀은 ‘AI 이용이 근로자 생산성에 어떤 영향을 주는지’에 대해 택시기사들에게 주목하고 분석했다. 배차 앱을 운영하는 회사에서 익명화된 운전자 주행 이력 데이터를 제공받았다. AI는 승객이 있을 확률이 높은 지역으로 운전자를 유도하는 이 회사의 기술이다. 과거 수요 패턴에서 미래 수요를 기계학습으로 예측하는 기술로 실무 세계에서 폭넓게 응용되는 전형적인 수요예측 AI다. 이를 통해 공차 시간이 운전자의 총 근로시간에서 차지하는 비율을 낮춰 생산성 향상으로 연결했다. 리스킬링(재교육) 관점에서도 현시점에서는 어렵다고 생각되는 소셜 스킬(사회 속에서 타인과 양호한 관계를 구축하는 힘)도 AI가 향후 한층 중요한 역할을 할 가능성을 시사하고 있다.

민관 데이터를 이용한 분석 결과가 정책 결정과 기업 경영에 도움이 될 가능성은 충분하다. 이 연구팀은 현재 데이터 분석으로 얻은 ‘실증 결과에 근거한 정책 형성(EBPM)’을 침투시키는 데 초점을 맞추고 있다.
시게오카 히토시(重岡仁) 도쿄대 교수는 “행정데이터는 ‘국민의 공유재산’이라는 인식을 가져야 한다”며 “AI 도입에 의한 생산성 향상 효과를 한층 주목할 필요가 있다”고 강조했다.
그는 이와 관련해 그는 두 가지 포인트를 지적했다. 하나는 연구자(분석)와 정부(정책)를 잇는 인재 육성이다. 분석상의 가정과 전제조건을 올바르게 인식하고, 연구 성과를 정책에 적절히 반영할 수 있는 인재가 행정기관에 많이 포진하는 것이 바람직하다는 것이다. 다른 하나는 데이터의 정비·개선이다. 그는 데이터 분석에서 연구자를 ‘셰프’, 데이터를 ‘식자재’로 비유한다. 셰프의 솜씨도 중요하지만 식재료의 질 향상이 더 좋은 ‘요리(=에비던스)'를 만들어내는 비결이라는 설명이다.

그는 데이터의 질과 양에서 일본은 한참 뒤졌으며 코로나19 사태는 그 사실을 여실히 드러냈다고 강조했다. 뿐만 아니라 정부 통계에 대한 이용 신청 후 데이터 입수까지 1년 이상 걸리는 경우도 많아 접근의 어려움이 시기적절한 연구를 저해하고 있다고 그는 지적했다.

이 점에서 앞서 가고 있는 북유럽 국가에서는 세무와 사회보험 등 업무에서 수집하는 행정데이터의 이용을 연구하고 있다. 사생활 보호를 고려해 출생 시 체중에서부터 학교 성적, 병원 입원 이력과 약 처방 이력, 과세 수입, 연금액에 이르기까지 모든 정보들이 개인식별번호로 묶여 있어 연구자들은 이 데이터 분석을 통해 정책 형성에 도움을 주고 있다.

일본 여당인 자민당은 지난해 11월 대화 AI 챗GPT의 등장을 계기로 대화 AI를 정부와 지자체 등 행정에 활용하는 방안을 최근 제안했다. 답변 작성을 지원하고 주민들의 문의에 대응하기 위한 것이다. 이 밖에 지식과 문장 요약, 조사 작업, 프로그래밍 등도 대상이다. 업무를 효율화해 생산성을 높이는 것을 목표로 한다. 자민당 디지털사회추진본부는 이를 실행하기 위한 프로젝트 팀을 가동하고 있다. 지난 2월부터 디지털청 등 관계 부처는 물론 전문가, IT 관련 기업이 참가해 논의를 거듭해 왔다.

챗GPT의 등장으로 그동안 불가능했던 전문적인 업무를 대행할 수 있는 툴이 많이 탄생할 전망이다. 정부와 의회는 디지털 트랜스포메이션(DX)을 본격적으로 진행할 것으로 예상된다. 그러나 문제가 없는 것은 아니다. 행정 서비스는 효율뿐만 아니라 정확성이 요구되기 때문이다. 행정의 잘못으로 주민에게 손해가 생기면 소송 대상이 될 수도 있다. 대화 AI의 답변으로 기밀정보가 유출될 우려도 따라 다닌다. 그 원인으로 학습 데이터가 편중되거나 사용하는 데이터의 질이 떨어지는 것을 꼽을 수 있다. 그렇더라도 리스크를 두려워해 새로운 AI 도입을 피하면 ‘성장의 기회도 물거품이 된다’. 자민당은 의회와 정부, 그리고 기업들에 이 같은 사실을 주지시키고 있다. 자민당이 작년 ‘Web3’에 이어 이번에 대화 AI 활용을 제안함으로써 정부 내에서 AI 활용을 위한 검토를 가속화할 것으로 보인다.

대화 AI를 이용하기 위해서는 기밀 유지와 안전 대책 등 환경 정비가 필요하지만 세계 각국은 아직 탐색 단계에 머물고 있다. AI 활용에서 리스크 관리는 국제표준화기구(ISO)와 미국 NIST(국립표준기술연구소)에서 관련 규격으로 대응하고 있지만 기술이 빠른 속도로 발전하고 있어 새로운 규격 개발이 필요한 실정이다. 우리나라의 민관 데이터 개방과 정부의 AI 전략 수준은 어느 정도일까?

정부는 공공데이터법 제정 10년을 맞아 데이터 생성부터 활용까지 생태계 전반을 활성화하고 ‘디지털플랫폼정부’라는 국정 전략에 맞춰 공공데이터법을 전면 개정한다고 한다. 공공데이터와 데이터 기반 행정 등 공공데이터 총괄·협력을 위한 추진 체계를 강화한다. 공공데이터 개방으로 3년 이내에 범정부적 디지털플랫폼정부의 틀을 갖출 계획이다. 데이터 개방과 공유로 국민 신뢰도를 높이고, 기업 생태계를 지원하며, 정부 업무에 투명성과 효율성을 높인다는 구상이다.

정부는 지난 10년간 1000여 개 행정·공공기관에서 공공데이터 7만4229개를 개방했다. 혁신성장과 사회적 가치 실현을 지원하는 국가중점데이터 168개 분야를 개방했다. 공공데이터포털에서 데이터 민간 이용은 4393만건을 돌파했다. 지난해 10월 초 기준 공공데이터를 활용한 모바일 앱 등 민간 서비스 개발은 2797건에 달했다.

조만간 디지털플랫폼정부가 본격 가동될 것이다. 먼저 데이터 이용 절차 간소화 등 정부 통계를 최대한 이용할 수 있도록 하는 환경 정비가 필수다. 기술적인 안전성을 확보한 후 정부 통계와 행정데이터를 ‘국민의 공유재산’으로 제공하는 이점을 사람들이 널리 실감할 수 있도록 해야 한다. 연구자들이 질 높은 실증 연구를 꾸준히 계속하는 것도 중요하다.

이러한 데이터 개방 환경 속에서 정부가 솔선수범해 AI 활용을 추진함으로써 환경 정비를 꾀하고 안전 확보를 위한 규칙을 제정해야 한다. 그래야만 민간에서도 대화 AI 활용이 촉진되고 인재 육성으로 연결될 것이다.

이제 세계는 데이터 선진국과 후진국, 데이터 강대국과 약소국으로 구별되는 시대를 맞고 있다. 새로운 글로벌 질서가 생겨난다. 우리도 예외 없이 그 기로에 서 있다. AI 전략이 데이터 경제 시대의 성패를 좌우한다는 점을 명심해야 한다. 한국은 이런 AI 전략을 바탕으로 데이터 강국 대열에 반드시 진입해야 한다.  


곽재원 필자 주요 이력 

▷전 중앙일보 경제부국장, 도쿄특파원 ▷전 서울대 공과대학 초빙교수 ▷전 한양대 기술경영학 석좌교수 ▷전 경기도 경기과학기술진흥원 원장 ▷현 가천대·호서대 초빙교수 ▷현 아주경제 논설위원장