[문송천의 디지털 산책] AI가 국회의원을 대체할 수 있을까?

2024-05-10 06:00

[문송천 카이스트 경영대학원 교수]


AI 기술의 등장으로 긴장하는 이들이 많다. 예를 들면 직장에서 다른 이가 아닌 바로 내가 하는 일을 AI가 대체하는 날에는 내 자리가 위협받을 것 아닌가 하는 두려움 같은 것이다. 그런데 AI가 영상 분석처럼 또는 이미 나와 있는 숫자를 기반으로 한 업무, 즉 회계 분석에서는 역할을 할 가능성은 제법 크지만 기업 업무의 기타 부문에서는 역할을 하기 힘들다. 즉 고객 응대 업무, 민원 처리 업무, 생산 업무, 매출 매입 등 영업 업무라든가 마케팅, 기획 전략 분야에서는 기존 회사 내 데이터가 AI에게 유용하게 사용되기에는 부적합하기 때문에 AI를 도입해 쓴들 효험을 보기는 어렵다. 부적격 이유는 데이터 품질 수준이 조악한 탓이다. 설마 우리는 그렇지 않겠지 하고 생각할 수도 있으나 실은 데이터 품질 면에서 합격권에 들 회사는 거의 없다고 봐야 한다. 전국 대규모 행정전산망 먹통 사태도 결국은 데이터 품질 문제로 야기됐다고 보는 게 전문가들의 견해다. 정부측에서는 그걸 인정하지 않은 채 하드웨어 쪽 문제로 종결 지은 바 있지만 정부 발표를 액면 그대로 받아들이는 국민들조차 몇 안된다. 공공 부문 데이터 품질 저하 문제는 어제 오늘 일이 아니다. 전문가 평가에 의하면 공공 데이터 전체의 절반이나 쓸모없는, 즉 쓸데없는 것으로 판명됐을 정도다. 그런 현실을 애써 외면하는 정부가 품질 개선을 오히려 저해하는 역할을 하고 있는 것은 아닐까.

AI의 위용에 감탄사를 연발하는 일은 그런 수준급 품질 좋은 데이터가 AI의 먹이가 됐을 경우에 국한된다. 사실상 쓸모있는 데이터들은 지금도 AI가 거의 다 채집하여 갖다 쓰고 있다. 현재 AI가 가져다 쓰는 데이터의 무려 절반이나 오프라인 신문 기사라는 점도 밝혀졌다 (워싱턴 포스트 2023 4월 19일자). 왜 그럴까. 지면 신문은 문법에 맞는 완벽한 문장을 구사하는 까닭에 데이터 품질 면에서 합격권이기 때문이다. 기사 출고 전 수없이 거치는 치열한 교정 작업 과정을 생각해보라. 언론 매체들이 주장하는 기사 저작권 문제가 1년이 넘도록 해결 기미를 보이지 않자 세계 유수 언론 매체들이 지난달 오픈AI 사를 법정 고소하기에 이르렀다(뉴욕 타임스 2024년 4월 20일자). 그러나 직장 내 문서는 문장을 정교하게 다듬지 못한 채 늘 급하게 만들어진다. 그러나 다른 분야에서는 시간 탓과 더불어 소위 ‘왕따’ 당하기 쉬운 관행 탓으로 그게 지켜지기 매우 힘들다. 따라서 양질의 문서로서는 거의 모두 결격이다. 그런 조악한 상태로 조직 내외부로 유통되는 바람에 품질 저하가 연쇄적으로 이리저리 전파되는 악순환의 고리를 낳는다. 특히 국내에서는 국문법을 자의적으로 구사하는 문장들이 조직 문서 내에 즐비하게 내재돼 있어 그걸 정제과정 없이 있는 그대로 AI 학습 대상을 삼았다간 환각현상이 심각하게 나타날 수밖에 없다. 인체에 비유하면 마치 체지방률처럼 데이터 비만도가 너무 높아 데이터를 섭취하며 돌아가는 기업 정보시스템이 언제 돌연 쓰러질지 모를 정도다. 국가 시스템들이 아슬아슬 위태롭게 돌아가고 있다는 방증이다. 현행 데이터 비만도는 무려 65%에 달한다. 그걸 15% 선으로 대폭 낮추기 전에는 행망 마비 사태 같은 종류의 사건사고는 또다시 불쑥 터지게 되어 있다고 해도 과언이 아니다. 기계는 65%에서 단 1%도 줄여주지 못한다.

비만도를 줄여 데이터품질을 개선하는 것은 인간 고유의 권한이자 영역이다. 따라서 정부나 지자체 등 공공 부문에서 먼저 데이터 품질 개선을 위한 노력을 하지 않는 한 AI는 써봤자 아무 소용이 없다. 구체적으로 어떤 노력이 필요할까. 조직 내 문서의 표현 방식을 날 잡아 벌레 잡듯이 완벽히 국문법에 맞도록 고치는 과정, 즉 데이터 적법화 정제를 해야 한다. AI 환각 결과를 일부 계층이 의도적으로 부적절하게 사회양극화 수단으로 활용할 개연성도 충분히 존재한다. 약자를 보호하여 사회양극화를 줄여 주는 방향으로 나가게 하려면 다른 분야는 차치하고라도 복지 쪽 데이터만큼은 적법하게 정제하고 난 다음에 AI 기술을 적용해야 한다. 안전 쪽도 마찬가지다. 안전 데이터만큼은 데이터 품질 면에서 잘 다듬어야 응급환자 뺑뺑이 사태, ‘제2의 세월호 사태’ 또는 국가사회복지망 마비 사태 재발을 막을 수 있다. 품질을 외면하면 또 다른 대형 사고는 앞으로도 예고되어 있는 것이나 다름없다.

이런 가운데 AI에 의한 여론조작이 이미 매우 심각한 상황에 이르고 있다는 점은 경종을 울려준다. 관행이 고쳐지지 않는 이유는 냄비 근성 탓이다. 미국 대선에서 터졌던 2018년의 케임브리지 애널리티카 스캔들 사건은 8700만명의 개인정보가 활용돼 수많은 유권자들의 여론 향방을 의도적으로 조작한 희대의 사건이다. 이런 유형의 사건사고는 우리나라뿐만 아니라 어느 나라에서나 있었고 또 현재 진행형이다. 그런데도 늘 산불 구경하듯이 그냥 일시적 현상으로 곧 지나쳐 버리기 일쑤다. 지금도 그렇다. 우리 뇌리를 잠시 스쳐 지나갈 뿐 확고한 해법을 외면한 채 그냥 넘어가고 있다. 따라서 여론조작 가능성을 어떻게 근원적으로 차단할 수 있겠는지부터 접근해야 한다. 해법은 단순하다. 모든 뉴스와 의견의 원천지에 대해 블록체인 처리하면 쉽게 차단할 수 있다. 뉴스원에 대한 추적과 유통과정의 투명성 및 부인불가성이 보장되기 때문이다. 역추적 가능해야 가짜 뉴스가 완벽하게 근절된다. 이 해법의 정확성과 신뢰성에 대해서는 기술적으로 누구도 의심의 여지를 달 수 없지만 블록체인 기술 적용에 대해 거부감을 갖는 특정 집단이 존재한다. 바로 정치권 자신이다. 여야의 입장이 특히 선거를 앞두고 첨예하게 대립되기 때문이다. 여야가 선거 결과 후 입장이 역전되는 날에는 없던 일로, 언제 그랬냐는 듯 아무 문제 삼지 않고 그냥 넘어가기 일쑤다. 이율배반적이다.

AI 알고리즘에 의해 여론이 더욱 편향되고 양극화, 극단화된다는 비판도 많다. 이 문제도 데이터 품질 각도에서 접근하면 해법이 보인다. 품질면에서 적법하게 리모델링하는 작업 과정을 거치지 않고는 극단화를 막기 힘들다. 그러므로 데이터 리모델링 또한 신규 창출 데이터를 위한 데이터 형성 방법에 대해 전문가로부터 특별 사전 교육을 받아야 한다. 데이터는 창작물이다. 데이터도 자동차나 물건처럼 제작에 필요한 요령을 숙지해야 한다. AI 예산의 불과 10%만 갖고도 그런 데이터 제작 및 정제에 필요한 전문가 지도를 충분히 받을 수 있다. 누가 어디선가 만들어서 내게 쓰라고 거저 갖다 주는 게 데이터가 아니다. 양극화 극단화를 막기 위한 AI 사용에 대한 법적, 제도적 보완장치 역시 모색해야 한다. 그러나 더 중요한 건 법과 제도가 보완되기 위해서는 먼저 사람부터 바뀌어야 한다. 거슬릴지도 모르겠으나 말로만 데이터 시대 운운할 게 아니라 현 국회의원의 최소 10%는 데이터 전문가로 채워야 마땅하다. 지금은 그런 역량을 가진 이가 불행히도 국회에 한 명도 없다. 따라서 현 단계에서는 AI 사용에 대해 일단 규제를 하는 수밖에 별 도리가 없다. 그렇지 않고는 AI 사용으로 혈세낭비만 벌어질 게 분명하기 때문이다. 여야가 국가 미래 대계 살리기 운동의 일환으로 이런 전문가 영입에 합의하기 전에는 불가능하다.

앞서 지적한 데이터 비만도 심각성 문제도 결국 해결하려면 정부가 나서서 축소 노력을 펼쳐야 함에도 불구하고 공직사회에서는 개선을 위한 법적 제도적 근거가 없다는 핑계로 발뺌하기 급급한 실정이다. 이건 반드시 바로잡아야 할 국정 중대 사안이다. 대통령실 관심이 절대적으로 필요하다. 바로잡아진다면 입법이나 인사청문회 등에서 AI를 활용할 만한 분야가 많을 것이다. 지금이라도 당장 AI를 쓸 수 있는 분야는 위헌 충돌이나 부실 입법 같이 정제가 불필요해 보이는 쪽이다. 다른 쪽에는 품질 개선 준비과정을 면밀히 거친 후에만 효과를 볼 수 있다. 또 다른 예로 작금의 인사청문회 중 윤리 부분에 대한 것은 기계적으로 자동화 시스템 처리하여 충분히 대체 가능하다. 정작 청문회에서는 정책 질의로만 일관해도 될 것이다. 국회의원 출마자에 대해서도 범죄 전과 여부를 알고리즘으로 여과하여 전과자는 선거 입후보에서 시스템적으로 자동 제외시키는 것도 가능하다. 국정 및 의정 관련 문서 데이터의 품질이 개선된다면 AI를 써서 국회의원 수나 행정부 장·차관 수를 점차 줄여 나갈 수도 있겠다. 그러나 지금까지 정부가 데이터 품질 개선에 노력을 기울여 오지 않은 것을 보면 정치권이 자진해서 국정·의정 문서 데이터 품질 개선에 나설 가능성은 없다고 봐야 한다. 이런 구태의연한 수구(守舊) 자세는 국민들에게 결국 정치권 자신들의 자리 수성으로 비칠 수밖에 없는 것이다. 제 아무리 현란한 기술 종합 세트를 동원해본들 AI 시대에도 세상의 모든 길은 데이터 품질이라는 신작로로 통하지 않고는 세상이 종전과 별반 달라질 것은 없다. 이런 품질 개선에서 AI가 할 수 있는 일도 없다. 결국 데이터 주권을 쥐고 있는 인간의 도움 없이는 AI도 한낱 별 쓸모없는 기술일 수밖에 없다는 말이다.




문송천 필자 이력

▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수