정보 시스템 결함에도 불구하고 정부가 무리하게 개통했다는 감사원 결과가 최근 나왔다(아주경제 2024년 7월 30일). 보건복지부 사회복지행정시스템 이야기다. 그로 인해 1900억원을 소요한 시스템이 실패했다. 줄곧 말썽을 부려온 행정망과 무관할 수도 있지만 정부 부처 시스템이라는 점에서는 시스템 설계 및 개발 접근 방법론에서 결코 무관하지 않은 일이다. 왜 이런 일이 자꾸 반복되는 것일까. 이율배반적이지만 2024년 1월 30일자에 나온 디지털 정부 평가에서 한국이 세계 1위를 차지했다. 디지털 하면 다름아닌 정보화의 동음이의어인데 지난 행정망 먹통 사태를 본 시민 입장에서 보면 앞뒤가 전혀 맞지 않는다는 의견을 갖는 이들이 주위에 많다. 이런 모순에 대해 행안부 평가 기준이 다르기 때문이라고 설명한다(조선일보 2024년 1월 31일자 제8면). 그렇다. OECD 5개 평가항목이 정부나 지자체가 자체 보유하고 있는 정보를 얼마나 대외적으로 시민들과 공유할 개방 의지가 있는가 보는 것 위주다. 데이터공개 평가항목 등이 그 예다. 이렇듯 국제기구에서는 정보공개 개방성에 초점을 둔다. 개방 의지에 대해서는 한국은 앞서 있지만 정부의 데이터 대 시민 데이터 서비스를 보는 학계의 시각은 다르다. 데이터의 품질에 더 관심을 둔다. 그것이 데이터의 진가를 나타내는 정량적 지표인 까닭이다. 이런 품질 요인을 고려하지 않은 것이 국제기구 평가의 한계다. 데이터의 품질은 데이터의 군살 빼기에서 시작한다. 필요 없는 것들은 완전 제거함으로써 데이터 비만도를 낮추는 것이 시스템의 질과 속도를 개선해주는 핵심이라는 점은 학계 정설이다. 마치 인체 비만도를 낮추는 것과 같이. 그러나 현장에서는 필요가 있든 없든 중복을 무분별하게 허용하는 게 관행처럼 돼있다. 학계에서 중시하는 불필요 데이터의 비율, 즉 데이터 중복률 수치까지 고려한다면 다른 평가 순위가 나올 가능성이 있다. 따라서 OECD 발표에 자족하지 말고 정부는 물론 업계는 부단히 데이터 품질 개선 노력을 펼쳐 나가야 할 것이다. 그게 데이터 품질을 특별히 강조하는 클라우드 시대에 맞는 자세다.
통합 데이터 설계도면(이하 데이터 맵)을 따로 유지 보수하지 않는 정부 및 업계 관행도 문제 중 하나다. 데이터와 코딩은 본래 물과 기름 격으로 다른 것임에도 불구하고 둘을 임의로 섞어 시스템을 구축하는 관행은 더 큰 문제다. 건물로 말하면 건축설계 청사진에 해당하는 것이 데이터고 시공에 해당하는 것이 코딩이다. 그런데 통합되지 않고 분산 단절된 시스템에 내재된 문제는 데이터맵이 따로 없고 맵 자체가 코딩 속에 섞여 혼재한 모습이라는 점이다. 분명한 데이터맵이 없다는 이야기는 데이터 설계조차 원론적으로 안 한 채 바로 시공에 들어갔다는 말이다. 따라서 시스템 튜닝을 하는 과정에서 코딩을 건드리면 본의 아니게 데이터 설계 부분까지도 건드리게 되는 화를 불러일으켜 데이터 오류를 유발할 수 있는 것이다. 실제로 이런 류의 잘못이 교육행정정보시스템에서 발생한 중대 오류, 즉 시험지 데이터를 검색했더니 엉뚱하게도 다른 학교 답안지 데이터를 출력하는 어처구니없는 경우가 발생했다. 행정망에서도 민원서류를 요청했더니 요청하지도 않은 다른 서류까지 출력됐다는 보도(전자신문)는 이런 류의 동종사고다. 만일 그런 식으로 오작동한 것이 사실이라면 문제 발생 과정 역추적 노력이 필요하다. 따라서 행정망 먹통 사태의 가장 유력한 단서는 첫째 바로 시스템 발주 컨트롤 타워 없이 분절된 시스템 개발 관행과 둘째 데이터맵 없이 성급하게 바로 코딩해버리고 마는 고질적 행태에서 유래했을 가능성이 유력하다.
2024년 1월 31일자에 나온 정부 디지털행정 장애 방지대책을 봐도 문제의 근원을 벗어난 지엽적인 것들 위주다. 데이터 품질에 대한 언급은 한마디도 없다. 그 대책의 요지는 이렇다. 앞으로 행안부 국가정보자원관리원(이하 국자원)이 중심이 되어 위험 징후 조기 판단과 시스템 안전성 진단 지원을 하겠다는 것이다. 그러나 이것은 국자원이 이미 해 오던 일이 아닌가. 대책에 따르면 시스템 유지보수 체계를 개편하고 소프트웨어 구축에 대기업 참여를 허용하겠다고 하나 이런 것만으로는 별로 달라지기를 기대하기 곤란하다. 왜 그런가. 행정망 먹통 사태의 원인에 대한 해석이 행안부 측과 학계 측이 판이하게 다르기 때문이다. 학계에서는 분절된 시스템을 문제의 고질적 근원으로 지적한다. 실국별로 발주된 시스템이 국자원 산하에 한두 개도 아니고 정부 발표에 의하면 무려 1만9000여 개(연합뉴스 2024년 4월 1일자)에 달할 정도로 방대하게 분산된 규모다. 한두 개가 아니란 말의 뜻은 1만9000여 개가 아니라 단지 한두 개만 나오게끔 애초부터 시스템을 대통합해 나갔어야 한다는 뜻이다. 시스템 발주 컨트롤 타워가 딴 곳 아닌 국자원일진대 이런 중차대한 의미를 갖는 일을 수행해야 할 것이다. 다른 부차적인 일보다도. 정부의 해법 중의 하나는 그간 금지돼왔던 대기업 참여를 전격 허용한다는 내용도 나온다.
그러나 대기업이 참여해도 크게 달라질 가능성이 없다. 다음 세 가지 관점에서다. 첫째 상기한 사회복지행정시스템에서 드러났듯이 대기업이 개발을 주도했음에도 시스템 먹통사태는 심각했다. 개통 당일에만 오류가 무려 10만건에 달했다. 서너건이라할지라도 많은 편인데 상상조차 힘든 일이 벌어졌다. 그 대기업은 문제해결을 위해 그후 많은 노력을 해왔으나 6개월이 지난 뒤에도 문제 해결 기미가 보이지 않았다. 정부의 압박이 강도 높은 상황에서 그 기업은 결국 사업 전체 포기를 선언하며 완전 철수했다. 이런 경우에 기업 프로젝트 개발팀은 책임 때문에 풍비박산 나는 게 보통이다. 그만 한 고급인력을 다시금 충원하기는 힘든 상황에서도 팀원 전체 보통 일괄 퇴사 조치 당한다. 프로젝트 규모는 1900억원 수준이었다. 보통 금융업계나 통신업계에서는 그 규모가 더 크다. 1조원 수준이다. 그러니 대기업 입장에서는 국가 사업에 이윤보고 들어가지 않는다는 뜻이다. 그렇다면 정부로서는 대기업 참여를 대폭 기대하기는 어려울 전망이다. 둘째 이번 행정망 오류도 그렇지만 대부분의 사고는 유지보수 과정에서 발생한다. 그런데 대기업이 개발을 주도할지라도 유지보수는 어차피 중소기업 몫이 될 가능성이 크다. 시스템 안정화를 위해 대기업 측에 유지보수를 2~3년간 강제한다고 해도 수익구조 상 결국 유지보수는 중소기업 손으로 넘어갈 수밖에 없다. 셋째 먹통사태의 주요 원인이 실상은 데이터와 코딩이 섞여 터지는 성격의 것들이라 이런 관행이 기업 규모에 무관하게 팽배해 있는 한 대기업이 참여해도 데이터 설계 품질 개선에 별 도움이 안될 것이라는 점이다. 따라서 앞으로는 시스템 개발이나 유지보수 시에도 참여 기업 규모보다는 데이터와 코딩을 절대로 섞지 않도록 강제하는 규정이 무엇보다 시급하다. 유지보수 체계를 개선하겠다는 국자원의 의지는 인정할 만하다. 그러나 유지보수도 이렇듯 데이터 통합 관점에서 접근하지 않고는 성공하기 힘들다.
따라서 국자원이 컨트롤 타워 역할에 충실하려면 다음 세 가지가 필수다. 첫째 앞으로는 발주 창구를 단일화하고 실국별 시스템 분절 발주를 근절해야 하며 창구는 국자원이 되어야 한다. 둘째 발주 창구 단일화에 그치지 말고 유지보수 창구 역시 단일화해야 하며 그 창구도 국자원이 직접 맡아야 한다. 셋째 금융권의 사례를 보면 시스템은 통상 이원화되어 단 두개의 시스템으로 통합되어 돌아간다. 국자원 산하에 흩어져있는 1만9000여 개의 시스템을 이처럼 단 두개로 줄여 가볍게 만들어야 한다. 부처간 데이터 중복이 존재하는데 이걸 제거해야 하기 때문이다. 교통 지도로 말하자면 전국도로교통지도를 한눈에 볼 수 있도록 만들어야 한다는 뜻이다. 큰 국가데이터지도 하나를 만든다고 생각하면 된다. 국가지도를 하나 만들어 놓고 부처별로 업무는 겹치지 않을 것이므로 국가지도 기반 프로그램은 부처별 및 지자체별로 제작하면 된다. 이를 위해서는 시스템 대통합이 필요하며 통합하는 방법론도 알아야 한다. 이런 통합은 해 본 경험이 없는 경우 엄두가 나지 않을 수 있다. 그러나 과거 성공사례들을 살펴보면 산발 분절된 시스템도 1년 넘지 않는 단기간 내에 단 하나로 통합 가능하다는 사례가 증명돼 있다. 기재부 금융정보분석원 시스템과 산업부 특허청 시스템이 그런 사례다. 행안부에서는 그런 사례를 참고해야 할 것이다. 시스템 통합에는 방법론이 엄연히 있다. 그런 세부적 방법론을 상기 모범사례는 물론 대구시 행정데이터통합 사례에서도 확인 가능하다.
국자원이 국가 데이터 인프라 설계 컨트롤 타워 역할을 하고자 한다면 이런 데이터 통합 문제를 확실히 다룰 데이터 전문가를 확보하고 있는지에 대해서도 자문해봐야 한다. 국가 정보 자원을 관리한다는 말 자체가 원래부터 잘못 제정된 것이기도 하다. 국가 데이터 자원이지 정보 자원이 아니기 때문이다. 정보는 그의 원료인 데이터를 가공하여 만들어지는 것이다. 데이터를 제2의 원유라고 부르듯이 정보 이전의 데이터가 진정한 자원인 까닭이다. CIA는 그 조직 역할을 잘 드러내듯이 중앙첩보국이다. 모든 첩보가 중앙에 집결된다는 의미다. 잘 지어진 이름이다. 우리나라 국가정보원도 따라서 국가첩보원으로 이름이 지어져야 어울린다. 이름의 적격성을 지적하는 이유는 어느 조직이든 본연의 역할에 충실한 임무를 수행해야지 다른 엉뚱한 임무를 수행하면 아니 된다는 뜻이다. 국가정보 관리라고 하면 국가데이터를 정작 관리해주는 곳이 국가 조직 상으로 다른 어느 곳에 별도로 있어야 한다는 뜻과 같아진다.
문송천 필자 이력
▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
통합 데이터 설계도면(이하 데이터 맵)을 따로 유지 보수하지 않는 정부 및 업계 관행도 문제 중 하나다. 데이터와 코딩은 본래 물과 기름 격으로 다른 것임에도 불구하고 둘을 임의로 섞어 시스템을 구축하는 관행은 더 큰 문제다. 건물로 말하면 건축설계 청사진에 해당하는 것이 데이터고 시공에 해당하는 것이 코딩이다. 그런데 통합되지 않고 분산 단절된 시스템에 내재된 문제는 데이터맵이 따로 없고 맵 자체가 코딩 속에 섞여 혼재한 모습이라는 점이다. 분명한 데이터맵이 없다는 이야기는 데이터 설계조차 원론적으로 안 한 채 바로 시공에 들어갔다는 말이다. 따라서 시스템 튜닝을 하는 과정에서 코딩을 건드리면 본의 아니게 데이터 설계 부분까지도 건드리게 되는 화를 불러일으켜 데이터 오류를 유발할 수 있는 것이다. 실제로 이런 류의 잘못이 교육행정정보시스템에서 발생한 중대 오류, 즉 시험지 데이터를 검색했더니 엉뚱하게도 다른 학교 답안지 데이터를 출력하는 어처구니없는 경우가 발생했다. 행정망에서도 민원서류를 요청했더니 요청하지도 않은 다른 서류까지 출력됐다는 보도(전자신문)는 이런 류의 동종사고다. 만일 그런 식으로 오작동한 것이 사실이라면 문제 발생 과정 역추적 노력이 필요하다. 따라서 행정망 먹통 사태의 가장 유력한 단서는 첫째 바로 시스템 발주 컨트롤 타워 없이 분절된 시스템 개발 관행과 둘째 데이터맵 없이 성급하게 바로 코딩해버리고 마는 고질적 행태에서 유래했을 가능성이 유력하다.
2024년 1월 31일자에 나온 정부 디지털행정 장애 방지대책을 봐도 문제의 근원을 벗어난 지엽적인 것들 위주다. 데이터 품질에 대한 언급은 한마디도 없다. 그 대책의 요지는 이렇다. 앞으로 행안부 국가정보자원관리원(이하 국자원)이 중심이 되어 위험 징후 조기 판단과 시스템 안전성 진단 지원을 하겠다는 것이다. 그러나 이것은 국자원이 이미 해 오던 일이 아닌가. 대책에 따르면 시스템 유지보수 체계를 개편하고 소프트웨어 구축에 대기업 참여를 허용하겠다고 하나 이런 것만으로는 별로 달라지기를 기대하기 곤란하다. 왜 그런가. 행정망 먹통 사태의 원인에 대한 해석이 행안부 측과 학계 측이 판이하게 다르기 때문이다. 학계에서는 분절된 시스템을 문제의 고질적 근원으로 지적한다. 실국별로 발주된 시스템이 국자원 산하에 한두 개도 아니고 정부 발표에 의하면 무려 1만9000여 개(연합뉴스 2024년 4월 1일자)에 달할 정도로 방대하게 분산된 규모다. 한두 개가 아니란 말의 뜻은 1만9000여 개가 아니라 단지 한두 개만 나오게끔 애초부터 시스템을 대통합해 나갔어야 한다는 뜻이다. 시스템 발주 컨트롤 타워가 딴 곳 아닌 국자원일진대 이런 중차대한 의미를 갖는 일을 수행해야 할 것이다. 다른 부차적인 일보다도. 정부의 해법 중의 하나는 그간 금지돼왔던 대기업 참여를 전격 허용한다는 내용도 나온다.
그러나 대기업이 참여해도 크게 달라질 가능성이 없다. 다음 세 가지 관점에서다. 첫째 상기한 사회복지행정시스템에서 드러났듯이 대기업이 개발을 주도했음에도 시스템 먹통사태는 심각했다. 개통 당일에만 오류가 무려 10만건에 달했다. 서너건이라할지라도 많은 편인데 상상조차 힘든 일이 벌어졌다. 그 대기업은 문제해결을 위해 그후 많은 노력을 해왔으나 6개월이 지난 뒤에도 문제 해결 기미가 보이지 않았다. 정부의 압박이 강도 높은 상황에서 그 기업은 결국 사업 전체 포기를 선언하며 완전 철수했다. 이런 경우에 기업 프로젝트 개발팀은 책임 때문에 풍비박산 나는 게 보통이다. 그만 한 고급인력을 다시금 충원하기는 힘든 상황에서도 팀원 전체 보통 일괄 퇴사 조치 당한다. 프로젝트 규모는 1900억원 수준이었다. 보통 금융업계나 통신업계에서는 그 규모가 더 크다. 1조원 수준이다. 그러니 대기업 입장에서는 국가 사업에 이윤보고 들어가지 않는다는 뜻이다. 그렇다면 정부로서는 대기업 참여를 대폭 기대하기는 어려울 전망이다. 둘째 이번 행정망 오류도 그렇지만 대부분의 사고는 유지보수 과정에서 발생한다. 그런데 대기업이 개발을 주도할지라도 유지보수는 어차피 중소기업 몫이 될 가능성이 크다. 시스템 안정화를 위해 대기업 측에 유지보수를 2~3년간 강제한다고 해도 수익구조 상 결국 유지보수는 중소기업 손으로 넘어갈 수밖에 없다. 셋째 먹통사태의 주요 원인이 실상은 데이터와 코딩이 섞여 터지는 성격의 것들이라 이런 관행이 기업 규모에 무관하게 팽배해 있는 한 대기업이 참여해도 데이터 설계 품질 개선에 별 도움이 안될 것이라는 점이다. 따라서 앞으로는 시스템 개발이나 유지보수 시에도 참여 기업 규모보다는 데이터와 코딩을 절대로 섞지 않도록 강제하는 규정이 무엇보다 시급하다. 유지보수 체계를 개선하겠다는 국자원의 의지는 인정할 만하다. 그러나 유지보수도 이렇듯 데이터 통합 관점에서 접근하지 않고는 성공하기 힘들다.
국자원이 국가 데이터 인프라 설계 컨트롤 타워 역할을 하고자 한다면 이런 데이터 통합 문제를 확실히 다룰 데이터 전문가를 확보하고 있는지에 대해서도 자문해봐야 한다. 국가 정보 자원을 관리한다는 말 자체가 원래부터 잘못 제정된 것이기도 하다. 국가 데이터 자원이지 정보 자원이 아니기 때문이다. 정보는 그의 원료인 데이터를 가공하여 만들어지는 것이다. 데이터를 제2의 원유라고 부르듯이 정보 이전의 데이터가 진정한 자원인 까닭이다. CIA는 그 조직 역할을 잘 드러내듯이 중앙첩보국이다. 모든 첩보가 중앙에 집결된다는 의미다. 잘 지어진 이름이다. 우리나라 국가정보원도 따라서 국가첩보원으로 이름이 지어져야 어울린다. 이름의 적격성을 지적하는 이유는 어느 조직이든 본연의 역할에 충실한 임무를 수행해야지 다른 엉뚱한 임무를 수행하면 아니 된다는 뜻이다. 국가정보 관리라고 하면 국가데이터를 정작 관리해주는 곳이 국가 조직 상으로 다른 어느 곳에 별도로 있어야 한다는 뜻과 같아진다.
문송천 필자 이력
▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수