통계청, 데이터의 중심으로 거듭난다… 'K-통계시스템' 구축 추진

2021-02-01 15:00
기관별 데이터 모으고 최신 암호 기술로 보호
류근관 청장 "데이터, 모으고 결합할수록 가치 커져"

[통계청 제공]



통계청이 각 정부기관과 공공기관에 산재돼 있는 데이터를 최신 암호기술을 이용해 보호하고 통계 수요자에게 제공하는 'K-통계시스템' 구축에 나선다.

통계청은 1일 이르면 3년 내에 최신 암호기술인 동형암호를 활용해 개인정보 보호를 강화한 K-통계시스템을 구축해 4차 산업 활성화를 지원하겠다고 밝혔다. 

류근관 통계청장은 "통계청이 추진하고자 하는 K-통계시스템은 각 기관의 데이터를 안전한 암호체계 하에 보호하며 다른 기관의 데이터와 섞이지 않게 관리할 수 있다"며 "기존 데이터댐에서 자료 보안과 활용은 상충관계였다면 이를 보완관계로 바꿔 공공빅데이터 축적, 결합, 활용에 긍정적인 생태계를 구축하게 될 것"이라고 말했다.

K-통계시스템은 통계등록부 등 데이터베이스를 가교 삼아 각 기관에 산재한 데이터를 최신의 암호기술 기반으로 연계한 클라우드 기반의 데이터 체계다.

통계청이 K-통계시스템 구축에 나선 것은 데이터3법 개정으로 정보주체 동의 없이 가명정보의 활용이 허용되면서 대량의 데이터 활용이 확산되는 가운데, 개인정보 유출 및 오남용에 대한 우려 등 불안감이 확대되고 있기 때문이다.

또한 각 기관이 보유한 데이터의 잠재적 가치가 충분히 실현되지 않고 있다는 인식도 시스템 구축 이유로 꼽았다. 데이터 간 연계와 결합 활용에 대한 수요가 증가하고 있음에도 불구하고 유용한 데이터들이 정부 각 부처와 지방자치단체 등 공공기관에 산재한 채로 보관되고 있기 때문이다.

K-통계시스템은 동형암호 등 최신 암호기술을 이용한다. 이를 통해 최고의 보안수준을 유지한 채 각종 공공자료를 결합해 활용하는 한국판 공공 빅데이터 체계를 구축할 수 있다.

통계청은 시스템이 구축되면 데이터 집중화에 따른 개인정보 유출과 빅브라더 출현 등의 우려를 불식하면서도 규모의 경제와 범위의 경제로 대표되는 데이터의 잠재적 가치를 극대화할 수 있을 것으로 기대했다.

류 청장은 "각 기관에서 비식별화 조치를 한다고 하지만 여러 개의 데이터가 모이면 개인을 식별하게 될 수 있기 때문에 장기적인 관점에서 비식별화 조치는 한계가 있다"며 "때문에 궁극적으로 새로운 암호기술을 적극 도입할 생각"이라고 말했다.

민간 부문의 4차 산업 활성화도 기여할 것으로 내다봤다. 기존의 빅데이터를 보유한 기업과 신규 진입하는 기업 간의 자료 격차를 축소하면 경쟁과 혁신의 생태계를 촉진하는 데 도움이 될 것으로 예상했다.

통계청은 K-통계시스템을 이르면 3년, 늦으면 5년 내에 구축하는 게 목표라고 밝혔다. 

이와 함께 통계청은 통계이용자의 수요 변화에 대응해 국가통계관리도 탄력적으로 개선할 계획이다.

이를 위해 시범통계제도를 실시한다. 시범통계란 빅데이터 활용 등 기존 통계와 다른 데이터나 방법론을 적용해 작성한 통계로 작성 이후 일정 기간 품질 제고를 위해 관찰이 필요한 준통계를 의미한다. 국가승인통계와의 차이와 운영방식 등은 제도 도입에 맞춰 마련한다.

통계이용자의 자료 요청에 대해 제공 가능 여부 판단이 모호한 경우 임시적으로 열람과 활용을 허용하는 통계자료 샌드박스 제도도 도입할 계획이다. 샌드박스를 통해 제공되는 자료는 자료보안을 전제로 과학적 연구와 정부정책 근거 마련 등의 목적에 사용하도록 했다.

류 청장은 "데이터는 자료의 크기가 커질수록, 각 부처에 산재한 게 결합될수록 가치가 커지는 재화"라며 "통계와 데이터의 양적인 면 뿐만 아니라 질적인 측면에서도 서비스 확대가 가능해질 것"이라고 말했다.

이어 "K-통계시스템 구축사업이 성공적으로 추진될 수 있도록 관계부처와의 긴밀한 협력과 사회적 공감대 확산을 위한 노력도 병행하겠다"며 "통계 샌드박스는 즉각, 시범통계는 국가통계위원회에 제도 도입을 요청할 것"이라고 설명했다.