[2020 세계 개인정보보호법②] 데이터 3법 '가명 정보'로 불안한 시민, 활기찬 시장
2020-02-14 10:59
데이터 3법 '가명정보', 글로벌 기업 성장과 개인정보 유출 우려가 상충
전문가 曰 "명확한 기준 아래 적극적인 빅데이터 활용 필요"
전문가 曰 "명확한 기준 아래 적극적인 빅데이터 활용 필요"
◈ 2008년 옥션, 2011년 싸이월드, 2012년 KT 등에서 볼 수 있듯이 정보화 사회에서 개인정보 유출은 꽤 비일비재하다. 개인 아이디를 해킹해서 판매하면 누군가 구매한 아이디로 개인의 클라우드에 접속해 마음대로 데이터를 다운로드할 수 있고 얼마든지 상업적 이용이 가능하다는 것이 문제다. 얼마 전에는 유명 연예인들의 사생활이 담긴 데이터가 유출돼 논란이 일기도 했다. 빅데이터 산업이 성장함에 따라 개인정보 보호를 가벼이 볼 수만은 없다. 빅데이터의 활용이 필연적인 지금, 개인정보 보호에 대해 영리하게 접근할 필요가 있다.
◇ '가명정보'는 개인정보로 보호받을 수 있을까
지난달 9일 '데이터경제 3법'이 우여곡절 끝에 국회 본회의를 최종 통과했다.
데이터 3법은 '개인정보를 어떻게 다뤄야 하는가'에 대한 법안으로 개인정보보호법, 정보통신망법, 신용정보법이 포함돼 있다.
그중 '신용정보법' 개정안의 키워드는 '가명정보'다. 개인정보를 완전히 '가명처리' 한다면 당사자의 동의 없이 제 3자에게 공유할 수 있게된 개정안으로 여기서 개인정보는 주민등록번호, 실명 등 개인 식별 정보다.
'가명'은 '익명'과 엄연히 다르다. '익명'의 경우 처음부터 자신의 신원을 비공개로 정보를 수집하기 때문에 정보를 모두 모아봐도 특정인을 전혀 유추할 수 없다. 그렇게 때문에 빅데이터로서 활용 용도는 떨어진다. 반면 '가명'은 빅데이터로서 가치가 크지만 공개적으로 수집한 정보에 임시로 이름을 붙인 것이기 때문에 특정인의 개인정보를 유추할 가능성이 있다.
실제로 지난해 7월 국제 학술지 '네이처 커뮤니케이션'에 비식별화된 데이터에서 특정 개인을 정확히 찾아낼 수 있다는 논문이 재됐다. 몽조이 교수 등 연구진은 미국과 터키 등에서 공개된 데이터를 기계학습 알고리즘에 이용해 실험했고 가명정보에서 특정 개인을 찾아내는 '재식별화 모델'을 만들었다. 실험결과 이 모델은 15개의 인구통계적 속성(나이 성별 결혼여부 우편번호 등)만 알아도 익명화된 데이터를 99.98%의 정확도로 개인을 구분해 낼 수 있었다.
몽조이 교수의 연구가 주목받는 이유는 표본으로부터 정확히 개인을 특정할 수 있다는 것이 공식적으로 밝혀졌기 때문이다.
따라서 가명정보는 '개인정보'의 일부로 작용한다. 이번 개정안은 국가에서 지정한 기관을 통해 다루도록 한계 지었으며 가명정보를 통해 개인정보를 유추하는 '개인 재식별화'를 금했다.
일각에서는 이처럼 '가명처리' 이후 이어질 개인정보 유출을 우려하고 있다. 뿐만 아니라 아직까지 사용 목적과 방법에 대한 해석이 다양해 소비자의 개인정보를 활용할 수 있는 기업은 이득을 취하고 정작 개인정보 주인은 별다른 소득이 없다는 지적도 있다.
하지만 급변하는 4차 산업혁명 시대에서 빅데이터 활용은 필수불가결하다는 것이 대다수 전문가의 의견이다. 빅데이터를 적극 활용해 4차 산업 혁명을 선도하는 핀테크주와 데이터 기업이 성장할 수 있는 환경이 조성되기 때문이다. 최근 하나의 앱에서 여러 은행 계좌 잔액을 조회·송금 가능 한 ‘오픈뱅킹’도 데이터 3법을 통해 활성화됐다.
고려대학교 정연돈 교수는 "개정된 개인정보보호법을 통해 보호 측면에선 과거보다 약화된 것은 사실"이라며 "빅데이터를 적극 활용해야 하지만 아직까지 법적 해석 모호하기 때문에 앞으로 사회적 합의를 통해 명확한 기준을 세워야 한다”고 말했다.
법 개정을 추진하는 정부와 여당 또한 4차 산업혁명의 중요한 토대인 데이터 산업 발전과 양질의 일자리 창출을 위해 가명정보 활용이 중요하다는 입장을 밝혔다.