한국전자통신연구원(ETRI) 사이버보안연구단은 빅데이터 개인정보 분석 기술을 개발해 페이스북 657만개, 트위터 277만개 등 한국인 SNS 이용자 계정 934만개를 대상으로 개인정보 노출현황을 분석한 결과 출신학교, 관심사 등 신상정보가 노출되고 있다고 13일 밝혔다.
이번 연구결과 페이스북의 경우 성별(92%), 고등학교(47%), 혈액형(40%), 관심사(19%), 좋아하는 음악(14%) 순으로 개인 신상 정보가 노출된 것으로 조사됐다.
출신학교나 거주지역 등과 같은 직접 그 사람이 누구인지 알 수 없는 비식별 정보를 조합해 개인을 특정할 수 있는 경우도 분석해 본 결과 주민등록 번호나 ID, 계좌번호 등과 같은 식별정보가 아닌 이름-고등학교 조합만을 통해서도 식별되는 경우는 226만명(34%)에 달했다. 대학교 정보를 추가할 경우 297만명(45%)의 식별이 가능했다.
트위터의 경우, 이름(69%), 지역(45%), 직업 (33%) 순으로 노출된 정보가 많았고 전체 277만개 계정 중 2개 이상의 개인정보가 노출된 계정 수는 134만개, 3개 이상 노출된 경우도 21만개에 달했다.
페이스북과 트위터를 합친 934만개 계정 중에서 3개 이상 정보가 노출된 계정 수는 386만개로 41%였다.
트위터와 페이스북에 노출된 이름, ID 등 간단한 정보를 이용해 최소 17만개의 트위터 계정과 페이스북 계정을 서로 연결할 수 있는 것으로 파악됐다.
연구진은 실제 SNS 데이터를 직접 수집하고 가공, 개인정보 추출, 위험도 분석 프로그램 등을 통해 결과를 얻었고 관련기술은 개인정보 탐지 솔루션 업체에 기술이전을 준비중이다.
이번 조사를 통해 연구진은 SNS를 사용하는 사람이 본인의 세부정보를 계정에 올리면서 나타나게 되는 심각성을 크게 염두에 두지 않는 것으로 나타났다고 밝혔다.
ETRI 연구진은 SNS 계정에 들어있는 개인정보들을 서로 연결하게 되면 이른바 신상털기가 쉬워져 개인의 프라이버시 침해는 물론 피싱 사기나 타켓광고, 마케팅 등에 악용될 소지가 높다고 설명했다.
이번 조사 분석은 ETRI에서 개발한 SNS 정보 자동 수집기술, 개인정보 탐지기술, 정보조합을 통한 식별 가능성 분석 기술 등과 같은 빅데이터 개인정보 분석 기술을 사용해 수행됐다.
이러한 조사 분석 규모는 기존에 24만명을 조사한 해외 사례를 능가하는 것으로 국내에서 이러한 대규모 조사는 최초라고 ETRI측은 밝혔다.
이번 분석을 진행한 ETRI 인증기술연구실 최대선 박사는 “그동안 정보 하나 하나를 조합해 개인을 식별하거나 계정을 상호 연결해 더 많은 정보가 노출될 수 있는 위험성이 많이 지적돼 왔는데 이번 분석을 통해 실제 데이터를 통해 그 심각성을 확인한데 큰 의미가 있다”고 말했다.
ETRI는 이러한 위험으로부터 이용자의 개인정보를 보호하기 위해서는 상기 빅데이터 개인정보 분석 기술의 고도화와 함께 광범위한 인터넷, 빅데이터 개인정보 노출 탐지, 추론을 통한 미공개 정보 유추 가능성 분석, 계정 연결을 통한 식별 위험 분석, 위험도에 따른 개인정보 실시간 필터링 등의 기술이 추가로 개발돼야 한다고 밝혔다.
연구 내용은 한국정보보호학회 논문지 10월호에 게재될 예정이다.