스캐터랩, 이루다 DB·딥러닝모델 폐기 결정…"개인정보 수집절차 강화"

2021-01-15 11:20
"비식별 조치해 개인정보 없지만, 이용자 불안 고려"

스캐터랩이 개인정보 유출 가능성을 제기한 서비스 이용자들의 요구를 수용해 인공지능(AI) 챗봇 '이루다'의 데이터베이스(DB) 및 학습에 사용된 딥러닝 대화 모델을 폐기한다. 향후 신규 가입 및 서비스 이용시 개인정보 수집·이용 동의 절차도 강화한다.

15일 스캐터랩은 앞서 개인정보 유출·오남용 문제를 제기한 '연애의 과학'과 '텍스트앳' 등 서비스 이용자들의 불안감을 고려해, 개인정보보호 당국의 조사를 마치는 즉시 이루다의 DB와 딥러닝 대화 모델을 삭제한다고 밝혔다.

이루다는 작년말 정식 출시된 AI챗봇이다. 이용자와 일상적인 대화를 나누는 기능을 수행한다. 이용자의 질문에 반응할 때 독립적인 문장 단위로 구성된 DB에서 가장 적합하다고 판단한 문장을 선택해 표현한다. 지난주 이 서비스의 이용자들은 이루다의 답변 중 일부가 사람 이름, 장소나 주소, 계좌번호 등을 제시하는 사례를 들며 개인정보 유출 가능성을 제기했다.

스캐터랩 측은 "이루다 DB는 개별적이고 독립적인 문장 단위로 이뤄졌으며 비식별화 절차를 거쳐 개인을 식별할 수 있는 데이터를 포함하지 않고 있다"고 설명했다. 또 "딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, AI는 데이터를 벡터값(문자가 아닌 숫자로 표현된 정보)으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"고 강조했다.

이어 "그러나 이용자들의 불안감을 고려해 이번 AI 이루다의 DB 전량 및 딥러닝 대화 모델을 폐기하기로 했다"고 밝혔다. 딥러닝 AI 모델은 대규모 컴퓨팅 인프라를 사용해야 한다. 학습에 사용한 데이터 규모와 학습을 수행한 기간에 따라 컴퓨팅 인프라를 가동하기 위한 투자 비용이 커진다. 모델 폐기는 AI 스타트업인 스캐터랩의 향후 서비스 출시 일정이나 투자 계획에 큰 영향을 끼칠 수 있는 결정이다.

스캐터랩 측은 "현재 한국인터넷진흥원(KISA) 및 개인정보보호위원회의 조사를 받고 있다"며 "조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행할 방침"이라고 덧붙였다.

스캐터랩은 또 이루다 AI모델 학습 데이터 가운데 '연애의 과학'과 '텍스트앳' 이용자의 동의를 받고 수집한 데이터의 경우 데이터 활용을 원치 않는 이용자들로부터 신청을 받아 해당 데이터를 모두 삭제할 예정이라고 밝혔다. 이용자들이 신청을 통해 삭제한 데이터는 향후 딥러닝 대화 모델에 이용되지 않는다고 설명했다. 이 조치는 각 애플리케이션 내 공지를 통해서도 안내받을 수 있다.

스캐터랩 측은 "향후 신규 가입 및 서비스 이용시 개인정보 수집, 이용 동의 절차를 강화할 계획"이라고 밝혔다.
 

[사진=스캐터랩 제공]