인공지능(AI) 챗봇 '이루다' 개발사인 스캐터랩이 챗봇 개발을 위해 다른 앱 이용자들의 대화를 부적절하게 수집했다는 의혹이 제기됐다. 스캐터랩 전(前) 직원은 "연인들의 카톡 대화를 돌려보며 웃는 사람들도 있었다"고 폭로했다.
스캐터랩 전 직원 A씨는 12일 연합뉴스에 "연인들 사이에 성관계 관련 대화를 나눈 데이터(대화 로그)가 있었는데, 한 개발자가 회사 전체 대화방에 'ㅋㅋ'하면서 캡처를 공유했다"고 말했다.
A씨가 언급한 내용은 스캐터랩이 지난 2016년 출시한 '연애의 과학' 앱에서 이뤄진 '이용자 간 대화'를 말한다. 연애의 과학은 연인 또는 호감 가는 사람과 나눈 카톡 대화를 집어넣고 2000~5000원 정도를 결제하면 답장 시간과 대화 패턴을 분석해 애정도 수치를 보여주는 앱이다.
스캐터랩은 이용자들이 연애의 과학 앱에 집어넣은 카톡 대화를 데이터 삼아 이루다를 개발했다. 스캐터랩은 대화 양이 약 100억건에 달한다고 밝힌 바 있다.
개발자가 연인 간 대화를 공유한 대화방에는 스캐터랩 직원 50여명이 전부 있었다고 A씨는 전했다. A씨는 "한 명이 두 번 정도 (연인 간의 성적 대화를) 공유했던 것으로 기억한다"고 설명했다. 이 대화방에는 김종윤 스캐터랩 대표 등 관리자급 직원들이 있었지만, 특별히 제재하지 않았다고 A씨는 덧붙였다.
이같은 논란에 스캐터랩은 진상 조사를 통해 사실로 드러날 경우, 관련자에게 책임을 물을 것이라고 밝혔다. 스캐터랩은 12일 보도자료에서 "이루다는 연애의 과학 텍스트 데이터를 기반으로 학습을 진행한 것이 맞다"고 인정했다. 다만, 학습에 사용하는 데이터는 발화자의 이름 등 개인 정보가 삭제된 상태였다고 해명했다.
또 연애의 과학으로 수집한 카톡 대화 약 100억건 중 이루다에 쓸 만한 문장 1억건을 추려 별도 DB를 만들었으며, 1억개 문장은 익명화를 거쳐 독립적인 형태로 저장해 이루다 발언을 조합해 개인을 특정할 수 없다고 설명했다.
그러나 스캐터랩은 "개별 문장 단위 대화 내용의 실명, 영문, 숫자 등의 정보는 알고리즘과 필터링으로 삭제했는데, 문맥에 따라 인물 이름이 남아있는 등의 부분이 발생했다"며 "더욱 세심히 주의를 기울이지 못했다"고 고개를 숙였다.
한편, 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩이 개인정보보호법을 어겼는지 조사할 방침이라고 밝혔다. 또 연애의 과학 이용자들은 스캐터랩이 카톡 대화를 수집하면서 이루다 같은 챗봇 개발에 쓴다고 명확히 알리지 않았고, 익명 처리도 제대로 하지 않았다면서 집단소송을 추진하고 있다.
스캐터랩 전 직원 A씨는 12일 연합뉴스에 "연인들 사이에 성관계 관련 대화를 나눈 데이터(대화 로그)가 있었는데, 한 개발자가 회사 전체 대화방에 'ㅋㅋ'하면서 캡처를 공유했다"고 말했다.
A씨가 언급한 내용은 스캐터랩이 지난 2016년 출시한 '연애의 과학' 앱에서 이뤄진 '이용자 간 대화'를 말한다. 연애의 과학은 연인 또는 호감 가는 사람과 나눈 카톡 대화를 집어넣고 2000~5000원 정도를 결제하면 답장 시간과 대화 패턴을 분석해 애정도 수치를 보여주는 앱이다.
스캐터랩은 이용자들이 연애의 과학 앱에 집어넣은 카톡 대화를 데이터 삼아 이루다를 개발했다. 스캐터랩은 대화 양이 약 100억건에 달한다고 밝힌 바 있다.
이같은 논란에 스캐터랩은 진상 조사를 통해 사실로 드러날 경우, 관련자에게 책임을 물을 것이라고 밝혔다. 스캐터랩은 12일 보도자료에서 "이루다는 연애의 과학 텍스트 데이터를 기반으로 학습을 진행한 것이 맞다"고 인정했다. 다만, 학습에 사용하는 데이터는 발화자의 이름 등 개인 정보가 삭제된 상태였다고 해명했다.
또 연애의 과학으로 수집한 카톡 대화 약 100억건 중 이루다에 쓸 만한 문장 1억건을 추려 별도 DB를 만들었으며, 1억개 문장은 익명화를 거쳐 독립적인 형태로 저장해 이루다 발언을 조합해 개인을 특정할 수 없다고 설명했다.
그러나 스캐터랩은 "개별 문장 단위 대화 내용의 실명, 영문, 숫자 등의 정보는 알고리즘과 필터링으로 삭제했는데, 문맥에 따라 인물 이름이 남아있는 등의 부분이 발생했다"며 "더욱 세심히 주의를 기울이지 못했다"고 고개를 숙였다.
한편, 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩이 개인정보보호법을 어겼는지 조사할 방침이라고 밝혔다. 또 연애의 과학 이용자들은 스캐터랩이 카톡 대화를 수집하면서 이루다 같은 챗봇 개발에 쓴다고 명확히 알리지 않았고, 익명 처리도 제대로 하지 않았다면서 집단소송을 추진하고 있다.