네카오 DB 토대로 욕설·비속어 잡아낸다…KISO, 이용자보호시스템 정식 공개
2023-06-19 13:41
특수문자, 숫자 등이 포함돼 변형된 형태의 욕설·비속어도 잡아내
자체 DB 구축 여력 없는 중소업체 및 공공기관에 무상 제공 계획
자체 DB 구축 여력 없는 중소업체 및 공공기관에 무상 제공 계획
KSS는 다양한 온라인 플랫폼에서 이용자가 작성한 게시물과 댓글 등에 욕설·비속어가 포함돼 있으면 데이터 분석을 통해 자동으로 탐지하고, 치환이 필요한 단어를 실시간으로 알려 주는 응용프로그램 인터페이스(API) 서비스다.
KSS는 국내 주요 포털인 네이버와 카카오가 수집한 약 60만 건의 방대한 욕설 데이터베이스(DB)를 바탕으로 개발됐다. 네이버와 카카오는 사회적 책임(ESG) 활동의 일환으로 수년간 축적한 DB를 KISO에 무상으로 공여하면서 사회적 활용을 요청했다. 이에 따라 KISO는 양사의 욕설 DB를 통합해 자체 DB 수집이 어려운 인터넷 사업자들이 이를 활용할 수 있도록 KSS를 개발했다.
KSS는 데이터 분석을 통해 욕설 여부를 판단하며 DB에 포함된 단어의 경우 변형 욕설도 탐지가 가능하도록 설계됐다. 60만 건의 DB에는 다양한 형태의 변형 욕설‧비속어도 포함돼 특수문자, 숫자 등이 포함된 혼합 형태의 단어들도 치환할 수 있다.
KISO 관계자는 "KSS는 포털 회원사의 지속적인 DB 제공으로 최신의 상태로 업데이트해 신종 욕설·비속어에도 대응할 수 있다는 강점이 있다"라며 "이용하는 기업은 KISO의 기술적 보호조치를 활용함으로써 비윤리적 표현 등 부적절한 단어를 걸러내지 못해 발생하는 이용자 불만에 공동으로 대응할 수 있어 서비스 관리에도 이점이 있다"고 말했다.
그러면서 "이와 같은 방대한 DB를 최신으로 유지하고 이용하는 데 드는 비용이 직접 유사 서비스를 개발하고 유지하는 것과 비교할 수 없을 정도로 저렴하다는 것이 큰 장점"이라고 강조했다.
기존에도 욕설을 필터링해주는 시스템은 있었다. 그러나 중소 규모 인터넷 사업자는 자체적으로 DB를 만들고 유지·관리하는 데 많은 비용이 들어 현실적으로 자체 시스템 구축이 어려웠다. KISO는 깨끗한 온라인 환경을 조성하기 위해 독자적인 필터링 개발 여력이 없는 기업과 공공기관 등에 KSS를 무상으로 배포할 방침이다.
앞서 KISO는 베타테스트를 통해 서비스 안정성과 최대 용량 검증 등을 거쳐 정식 출시 전 기능 점검을 마쳤다. 지난해 12월부터 올해 5월 말까지 약 6개월간 진행된 베타테스트에서는 약 1080만 건의 게시글에서 16만 건의 욕설‧비속어를 걸러냈다. 해당 베타테스트에는 공공기관을 비롯해 인공지능(AI), 온라인 커뮤니티, 패션, 부동산, 금융 등 다양한 온라인 플랫폼 운영 업체 47곳이 참여했다.
KISO 관계자는 "대형 포털이 오랜 기간 고객 응대를 하며 수집해 온 방대한 DB를 다양한 인터넷 서비스에 쉽게 활용할 수 있도록 개발했다"며 "KSS를 이용하면 사업자가 자체적으로 필터할 단어 리스트를 만들고 유지하는 수고를 덜 수 있고 평판도 개선될 것"이라고 말했다.
KSS는 각 커뮤니티나 게시판 성격에 맞게 일부 단어를 추가‧제외할 수 있도록 설계했다. 향후 DB 분류 기준을 세분화하고 다양한 DB를 추가‧확대해 나갈 계획이다. 이재신 KISO 자율규제DB위원회 위원장(중앙대 미디어커뮤니케이션학부 교수)은 "KSS는 누구나 쉽게 접근할 수 있고 활용할 수 있도록 개발됐다"라며 "이용자의 권리가 보호되는 건강한 커뮤니케이션 환경을 조성하기 위해 더욱 노력할 것"이라고 강조했다.