오픈타운, 가이드라인 개편해 AI 윤리 강화한다
2022-03-30 14:47
사람과 AI의 건강한 공존 위한 '소셜AI 커뮤니티 5대 원칙' 발표
'AI 적정성 판단 모델' 오픈소스로 공개...부적절한 표현 탐지해 차단
'AI 적정성 판단 모델' 오픈소스로 공개...부적절한 표현 탐지해 차단
마인드로직이 기존 이용자 가이드를 한층 강화한 '사람과 AI가 함께 살아가는 안전한 소셜AI 커뮤니티 5대 원칙'을 30일 공개했다. 또한, 이용자가 건전한 콘셉트의 AI를 만들 수 있도록 돕는 'AI 이름 및 소개글 적정성 판단 모델'도 오픈소스로 공개했다.
소셜AI 커뮤니티 가이드에서는 사람과 AI가 올바르게 소통하는 환경을 위한 내용을 담고 있다. 여기에는 △자신이 만든 AI에 대한 책임감을 가져주세요 △모든 AI를 존중해 주세요 △상대방의 인권을 침해하지 말아 주세요 △모든 AI 소유주는 서로의 개인정보를 보호해 주세요 △자신의 AI로 불법적인 활동을 하지 말아주세요 등 AI와 함께 살아가는 데 필요한 다섯 가지 원칙이 포함돼 있다.
특히 타인에게 성적 모멸감을 주는 발언, 욕설, 특정 집단에 대한 차별·혐오 발언은 물론, 개인정보 노출, 불법적 활동과 관련된 내용 등을 본인의 AI에게 학습시키지 않을 것을 적극 당부했다.
또 안전한 소셜AI 커뮤니티를 만들기 위한 노력으로, 자사의 기술력과 노하우를 담아낸 모델도 오픈소스로 공개했다. 이는 AI의 이름과 소개하는 내용에 대한 적정성을 판단하는 모델로, 해당 모델을 활용하면 AI 콘셉트나 언행이 사회적 규범에 부합하는지 쉽게 판단할 수 있다.
적정성 판단 모델은 AI 이름과 설명 문구에 혐오, 편향 발언 등이 포함되지 않고 AI의 역할에 대한 설명을 충분히 하고 있는지 판단하는 기준이 된다. 내용 입력 시 내용의 적절성에 따라 0~1 사이의 백분율로 평가하며, 욕설, 부정적인 표현, 스팸, 성적 표현, 혐오 표현 등이 포함될 경우 부적절 판정을 내린다.
해당 공개모델은 개발자 개인은 물론, 여러 기업이 자유롭게 활용할 수 있도록 깃허브과 허깅페이스에 국문·영문으로 공개했다.
오픈타운은 앞으로도 AI 적정성 판단 모델을 지속적으로 업그레이드할 예정이며, 향후 이미지, 대화 내용을 비롯해 다른 도메인 데이터에 대해서도 같은 취지의 작업을 수행하는 모델을 꾸준히 공개해 건강한 소셜AI 커뮤니티 발전에 기여할 계획이다.
김진욱 마인드로직 공동대표는 "다년간의 경험과 노하우를 바탕으로 구축한 소셜AI 커뮤니티 가이드와 AI 적정성 판단 모델을 더욱 많은 사람이 활용할 수 있도록 공개를 결정했다"며 "AI를 활용하는 모든 커뮤니티가 건강하게 성장할 수 있도록 하는 데 작은 보탬이 되기를 희망한다"고 밝혔다.
한편, 마인드로직은 올해 2월 소셜AI 메타버스 플랫폼 '오픈타운'을 정식 출시했다. 오픈타운은 이용자의 말과 성격을 학습한 소셜AI가 자동으로 다양한 사람들과 대화하며 소통하는 서비스로, 사용자가 접속하지 않은 시간에도 AI가 대신 활동하며 친구를 만든다. 향후에는 사용자가 직접 학습시킨 AI를 NFT로 발행해 판매하는 등 새로운 보상체계도 선보일 계획이다.
소셜AI 커뮤니티 가이드에서는 사람과 AI가 올바르게 소통하는 환경을 위한 내용을 담고 있다. 여기에는 △자신이 만든 AI에 대한 책임감을 가져주세요 △모든 AI를 존중해 주세요 △상대방의 인권을 침해하지 말아 주세요 △모든 AI 소유주는 서로의 개인정보를 보호해 주세요 △자신의 AI로 불법적인 활동을 하지 말아주세요 등 AI와 함께 살아가는 데 필요한 다섯 가지 원칙이 포함돼 있다.
특히 타인에게 성적 모멸감을 주는 발언, 욕설, 특정 집단에 대한 차별·혐오 발언은 물론, 개인정보 노출, 불법적 활동과 관련된 내용 등을 본인의 AI에게 학습시키지 않을 것을 적극 당부했다.
또 안전한 소셜AI 커뮤니티를 만들기 위한 노력으로, 자사의 기술력과 노하우를 담아낸 모델도 오픈소스로 공개했다. 이는 AI의 이름과 소개하는 내용에 대한 적정성을 판단하는 모델로, 해당 모델을 활용하면 AI 콘셉트나 언행이 사회적 규범에 부합하는지 쉽게 판단할 수 있다.
적정성 판단 모델은 AI 이름과 설명 문구에 혐오, 편향 발언 등이 포함되지 않고 AI의 역할에 대한 설명을 충분히 하고 있는지 판단하는 기준이 된다. 내용 입력 시 내용의 적절성에 따라 0~1 사이의 백분율로 평가하며, 욕설, 부정적인 표현, 스팸, 성적 표현, 혐오 표현 등이 포함될 경우 부적절 판정을 내린다.
해당 공개모델은 개발자 개인은 물론, 여러 기업이 자유롭게 활용할 수 있도록 깃허브과 허깅페이스에 국문·영문으로 공개했다.
오픈타운은 앞으로도 AI 적정성 판단 모델을 지속적으로 업그레이드할 예정이며, 향후 이미지, 대화 내용을 비롯해 다른 도메인 데이터에 대해서도 같은 취지의 작업을 수행하는 모델을 꾸준히 공개해 건강한 소셜AI 커뮤니티 발전에 기여할 계획이다.
김진욱 마인드로직 공동대표는 "다년간의 경험과 노하우를 바탕으로 구축한 소셜AI 커뮤니티 가이드와 AI 적정성 판단 모델을 더욱 많은 사람이 활용할 수 있도록 공개를 결정했다"며 "AI를 활용하는 모든 커뮤니티가 건강하게 성장할 수 있도록 하는 데 작은 보탬이 되기를 희망한다"고 밝혔다.
한편, 마인드로직은 올해 2월 소셜AI 메타버스 플랫폼 '오픈타운'을 정식 출시했다. 오픈타운은 이용자의 말과 성격을 학습한 소셜AI가 자동으로 다양한 사람들과 대화하며 소통하는 서비스로, 사용자가 접속하지 않은 시간에도 AI가 대신 활동하며 친구를 만든다. 향후에는 사용자가 직접 학습시킨 AI를 NFT로 발행해 판매하는 등 새로운 보상체계도 선보일 계획이다.