네이버클라우드는 초대규모 인공지능(AI) '하이퍼클로바X'의 '기술 보고서'를 4일 공개했다. 이번 보고서는 학습 방법이나 성능 등 AI 모델의 세부 정보를 소개하는 논문이다. 구글과 오픈AI 등 세계적인 빅테크 기업들도 기술 보고서를 통해 자사의 AI를 설명하고 있다.
네이버 기술 보고서를 보면 하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 모델보다 더 높은 종합 점수를 받았다. 한국어·일반상식·수학·코딩 부문에서는 14개 모델 중 1위를 기록했다.
다국어 능력도 인정받았다. 일본어·아랍어·힌디어·베트남어를 비롯한 아시아 언어 능력을 평가할 때 하이퍼클로바X는 9개의 주요 모델 가운데 가장 높은 점수를 받았다. 중국어는 2위를 기록했다.
번역 능력도 호평을 받았다. 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 10개의 번역 모델 사이에서 1위를 차지했다. 영어를 한국어로 번역하는 정확도 역시 가장 높은 점수를 받았다.
유강민 네이버클라우드 리더는 "이번 실험은 지역과 문화권 특화 목적으로 개발한 AI가 해당국의 언어 외에도 여러 언어에서 일정 수준을 갖출 수 있다는 것을 보여줬다"고 말했다. 이어 "특정 문화권에 더 적합한 배경지식과 함께 다국어 능력까지 보유해 독립적인 AI 가능성을 증명했다"고 강조했다.
보고서는 하이퍼클로바X의 안전성을 위한 노력도 소개했다. '사회적 이슈와 편향', '불법적 행동' 등 민감하거나 위험한 주제에 관해 데이터를 수집하고, 이를 기반으로 레드티밍(red-teaming)을 수행해 취약점을 보완했다. 레드티밍은 기술 또는 서비스 취약점을 발견하고 검증하기 위해 의도적으로 공격을 시도하는 활동이다.
하이퍼클로바X 윤리 원칙에 기반해 혐오나 편향, 저작권 침해, 개인정보 같은 콘텐츠는 생성하지 않도록 꾸준히 개선하고 있다고도 밝혔다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "이번 보고서는 하이퍼클로바X 성능 경쟁력을 입증했다"면서 "하이퍼클로바X 구축 경험을 활용해 다양한 지역·국가의 특화 초대규모 AI를 만드는 데도 적극적으로 나설 것"이라 말했다.