업스테이지, NIA와 '한국형 오픈 LLM 리더보드' 구축 나선다

2023-09-05 17:22

[사진=업스테이지]
업스테이지는 한국지능정보사회진흥원(NIA)과 한국형 오픈 거대언어모델(LLM) 리더보드 공동 구축을 통해 국내 AI 생태계 확장에 나선다고 5일 밝혔다.

업스테이지는 이날 NIA와 'AI 허브 데이터 활용 업무협약'을 체결했다. 이번 협약에 따라 업스테이지는 NIA의 인공지능 학습용 데이터 제공 플랫폼인 AI 허브에서 제공하는 다양한 분야의 한국어 데이터를 활용, 국내 AI 산업 생태계의 발전에 기여하기 위해 'Open-Ko LLM 리더보드'를 이달 내 구축할 계획이다.

'Open-Ko LLM 리더보드는 오픈 LLM 모델을 평가하는 허깅페이스 오픈 LLM 리더보드의 한국 버전이다. 한글 기반으로 개발된 LLM들의 성능을 평가하고 순위를 매기는 플랫폼으로 기존의 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지 등 4가지 지표에 NIA와 학계 등 신뢰할 만한 데이터를 기반으로 윤리, 전문가 지식 등 추가 기준을 개설해 모델을 평가한다.

앞서 업스테이지의 생성 AI 모델은 지난 8월 허깅페이스가 운영하는 오픈 LLM 리더보드에서 세계 최고 수준의 성능을 기록하며 1위를 차지한 바 있다. 업스테이지는 이번 NIA와 협력을 통해 공동으로 리더보드를 구축, AI 허브의 데이터를 바탕으로 한국 문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하는 것을 목표로 삼았다. 

NIA는 이번 협력을 통해 업스테이지의 1T 클럽에도 가입해 양질의 데이터를 제공키로 약속했다. 업스테이지의 1T 클럽은 지난달 출범해 텍스트, 책, 기사 등에서 1억 단어 이상의 한국어 데이터를 기여하는 파트너들과 협력하고 있다. 파트너들은 업스테이지가 자체 제작하는 LLM의 API를 할인된 가격에 사용할 수 있으며, LLM의 API 사업으로 창출될 수익을 공유받을 수 있다. 업스테이지는 파트너사들이 제공하는 데이터를 모델의 학습 용도로만 사용하고, 원문 추출이 불가능하도록 보안과 개인정보보호에 만전을 기할 계획이다.

김성훈 업스테이지 대표는 "NIA와의 협약을 통해 한국어 데이터 부족 문제를 해결하고, 국내외 시장에서 경쟁력 있는 인공지능 플랫폼을 제공할 수 있게 됐다"며 "한국형 Open LLM 리더보드를 통해 국내 LLM들의 성능과 혁신성을 증명하고, 인공지능의 발전과 보급에 노력하겠다"고 말했다.

한편 NIA는 AI 허브를 통해 다양한 분야의 데이터를 수집하고 가공하여 인공지능 개발자들에게 무료로 제공하고 있다. NIA는 2025년까지 1300여종의 데이터를 구축할 계획이며, 이를 통해 국내 인공지능 산업의 성장과 활성화에 기여할 예정이다.