업스테이지, AWS 기반 소형언어모델 솔라 미니 출시
2024-03-21 10:09
솔라 미니는 아마존 세이지메이커 점프스타트와 AWS 마켓프레이스를 통해 이용할 수 있다. 업스테이지 고객들은 메타버스 엔터테인먼트, 쿼라, 커넥트웨이브, 콴다 등 국내·외 기업에서 이미 사용하는 도메인별 학습 데이터를 사용해 솔라 미니를 미세조정할 수도 있다.
윤정원 AWS코리아 공공부문 대표는 "AWS상에 구축된 업스테이지의 솔라 미니는 모든 규모의 기업이 다양한 지역의 요구사항에 따라 생성 AI를 쉽게 도입할 수 있도록 지원하는 sLLM"이라고 소개했다. 이어 "언어 모델은 빠르게 진화하고 있으며 이러한 혁신의 최전선에는 AWS가 있다"며 "업스테이지는 이를 통해 AI 제품을 확장하고 다양한 산업에 생생 AI를 애플리케이션에 쉽게 배포할 수 있는 도구를 제공한다"고 말했다.
언어 모델은 문맥 이해·문장 생성 기능과 메모리 기능을 제공해 생성 AI 서비스를 가능케한다. sLLM은 수천억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)을 경량화한 것으로 200억 개 미만의 파라미터를 사용한다. 솔라 미니는 107억 개의 파라미터로 더 작은 언어모델로 추론 과정의 비용을 더 낮출 수 있다.
업스테이지는 솔라 미니를 학습시키기 위해 AWS를 선택했다. 업스테이지 측은 AWS의 우수한 컴퓨팅 성능과 비용 효율성을 고려했다고 설명했다. 또 한국어에 특화된 LLM 개발을 위해 머신러닝 모델 개발과 배포 서비스인 아마존 세이지메이커를 활용했으며 업스테이지가 설립한 1조 토큰 클럽에서 제공한 데이터도 사용했다.
업스테이지 측은 이 과정에서 고급 데이터 전처리와 검색 증강 생성 등의 미세 조정 기술도 사용했다고 밝혔다. 이를 통해 인공지능(AI)이 주어진 데이터나 맥락에 근거하지 않은 잘못된 정보나 허위 정보를 생성하는 것을 의미하는 이른바 'AI 할루시네이션'을 방지한다는 것이다.