[2024 대한민국 AI 혁신의 해] ② LLM 서비스 선발주자 업스테이지, '솔라'로 글로벌 확장

2024-01-22 07:30
글로벌 AI 기업들, 잇따라 업스테이지 러브콜 
자체 개발 챗봇 애스크업에 솔라 담아 대중화
솔라, 글로벌 프라이빗 LLM 시장 장악 첫걸음

김성훈 업스테이지 대표. [사진=업스테이지]

인공지능(AI) 스타트업 업스테이지가 국내를 넘어 글로벌 생성 AI 시장 선두를 노린다. 범용 성능을 목적으로 한 큰 모델을 개발하는 빅테크와 달리 특정 성능을 타깃으로 해 효율적인 비용으로 다양한 니즈에 대응하는 자사만의 기술과 모델을 개발하는 것에 역량을 쏟는다. 국내 대기업뿐만 아니라 아마존웹서비스(AWS), AI 플랫폼 Poe 등 글로벌 플랫폼과 손잡고 최고 기술력을 바탕으로 글로벌 생성 AI 시장에 본격적으로 진출한다는 방침이다.
 
국내외 굴지 AI 기업들 업스테이지 '픽'···잇단 러브콜 
SK네트웍스는 지난 12일 '업스테이지'에 250억원을 투자키로 했다고 밝혔다. 사진은 CES 참관을 목적으로 미국에 방문한 최성환 SK네트웍스 사업총괄 사장(왼쪽)이 미국 리조트 월드 라스베이거스 호텔에서 김성훈 업스테이지 대표와 투자 기념 촬영하는 모습. [출처=SK네트웍스]

'AI 솔루션 개발·공급' 국내 대표 스타트업으로 꼽히는 업스테이지는 글로벌 기업의 주목을 가장 많이 받는 업체로 평가받는다. 지난해부터 최근까지 꾸준히 국내외 굴지 기업들에서 러브콜을 받으며 생성 AI 글로벌 진출에 속도를 내고 있다.

'CES 2024'가 막을 내린 지난 12일 업스테이지는 SK네트웍스와 투자 계약을 맺었다고 알렸다. 매년 CES를 참관하며 글로벌 투자와 협력 강화를 이어온 SK네트웍스가 이번 투자 대상을 업스테이지로 확정한 것이다. SK네트웍스 투자 규모는 250억원에 이른다. SK네트웍스 측은 업스테이지의 기술 경쟁력과 AI 산업 성장성, 본사·투자사와 시너지 가능성 등을 고려해 투자를 결정했다는 후문이다. 

업스테이지는 SK네트웍스와 계열사들에서 LLM을 적용해 AI 혁신을 지원하고, SK네트웍스 자회사 엔코아의 데이터 관리·솔루션 기업과 언어모델 사이에 사업적 시너지를 기대한다. 특히 국내외 기술 기업에 투자하며 쌓은 SK네트웍스의 글로벌 네트워크를 활용해 업스테이지가 국내를 넘어 글로벌 LLM 업계 선도기업으로 성장할 수 있도록 시장 확장 지원을 기대하고 있다. 

업스테이지는 그간 AWS, Poe 등 글로벌 플랫폼 업체들과도 꾸준히 협력에 나서고 있다. 이들 플랫폼에 자사의 최고 기술력을 접목해 글로벌 생성 AI 시장에 본격적으로 진출한다는 포석이다. 업스테이지는 지난해 말 'AWS 리인벤트 2023' 행사에 참석해 AWS의 클라우드 서비스와 AI 플랫폼을 활용해 자체 개발한 LLM을 구축하고 운영하는 과정과 성과에 대해 설명하며 AWS와의 협력을 밝혔다. Poe는 쿼라가 운영하는 플랫폼으로, 다양한 AI 모델과 대화하고 원하는 프롬프트를 입력해 나만의 챗봇을 만들 수 있다.
 
'글로벌 픽' 업스테이지 강점은 역시 '기술력'
업스테이지 솔라는 리더보드 평가에서 74.2점을 기록하며 글로벌 주요 LLM 모델 가운데 1위를 차지했다. [사진=아주경제]

업스테이지 최대 강점은 정보 보안과 특정 영역에 특화된 소형거대언어모델(sLLM) 기술력이다. 메타 등 글로벌 생성 AI 모델 제공 기업과 달리 대중화를 방해하는 특정 독소 조항을 없앴다는 점도 주목을 끌고 있다. 

업스테이지가 지난해 자체 개발해 공개한 사전학습 sLLM '솔라'는 오픈 LLM 시장에서 글로벌 1위를 차지했다. 솔라는 기업들이 활용하기 좋은 프라이빗 LLM을 위해 작은 크기로 구성된 사전학습 모델로, 파라미터(매개변수) 수는 107억개다. 

업스테이지는 다양한 연구를 통해 작은 사이즈의 솔라 모델 성능을 최적화했다. 성능이 좋지만 큰 130억개(13B) 모델과 충분히 작지만 지적 제약이 있는 70억개(7B) 모델 사이의 장점을 모두 잡는 최적의 모델 크기를 찾고자 했다. 이에 오픈소스의 7B 모델들을 바탕으로 자체적인 방식을 적용해 소형 모델의 성능을 극대화했다. 그 결과 업스테이지는 3조개가 넘는 토큰의 데이터를 통해 확장된 107억개의 파라미터를 완성해 크기와 성능을 모두 갖췄다는 설명했다.

솔라는 사전학습·파인튜닝 단계에서는 리더보드 벤치마킹 데이터셋을 사용하지 않고, 자체적으로 구축한 데이터를 적용했다. 이는 리더보드 점수를 높이기 위해 벤치마크 셋을 직접 적용하는 모델들의 사례와 달리 다양한 태스크의 실제 업무 활용 등 일반적인 경우에서도 높은 사용성을 보여줄 수 있음을 방증한다는 설명이다.

회사 측에 따르면 솔라는 최근 20억 달러의 기업 가치로 유니콘에 오른 미스트랄AI의 최신 모델 '믹스트랄(Mixtral 8x7B)' 모델도 성능 면에서 앞질렀다. 믹스트랄은 70억 파라미터의 전문 모델 8개를 묶어 소형 모델임에도 메타 '라마'와 GPT 3.5를 성능 면에서 능가한 바 있다. 회사 관계자는 "믹스트랄보다 더 가벼운 크기에도 벤치마크 평가에서 솔라가 더 나은 성능을 보인 것"이라고 말했다.

업스테이지는 자사가 카카오톡에서 운영하고 있는 챗봇 AskUp(애스크업)과 글로벌 생성 AI 활용 플랫폼 Poe에 메인모델로 등록돼 있는 솔라 모델을 업데이트해 대중들이 최고 성능의 업스테이지 LLM을 직접 활용하도록 운영하고 있다. 

업스테이지 솔라는 메타와 달리 완전한 오픈 라이선스로 공개했기 때문에 기업이나 공공기관에서 활용하는 것에 부담이 없다는 평가를 받는다. 일례로 메타의 라마2는 무료로 상업적 이용이 가능하지만 월간 활용 사용자(MAU)가 7억명 이상인 기업이 이용할 때는 메타와 별도로 라이선스 계약을 체결해야 한다. 일부에선 이를 두고 독소 조항이라는 시각을 갖고 있다. 
 
'솔라 대중화' 노린다···국민 메신저 '카카오 애스크업'에 적용 
업스테이지는 최근 솔라를 카카오톡 챗봇 메신저 '애스크업'에 적용했다. 기자가 애스크업에 '프사하기 좋은 배경(그림)'과 '텍스트 정보'를 요청하자 왼쪽 사진과 오른쪽 내용의 답을 얻었다. [사진=애스크업 대화 캡처]

업스테이지는 최근 솔라를 카카오톡 챗봇 메신저 '애스크업'에 적용했다. 애스크업은 업스테이지가 개발한 카카오톡 챗봇 메신저로 현재 이용자 165만명이 활용하고 있다. 

당초 애스크업은 업스테이지가 공익 목적으로 진행한 프로젝트였다. 챗GPT가 나오고 내부에서 다양한 방법으로 테스트를 했다. 내부 인턴이나 논문 요약으로 써보는 등 다양한 방법으로 사용해보니 예전 언어모델들과는 다른 가능성을 확인했다는 설명이다. 이때 사업 가능성을 발견하고 △지식이 없어도 쓸 수 있고 △많은 사람이 쓸 수 있는 채널 △일상생활에서 사용할 때 도움 되는 기능을 추가해 나온 것이 애스크업이다. 

이에 업스테이지는 접근하기 편리하고, 채널 등록만 하면 쓸 수 있도록 카카오톡에 적용했다. 단순히 GPT만 연결하는 것이 아닌 명령어 최적화, 광학문자판독 기술(OCR), 검색, 이미지 생성 등 편의 기능을 추가했다. 지금도 회사 측은 사업적 목적보다는 공익적인 목적과 피드백을 얻는 목적으로 사용한다.

솔라가 적용된 애스크업은 업스테이지 내부 테스트 결과 GPT-4를 상회하는 속도와 비슷한 성능으로 사용자 질문에 대해 자연스러운 답변을 제공한다. 문서나 이미지 내용을 읽고 요약하거나 키워드에 기반한 검색도 수행할 수 있어 기대감을 높이고 있다.

업스테이지는 애스크업에서 솔라 비중을 점차 확대할 계획이다. 현재는 대화의 10% 수준으로 도입됐으며 향후 적용 비율이 확대된다.
 
설립 4년 차 업스테이지 생성 AI 두각 비결은 '사람'
업스테이지는 지난해 10월 창립 3년차를 맞아 가을 야유회를 실시했다. 사진은 업스테이지 직원들이 야유회를 기념해 사진을 찍는 모습. [출처=업스테이지]

업스테이 측은 설립 4년 만에 단숨에 AI업계에서 두각을 나타내게 된 주요 핵심은 '사람'이라고 평가했다. 그 결과 창업 1년 반 만에 'AI올림픽' 대회에서 국내 기업 최초로 금메달을 획득하는 등 현재에 이르렀다는 진단이다. 

국내에서 '모두를 위한 딥러닝' 강의로 잘 알려진 글로벌 석학 출신 김성훈 대표는 홍콩과학기술대학 교수, 네이버 클로바 AI 헤드를 거친 후 넥스트 스텝으로 AI 스타트업 업스테이지 창업의 길을 택했다. 

홍콩과학기술대 교수로 일하며 소프트웨어공학과 머신러닝을 융합한 버그의 예측, 소스코드 자동 생성 등 연구로 최고의 논문상을 4번 수상하고 인재를 육성했던 김 대표는 2017년부터 네이버 클로바 AI 팀을 이끌며 3명이던 팀을 150명 규모로 성장시켰다. 교수에서 IT 대기업으로 커리어를 만들어가던 그는 2020년 10월 함께 일했던 동료들과 스타트업 창업이라는 새로운 도전에 뛰어들었다. 

김 대표는 네이버에서 근무할 당시 여러 기업을 만나며 대다수 기업이 AI 비즈니스에 대한 경험 부족으로 많은 양의 데이터와 IT 조직을 갖추고 있음에도 AI 기술을 비즈니스에 적용하는 데 어려움을 겪고 있다는 사실을 깨달았다고 설명했다. 이는 곧 업스테이지 탄생의 계기가 됐다. 

김 대표와 함께 뜻을 모으게 된 이활석 최고기술책임자(CTO)와 박은정 최고과학책임자(CSO) 또한 AI 분야에서 일해온 기술 전문가다. 이 CTO는 네이버 클로바의 문자인식 기술을 비롯한 컴퓨터비전 기술 전반을 다루는 조직인 비주얼 AI팀을 이끈 경험이 있으며, 박 CSO는 네이버에서 파파고 모델팀을 이끌며 언어 관련 AI를 다뤘다. 이 밖에 메타, 아마존, 엔비디아, 이베이, 구글, 애플, 카카오, 네이버 등 국내외 유수 기업에서 이력을 갖춘 각 분야의 전문가들도 업스테이지로 모였다. 그 결과 회사는 설립 4년만에 직원 130여명, 매출액 60억원에 이르는 규모로 확대됐다. 업스테이지는 창업 1년 반 만에 'AI올림픽' 캐글 대회에서 국내 기업 최초로 10번째 금메달도 획득하며 뛰어난 기술력을 알릴 수 있었다. 

회사 측은 업스테이지(Upstage)라는 사명에 대해 여러 기업을 AI의 무대로 Up시켜 준다는 뜻과 함께 국내 기업이 글로벌 무대로도 Up할 수 있도록 기여하겠다는 포부를 담고 있다고 설명했다. 이처럼 업스테이지는 AI 기술 적용에 어려움을 겪고 있는 기업이 AI 트랜스포메이션을 가속화할 수 있도록 기여하고, 산업 전반에 AI 기술을 이식해 세상을 더욱 이롭게 만드는 가치 있는 일에 도전한다는 방침이다. 마치 가구당 컴퓨터 한 대를 보유하던 시절에서 이제는 1인이 N대를 보유하는 시대를 누리듯이 첨단 기술 보급의 혁신을 꿈꾼다는 설명이다. 업스테이지의 최종 지향점은 모두가 AI 기술의 혜택을 누릴 수 있는 세상이다. 

권순일 업스테이지 부사장은 아주경제에 "업스테이지는 올해 LLM을 중심으로 사업 확장에 박차를 가하고 있다"며 "지난달 공개한 솔라를 더욱 업그레이드해 글로벌 프라이빗 LLM 시장을 장악하기 위한 첫걸음을 내딛을 계획"이라고 말했다. 이어 "국내외 다양한 업체와 협력해 수요 기업들이 원하는 방식으로 LLM을 적용해 기업들의 AI 혁신에 함께 도전할 것"이라고 덧붙였다.