[테크인트렌드] sLLM 전쟁 본격화…'작지만 강한' 국내 스타트업 대거 참전

2024-04-23 06:00
업스테이지 '솔라 미니' AWS 기반 장점…작년 LLM 리더보드서 中·佛 모델 제치고 1위
파수 '엘름' 기존 언어모델에 데이터 관리 노하우 더해…한글 정보처리 차별점
스캐터랩 '핑퐁-1' 일상적 대화 넘어 지식·코딩데이터까지 학습시킨 관계지향형 모델

[그래픽=아주경제 그래픽팀]
 
인공지능(AI) 언어모델에 실용주의 물결이 불고 있다. 지난해 오픈AI의 '챗GPT' 붐으로 초거대언어모델(LLM) 대전이 촉발된 것과 달리 올해는 소형언어모델(sLLM)을 두고 기업 간 경쟁이 치열하다. 메타는 지난해 2월과 7월 일찌감치 각각 '라마'와 '라마2'를 출시했다. 라마 시리즈를 오픈소스로 공개해 sLLM 시장 선점에 들어갔다. 구글은 지난해 말 제미나이를 경량화한 '제미나이 나노'를 출시했고, 올해 2월엔 '젬마'를 공개했다. 챗GPT로 LLM 시장을 석권한 마이크로소프트(MS)도 지난해 말 sLLM '파이2'를 공개했다.

글로벌 빅테크 기업들이 이런 행보를 보이는 이유는 sLLM이 기업간 거래(B2B) 시장에서 AI전환(AX)를 이끌 것이라는 분석이 나와서다. 통상 매개변수 개수가 1000억개 이상이면 LLM, 그 미만이면 sLLM으로 구분한다. 매개변수는 정보를 학습하고 기억하는 뇌의 시냅스와 같은 역할을 한다. 언어모델이 가진 매개변수가 많을수록 성능이 좋다고 평가되지만 그만큼 작업이 복잡하고 방대한 컴퓨팅 자원이 필요하다. 

반면 sLLM은 비교적 단순하고 운영 비용이 저렴하다. 특정 산업에 특화할 수도 있다. sLLM을 미세조정(파인튜닝)해 특정 산업군에 특화하게 만들 수도 있다. 클라우드 방식이 아닌 기업이 자체적으로 인프라를 소유·관리하는 온프레미스 설치가 가능해 보안 안정성도 높다.  

국내 스타트업도 sLLM 시장 경쟁에 대거 참전하고 있다. 업스테이지는 아마존웹서비스(AWS)에 기반한 sLLM '솔라 미니'를 출시했고, 보안 업체인 파수는 자사 보안 서비스와 결합할 수 있는 sLLM '엘름'을 선보였다. AI 챗봇 '이루다'로 유명한 스캐터랩은 감성·대화 능력에 특화한 sLLM '핑퐁-1'을 공개했다. 
 
AWS 기반 '솔라 미니', 리걸·에듀테크 범용성↑
업스테이지와 로앤컴퍼니가 지난달 11일 서울 강남구 로앤컴퍼니 사옥에서 한국 법률 특화 초거대언어모델(LLM) '솔라 리걸(Solar-Legal)' 공동 개발을 위한 업무협약(MOU)을 체결한 뒤 기념촬영을 하고 있다. [사진=로앤컴퍼니]

업스테이지는 지난 3월 솔라 미니를 아마존 세이지메이커 점프스타트·AWS 마켓플레이스 등에 오픈소스로 공개했다. 고객사가 솔라 미니를 미세조정해 자사의 맞춤형 생성 AI 서비스를 만들 수 있게 했다. AWS를 이용하는 세계 모든 기업을 고객사로 삼아 솔라 미니의 생태계를 구축하겠다는 의도다. 실제 솔라 미니 영어 모델은 1000여 개에 달하는 미세조정 모델이 나오기도 했다.

솔라 미니 성능은 글로벌 빅테크 제품군과 비교해도 우수하다고 평가받는다. 지난해 12월 허깅페이스 '오픈 LLM 리더보드'에서 솔라 미니는 중국 알리바바 '큐원'과 프랑스 미스트랄 AI '믹스트랄' 등을 제치고 1위를 차지했다. 번역 부문에선 메타 '플로레스'를, 벤치마크 테스트에서는 오픈AI 'GPT-4', 독일 딥엘 서비스보다 높은 점수를 받았다. 업스테이지는 이 같은 솔라의 기술력이 집약된 논문을 오는 6월 북미전산언어학학회(NAACL)에서 발표할 예정이다. NAACL 2024는 세계 3대 자연어처리학회로 꼽힌다.

업스테이지는 기업에 특화한 언어모델도 출시할 예정이다. 지난 3월엔 리걸테크 스타트업인 로앤컴퍼니와 함께 '솔라-리걸'을 개발하겠다고 밝혔다. 업스테이지의 솔라를 로앤컴퍼니가 보유한 법률·판례 데이터로 미세조정해 우리나라 법률에 특화한 언어모델을 만들겠다는 것이다. 양사는 이를 통해 향후 전 세계 리걸테크 시장을 공략하겠다는 계획을 공유했다. 전 세계 리걸테크 시장은 높은 성장세를 보일 것으로 전망된다. 시장조사기관 비즈니스 리서치 인사이트에 따르면 전 세계 리걸테크 시장 규모는 2021년 약 10조7000억원에서 2027년 약 61조4218억원까지 커질 전망이다. 연평균 성장률이 34%에 달한다.

업스테이지는 에듀테크 산업용 sLLM도 출시했다. 업스테이지는 KT와 에듀테크 기업인 콴다와 함께 수학 교육에 특화한 '매스(MATH)GPT'를 내놓았다. KT 인프라에 콴다의 데이터를 활용해 솔라를 미세조정한 것이다. 그 결과 매스GPT는 벤치마크 테스트에서 챗GPT 성능을 돌파하고, 언어 모델의 수학 능력을 평가하는 매스 벤치마크에서는 챗GPT-4를 능가했다.

업스테이지는 국내 기업들과 다양하게 협업하면서 구축한 생성 AI 개발·사업 노하우에 기반해 해외 진출도 본격화한다는 입장이다. 이를 위한 포석으로 지난 3월 미국에 현지법인인 '업스테이지 AI'를 설립했다. 미국 진출 첫 행보로 엔비디아가 주최한 AI 콘퍼런스 'GTC 2024'에도 참가했다. 업스테이지는 행사 기간에 관람객을 대상으로 솔라 성능·활용 사례를 시연하고, 이활석 최고기술책임자와 이준엽 리더 등 자사 핵심 엔지니어들을 동원해 높은 기술력을 소개하기도 했다.
 
파수, 데이터 관리 노하우 결합 sLLM 공개
조규곤 파수 대표가 지난 3일 서울 여의도 페어몬트호텔에서 열린 연례 고객행사 '파수 디지털 인텔리전스(FDI) 2024'에서 기조연설을 하고 있다. [사진=파수]

데이터·애플리케이션 보안 사업에 치중했던 파수는 올해 초 회사 비전을 'IT(정보기술)를 쉽고 간단하게'에서 'AI를 쉽고 간단하게'로 바꿨다. AX 전문기업으로 변신하겠다고도 선언했다.

변신의 첫 발자국으로 지난달 sLLM인 엘름(Ellm)을 출시했다. 파수는 지난 3일 열린 연례 행사인 '파수 디지털 인텔리전스(FDI) 2024'에서 엘름의 상세 정보를 소개하며, 고객사 AI 활용을 돕는 소프트웨어 기업이 되겠다는 포부를 밝혔다.

조규곤 파수 대표는 이날 기조연설에서 지식경영 문서화와 언어모델 기술력 간 결합이 중요하다고 강조했다. 조 대표는 "이전의 지식경영이 사람의 지식을 문서화하는 데 초점을 맞췄다면 이제는 해당 축이 언어모델로 옮겨가고 있다"며 "지식경영 문서화가 원활하지 않으면 언어모델로 이전은 불가능하다"고 설명했다.

실제 엘름은 기존 언어모델에 파수의 데이터 관리 노하우가 더해졌다는 평가를 받는다. 언어모델 훈련에 활용하는 데이터를 관리함으로써 효율성을 높일 수 있다는 것이다.

엘름은 기존 언어모델과 달리 한글 정보를 처리하는 데 강점을 보인다. 업계 관계자는 "국내 기업들 데이터는 한글이 많은데 기존 언어모델들은 여기에 약점을 보였다"며 "엘름의 강점은 이런 애로사항을 해결하는 데 도움이 될 것"이라 말했다. 

비식별 솔루션을 활용한 점도 눈에 띈다. 기업 문서 중엔 사원 개인정보를 담고 있는 경우가 많다. 엘름은 AI를 활용해 문서 내 개인정보를 탐지하고 이를 식별하지 못하도록 만든다. 개인정보 유출을 사전에 차단하는 것이다.  

파수의 문서 관리 플랫폼 '랩소디'를 사용하는 기업은 엘름과 시너지 효과도 기대할 수 있다. 랩소디는 모든 문서를 중복 없이 암호화·중앙화하는 소프트웨어다. 문서가상화 기술을 기반으로 여러 사용자가 분산 저장해도 하나의 문서로 관리한다. 예를 들어 한 직원이 문서 작업 후 저장하면 다른 직원들이 저장한 파일도 최신 버전으로 자동 동기화한다.

파수 관계자는 "문서를 자동으로 동기화하면 엘름의 훈련 효율성이 많이 늘어날 것"이라 설명했다. 기업 문서를 실시간으로 최신화해 구형 데이터가 훈련 자료로 쓰이는 것을 방지한다는 뜻이다.
 
스캐터랩 "T 아닌 F 같은 언어모델 지향"
스캐터랩이 3일 출시한 AI 스토리 플랫폼 '제타'의 모습 [사진=스캐터랩]

"T(직관형)가 아닌 F(감정형) 같은 언어모델을 지향한다." 스캐터랩은 지난해 11월 자체 개발한 sLLM '핑퐁-1'을 공개하면서 이 같은 출사표를 던졌다. 핑퐁-1의 개발을 맡은 이주홍 스캐터랩 머신러닝 리서치 리드는 "다른 기업이 정확도에 집중한다면 우리는 대화의 '경험'에 집중했다"고 설명했다.

그간 스캐터랩은 일상대화 딥러닝과 같은 AI 기술을 바탕으로 실제 사람처럼 친근한 대화를 나눌 수 있는 '관계지향형' AI 언어모델을 개발해 왔다. 기존 언어모델에 서울 연남동의 좋은 점을 설명하면서 연남동으로 오라고 하면 기존 언어모델은 연남동에 관한 정보를 요약·정리한다. 반면 관계지향형 AI 언어모델은 "연남동에 네가 있어 좋다" 같은 사회성 있고 감성적인 답변을 한다. 

핑퐁-1은 스캐터랩이 보유한 sLLM인 '루다 젠-1'보다 고도화된 모델이다. 파라미터를 몇 배가량 키우고 7배 많은 데이터를 학습시켰다. 일상적인 대화뿐 아니라 일반 지식이나 코딩 데이터 등도 학습시켜 다양한 지식을 갖도록 만들었다.

스캐터랩은 핑퐁-1을 통해 엔터테인먼트·게임·콘텐츠·소셜 커머스 등과 같은 비즈니스를 공략할 계획이다. 고객 관계성이 중요한 분야에서 강점을 발휘하겠다는 의미로 풀이된다. 스캐터랩은 소비자를 공략할 수 있는 감성적인 메시지 작성을 핑퐁-1의 활용 사례라 소개하기도 했다. 

핑퐁-1의 이런 특징은 '제타'에서 직접 확인할 수 있다. 핑퐁-1에 기반한 제타는 스캐터랩이 3일 출시한 AI 스토리 플랫폼이다. 핑퐁-1에 스토리를 초점으로 미세조정한 서비스다. 이용자는 자신이 원하는 대로 AI 캐릭터를 생성해 원하는 방향으로 스토리를 전개할 수 있다. AI와 감성 대화를 넘어 상호작용과 실시간 스토리까지 장착했다는 평가다.

만들고 싶은 캐릭터 이미지·이름·특징 등을 입력하면 스캐터랩 생성 AI가 자연스레 해당 내용을 대화와 스토리에 반영한다. '친구들과 치킨을 먹으러 간다'는 대화를 진행한다면 '치킨집 앞에 도착했다'는 식의 이야기를 이어갈 수 있도록 지시문 소재를 던져주는 방식이다. 스캐터랩은 제타에 대한 국내 시장 반응을 확인한 후 글로벌 진출에 나설 예정이다.

김종윤 스캐터랩 대표는 "변화하는 AI 시대 흐름에 맞게 자신만의 취향을 담은 스토리를 직접 만들어 즐기는 차별화한 경험을 제공하겠다"고 말했다.