글로벌 빅테크 기업들이 이런 행보를 보이는 이유는 sLLM이 기업간 거래(B2B) 시장에서 AI전환(AX)를 이끌 것이라는 분석이 나와서다. 통상 매개변수 개수가 1000억개 이상이면 LLM, 그 미만이면 sLLM으로 구분한다. 매개변수는 정보를 학습하고 기억하는 뇌의 시냅스와 같은 역할을 한다. 언어모델이 가진 매개변수가 많을수록 성능이 좋다고 평가되지만 그만큼 작업이 복잡하고 방대한 컴퓨팅 자원이 필요하다.
반면 sLLM은 비교적 단순하고 운영 비용이 저렴하다. 특정 산업에 특화할 수도 있다. sLLM을 미세조정(파인튜닝)해 특정 산업군에 특화하게 만들 수도 있다. 클라우드 방식이 아닌 기업이 자체적으로 인프라를 소유·관리하는 온프레미스 설치가 가능해 보안 안정성도 높다.
국내 스타트업도 sLLM 시장 경쟁에 대거 참전하고 있다. 업스테이지는 아마존웹서비스(AWS)에 기반한 sLLM '솔라 미니'를 출시했고, 보안 업체인 파수는 자사 보안 서비스와 결합할 수 있는 sLLM '엘름'을 선보였다. AI 챗봇 '이루다'로 유명한 스캐터랩은 감성·대화 능력에 특화한 sLLM '핑퐁-1'을 공개했다.
AWS 기반 '솔라 미니', 리걸·에듀테크 범용성↑
솔라 미니 성능은 글로벌 빅테크 제품군과 비교해도 우수하다고 평가받는다. 지난해 12월 허깅페이스 '오픈 LLM 리더보드'에서 솔라 미니는 중국 알리바바 '큐원'과 프랑스 미스트랄 AI '믹스트랄' 등을 제치고 1위를 차지했다. 번역 부문에선 메타 '플로레스'를, 벤치마크 테스트에서는 오픈AI 'GPT-4', 독일 딥엘 서비스보다 높은 점수를 받았다. 업스테이지는 이 같은 솔라의 기술력이 집약된 논문을 오는 6월 북미전산언어학학회(NAACL)에서 발표할 예정이다. NAACL 2024는 세계 3대 자연어처리학회로 꼽힌다.
업스테이지는 기업에 특화한 언어모델도 출시할 예정이다. 지난 3월엔 리걸테크 스타트업인 로앤컴퍼니와 함께 '솔라-리걸'을 개발하겠다고 밝혔다. 업스테이지의 솔라를 로앤컴퍼니가 보유한 법률·판례 데이터로 미세조정해 우리나라 법률에 특화한 언어모델을 만들겠다는 것이다. 양사는 이를 통해 향후 전 세계 리걸테크 시장을 공략하겠다는 계획을 공유했다. 전 세계 리걸테크 시장은 높은 성장세를 보일 것으로 전망된다. 시장조사기관 비즈니스 리서치 인사이트에 따르면 전 세계 리걸테크 시장 규모는 2021년 약 10조7000억원에서 2027년 약 61조4218억원까지 커질 전망이다. 연평균 성장률이 34%에 달한다.
업스테이지는 에듀테크 산업용 sLLM도 출시했다. 업스테이지는 KT와 에듀테크 기업인 콴다와 함께 수학 교육에 특화한 '매스(MATH)GPT'를 내놓았다. KT 인프라에 콴다의 데이터를 활용해 솔라를 미세조정한 것이다. 그 결과 매스GPT는 벤치마크 테스트에서 챗GPT 성능을 돌파하고, 언어 모델의 수학 능력을 평가하는 매스 벤치마크에서는 챗GPT-4를 능가했다.
업스테이지는 국내 기업들과 다양하게 협업하면서 구축한 생성 AI 개발·사업 노하우에 기반해 해외 진출도 본격화한다는 입장이다. 이를 위한 포석으로 지난 3월 미국에 현지법인인 '업스테이지 AI'를 설립했다. 미국 진출 첫 행보로 엔비디아가 주최한 AI 콘퍼런스 'GTC 2024'에도 참가했다. 업스테이지는 행사 기간에 관람객을 대상으로 솔라 성능·활용 사례를 시연하고, 이활석 최고기술책임자와 이준엽 리더 등 자사 핵심 엔지니어들을 동원해 높은 기술력을 소개하기도 했다.
파수, 데이터 관리 노하우 결합 sLLM 공개
데이터·애플리케이션 보안 사업에 치중했던 파수는 올해 초 회사 비전을 'IT(정보기술)를 쉽고 간단하게'에서 'AI를 쉽고 간단하게'로 바꿨다. AX 전문기업으로 변신하겠다고도 선언했다.
변신의 첫 발자국으로 지난달 sLLM인 엘름(Ellm)을 출시했다. 파수는 지난 3일 열린 연례 행사인 '파수 디지털 인텔리전스(FDI) 2024'에서 엘름의 상세 정보를 소개하며, 고객사 AI 활용을 돕는 소프트웨어 기업이 되겠다는 포부를 밝혔다.
조규곤 파수 대표는 이날 기조연설에서 지식경영 문서화와 언어모델 기술력 간 결합이 중요하다고 강조했다. 조 대표는 "이전의 지식경영이 사람의 지식을 문서화하는 데 초점을 맞췄다면 이제는 해당 축이 언어모델로 옮겨가고 있다"며 "지식경영 문서화가 원활하지 않으면 언어모델로 이전은 불가능하다"고 설명했다.
실제 엘름은 기존 언어모델에 파수의 데이터 관리 노하우가 더해졌다는 평가를 받는다. 언어모델 훈련에 활용하는 데이터를 관리함으로써 효율성을 높일 수 있다는 것이다.
엘름은 기존 언어모델과 달리 한글 정보를 처리하는 데 강점을 보인다. 업계 관계자는 "국내 기업들 데이터는 한글이 많은데 기존 언어모델들은 여기에 약점을 보였다"며 "엘름의 강점은 이런 애로사항을 해결하는 데 도움이 될 것"이라 말했다.
비식별 솔루션을 활용한 점도 눈에 띈다. 기업 문서 중엔 사원 개인정보를 담고 있는 경우가 많다. 엘름은 AI를 활용해 문서 내 개인정보를 탐지하고 이를 식별하지 못하도록 만든다. 개인정보 유출을 사전에 차단하는 것이다.
파수의 문서 관리 플랫폼 '랩소디'를 사용하는 기업은 엘름과 시너지 효과도 기대할 수 있다. 랩소디는 모든 문서를 중복 없이 암호화·중앙화하는 소프트웨어다. 문서가상화 기술을 기반으로 여러 사용자가 분산 저장해도 하나의 문서로 관리한다. 예를 들어 한 직원이 문서 작업 후 저장하면 다른 직원들이 저장한 파일도 최신 버전으로 자동 동기화한다.
파수 관계자는 "문서를 자동으로 동기화하면 엘름의 훈련 효율성이 많이 늘어날 것"이라 설명했다. 기업 문서를 실시간으로 최신화해 구형 데이터가 훈련 자료로 쓰이는 것을 방지한다는 뜻이다.
스캐터랩 "T 아닌 F 같은 언어모델 지향"
"T(직관형)가 아닌 F(감정형) 같은 언어모델을 지향한다." 스캐터랩은 지난해 11월 자체 개발한 sLLM '핑퐁-1'을 공개하면서 이 같은 출사표를 던졌다. 핑퐁-1의 개발을 맡은 이주홍 스캐터랩 머신러닝 리서치 리드는 "다른 기업이 정확도에 집중한다면 우리는 대화의 '경험'에 집중했다"고 설명했다.
그간 스캐터랩은 일상대화 딥러닝과 같은 AI 기술을 바탕으로 실제 사람처럼 친근한 대화를 나눌 수 있는 '관계지향형' AI 언어모델을 개발해 왔다. 기존 언어모델에 서울 연남동의 좋은 점을 설명하면서 연남동으로 오라고 하면 기존 언어모델은 연남동에 관한 정보를 요약·정리한다. 반면 관계지향형 AI 언어모델은 "연남동에 네가 있어 좋다" 같은 사회성 있고 감성적인 답변을 한다.
핑퐁-1은 스캐터랩이 보유한 sLLM인 '루다 젠-1'보다 고도화된 모델이다. 파라미터를 몇 배가량 키우고 7배 많은 데이터를 학습시켰다. 일상적인 대화뿐 아니라 일반 지식이나 코딩 데이터 등도 학습시켜 다양한 지식을 갖도록 만들었다.
스캐터랩은 핑퐁-1을 통해 엔터테인먼트·게임·콘텐츠·소셜 커머스 등과 같은 비즈니스를 공략할 계획이다. 고객 관계성이 중요한 분야에서 강점을 발휘하겠다는 의미로 풀이된다. 스캐터랩은 소비자를 공략할 수 있는 감성적인 메시지 작성을 핑퐁-1의 활용 사례라 소개하기도 했다.
핑퐁-1의 이런 특징은 '제타'에서 직접 확인할 수 있다. 핑퐁-1에 기반한 제타는 스캐터랩이 3일 출시한 AI 스토리 플랫폼이다. 핑퐁-1에 스토리를 초점으로 미세조정한 서비스다. 이용자는 자신이 원하는 대로 AI 캐릭터를 생성해 원하는 방향으로 스토리를 전개할 수 있다. AI와 감성 대화를 넘어 상호작용과 실시간 스토리까지 장착했다는 평가다.
만들고 싶은 캐릭터 이미지·이름·특징 등을 입력하면 스캐터랩 생성 AI가 자연스레 해당 내용을 대화와 스토리에 반영한다. '친구들과 치킨을 먹으러 간다'는 대화를 진행한다면 '치킨집 앞에 도착했다'는 식의 이야기를 이어갈 수 있도록 지시문 소재를 던져주는 방식이다. 스캐터랩은 제타에 대한 국내 시장 반응을 확인한 후 글로벌 진출에 나설 예정이다.
김종윤 스캐터랩 대표는 "변화하는 AI 시대 흐름에 맞게 자신만의 취향을 담은 스토리를 직접 만들어 즐기는 차별화한 경험을 제공하겠다"고 말했다.