구글클라우드는 기업용 인공지능(AI) 플랫폼 버텍스 AI의 모델과 엔터프라이즈 기능을 업데이트했다고 8일 밝혔다. 모델 조정·증강·커스터마이징·확장성·신뢰성·보안 등 버텍스 AI가 제공하는 혁신적인 기능을 바탕으로 강력한 AI 에이전트를 더 빠르게 구축하겠다는 계획이다.
구글클라우드는 지난 5월 프리뷰 버전으로 선보였던 제미나이 1.5 플래시를 공식 출시했다. 제미나이 1.5 플래시는 성능, 지연 시간, 비용 효율성 면에서 GPT-3.5 터보를 비롯한 동급 모델 대비 강력한 이점을 제공하며 많은 고객의 선택을 받고 있다. 또 GPT-3.5 터보 대비 60배가량 더 긴 100만 개의 토큰 컨텍스트 윈도우를 제공하다. 1만 자 입력 기준 평균 40% 더 빠른 속도를 자랑한다. 또한 3만 2000 자 이상 입력 시 컨텍스트 캐싱 기능으로 GPT-3.5 터보 대비 입력 비용을 최대 4배 절감시켜 준다.
구글클라우드는 고객이 제미나이 1.5 프로와 제미나이 플래시 모델의 방대한 컨텍스트 윈도를 효율적으로 활용할 수 있도록 해당 모델에 컨텍스트 캐싱 기능을 프리뷰 버전으로 제공한다. 컨텍스트의 길이가 증가하면 애플리케이션에서 응답을 얻는 데 많은 시간과 비용이 소요돼 실제 운영 환경 배포에 어려움을 겪을 수 있다. 버텍스 AI 컨텍스트 캐싱은 자주 사용하는 컨텍스트의 캐시 데이터를 활용해 고객이 최대 76%까지 비용을 대폭 절감할 수 있도록 돕는다.
구글클라우드는 일부 고객에게 프로비저닝 처리량을 제공한다. 이를 통해 고객은 제미나이 1.5 플래시를 포함한 구글 자체 모델의 사용량을 필요에 맞게 적절히 확장할 수 있으며, 모델 성능과 비용 모두에 대해 보장받을 수 있다. 이러한 버텍스 AI의 기능은 고객 워크로드에 대한 예측 가능성과 안전성을 제공해 고객이 생성형 AI 도입을 적극적으로 확대할 수 있도록 돕는다.
구글클라우드는 버텍스 AI에서 제공되는 엄선된 자사 모델과 오픈 모델, 타사 모델 제품군을 제공하고 있다. 최근 앤트로픽이 새롭게 출시한 클로드 3.5 소넷을 버텍스 AI에 추가했으며, 구글클라우드 환경에서 클로드 3.5 소넷으로 테스트를 진행하거나 운영 환경에 배포할 수 있다. 올 하반기 미스트랄 스몰, 미스트랄 라지, 미스트랄 코드스트랄 등을 버텍스 AI의 모델 가든에서 제공할 예정이다.
이 밖에도 구글클라우드는 제미나이 모델 개발에 활용된 동일한 연구 기술을 바탕으로 구축한 초경량의 최첨단 오픈 모델 제품군 젬마 후속 모델을 발표했다. 전 세계 연구자와 개발자를 대상으로 공식 출시된 젬마 2는 90억 개(9B)와 270억 개(27B) 파라미터 사이즈로 제공된다. 구글클라우드 측은 "이전 버전보다 훨씬 더 강력하고 효율적이며, 개선된 보안 기능이 내장됐다. 이번 달부터 버텍스 AI에서 젬마 2를 이용할 수 있다"고 설명했다.