네이버가 자사 생성 인공지능(AI) 서비스에 멀티모달 기술을 본격 적용했다. 멀티모달이란 텍스트는 물론 이미지·사운드·동영상 등 다양한 종류의 데이터를 동시에 처리할 수 있는 기능을 일컫는다. 앞으로 '클로바X'와 '큐(Cue:)' 등 네이버 관련 서비스에 다양한 형태로 멀티모달 기능이 적용될 예정이다.
19일 업계에 따르면 네이버는 지난주 대화형 AI 서비스(챗봇) 클로바X에 이미지 편집 기능을 추가했다. 기존에는 클로바X에 텍스트만 입력할 수 있었는데, 이미지 편집 기능이 업데이트되면서 이미지도 입력이 가능해졌다. 아직 일부 이용자 대상으로 서비스가 제공되며 추후 대상을 확대할 예정이다.
구글 역시 최근 차세대 AI 모델 '제미나이'를 발표하며 멀티모달 기능을 강조했다. 이미지를 인식하고 음성으로 말하거나 들을 수 있으며, 이를 바탕으로 다양한 기능을 수행 가능하다. 구글은 제미나이에 대해 "텍스트, 이이미지, 영상 등을 포함한 다양한 유형의 정보를 원활하게 이해하고 작동하며 결합할 수 있다"며 "미묘한 정보를 더 잘 이해하고 복잡한 주제와 관련된 질문에 답할 수 있다"고 설명했다. 구글은 바드에 바로 제미나이를 탑재하면서 오픈AI와 생성 AI 서비스 경쟁에서 우위를 선점하려는 움직임을 빠르게 가져갔다.
네이버도 자사 멀티모달 AI 기술을 바탕으로 순차적으로 생성 AI에 관련 기능을 덧붙여 나간다. 우선적으로 생성 AI 검색 서비스인 큐에 멀티모달 검색 기능을 접목하는 것이 목표다. 최 대표는 "내년에는 큐를 모바일 환경에도 적용하고, 멀티모달 기술을 지원하는 등 단계적으로 서비스를 확장하겠다"고 3분기 콘퍼런스콜에서 언급했다. 현재 기존 검색 서비스에 적용돼 있는 멀티모달 기능을 큐로도 확장하는 방식이 될 것으로 보인다.
앞서 네이버는 지난해 4월 이미지 검색 서비스 '스마트렌즈'에 자사 멀티모달 AI 모델인 '옴니서치'를 운동화 제품군을 대상으로 적용했다. 텍스트와 이미지를 활용해 검색 정확도와 구체성을 높였다. 가령 특정 신발 이미지를 검색한 후 텍스트로 색상·디자인·소재 등 사용자 기호에 따른 추가 검색어를 더해 찾고자 하는 제품군을 좁혀 나가는 방식이다. 네이버는 이후 문서 검색과 쇼핑 검색 등에도 이를 확대 적용했으며, 카테고리도 원피스·가구·인테리어 등으로 넓혔다. 앞으로 카테고리 등을 점진적으로 확대해 나간다는 방침이다.
네이버 관계자는 "아직 큐 등 다른 서비스들에서 멀티모달 기능을 어떻게 적용할지 확정하지는 않았지만, 멀티모달 기술을 보유하고 있기 때문에 어떤 방식으로 서비스의 사용성을 높일 수 있을지 고민하고 있다"고 말했다.