챗봇처럼 말 걸어 사진 편집…네이버도 멀티모달 생성 AI 가세

2023-12-19 17:38
클로바X에 이미지 편집 기능 추가…대화로 간단한 사진 편집 가능
챗GPT·바드 멀티모달 강화 움직임에 네이버도 참전

네이버가 지난주 클로바X에 '이미지 편집' 기능을 추가했다. 아직 모든 사용자들에게 기능이 제공되는 것은 아니다. [사진=네이버 클로바X 갈무리]

네이버가 자사 생성 인공지능(AI) 서비스에 멀티모달 기술을 본격 적용했다. 멀티모달이란 텍스트는 물론 이미지·사운드·동영상 등 다양한 종류의 데이터를 동시에 처리할 수 있는 기능을 일컫는다. 앞으로 '클로바X'와 '큐(Cue:)' 등 네이버 관련 서비스에 다양한 형태로 멀티모달 기능이 적용될 예정이다.

19일 업계에 따르면 네이버는 지난주 대화형 AI 서비스(챗봇) 클로바X에 이미지 편집 기능을 추가했다. 기존에는 클로바X에 텍스트만 입력할 수 있었는데, 이미지 편집 기능이 업데이트되면서 이미지도 입력이 가능해졌다. 아직 일부 이용자 대상으로 서비스가 제공되며 추후 대상을 확대할 예정이다.

클로바X에 이미지를 업로드하면 '이미지 편집' 기능이 자동 실행된다. 아이콘을 선택해 스스로 편집할 수도 있지만 대화를 통해 편집 지시를 하는 것도 가능하다. 고양이가 나온 사진을 강아지로 바꾸거나, 숲 배경의 사진을 바다로 변경하는 등이다. 간단한 이미지 편집을 대화만으로 손쉽게 할 수 있게 된 셈이다.
 
클로바X를 통해 "강아지를 말티즈로 바꿔줘"라고 요청했을 때 왼쪽 사진이 오른쪽 사진으로 바뀐다. [사진=네이버]
앞서 네이버는 지난달 열린 3분기 실적 발표 콘퍼런스콜에서 관련 기능의 연내 출시를 예고했다. 최수연 네이버 대표는 "연내 외부 문서 참조, 외부 서비스 연동, 이미지 편집 등 신규 기능을 추가하며 생산성 향상에 중점을 두고 다양한 실험을 진행하고자 한다"고 언급했다. 이 중 이미지 편집은 네이버의 생성 AI 서비스에 추가된 첫 멀티모달 기술로, 향후 다양한 방식으로 멀티모달 기능을 순차적으로 덧붙여 나갈 계획이다.

최근 챗GPT·바드 등 글로벌 생성 AI 서비스에 멀티모달 기능들이 빠르게 보강되고 있는 상황에서 네이버도 멀티모달 경쟁에 발을 담근 형국이다. 오픈AI는 지난달 GPT4 대비 진화된 AI인 GPT4-터보를 공개하면서 더욱더 강화된 멀티모달을 내세웠다. 이미지 생성 AI 솔루션 '달리(DALL·E)'를 통한 이미지 제작 기능은 물론 6가지 음성 모델을 토대로 텍스트의 음성 변환도 제공한다. 이미 오픈AI는 챗GPT 유료 버전을 통해 이미지·동영상 등을 통해 대화를 주고받는 기능을 선보여 호평을 받았다. 조만간 GPT4-터보가 챗GPT에 본격 적용되면 챗GPT에서도 이를 활용할 수 있을 전망이다.

구글 역시 최근 차세대 AI 모델 '제미나이'를 발표하며 멀티모달 기능을 강조했다. 이미지를 인식하고 음성으로 말하거나 들을 수 있으며, 이를 바탕으로 다양한 기능을 수행 가능하다. 구글은 제미나이에 대해 "텍스트, 이이미지, 영상 등을 포함한 다양한 유형의 정보를 원활하게 이해하고 작동하며 결합할 수 있다"며 "미묘한 정보를 더 잘 이해하고 복잡한 주제와 관련된 질문에 답할 수 있다"고 설명했다. 구글은 바드에 바로 제미나이를 탑재하면서 오픈AI와 생성 AI 서비스 경쟁에서 우위를 선점하려는 움직임을 빠르게 가져갔다.

네이버도 자사 멀티모달 AI 기술을 바탕으로 순차적으로 생성 AI에 관련 기능을 덧붙여 나간다. 우선적으로 생성 AI 검색 서비스인 큐에 멀티모달 검색 기능을 접목하는 것이 목표다. 최 대표는 "내년에는 큐를 모바일 환경에도 적용하고, 멀티모달 기술을 지원하는 등 단계적으로 서비스를 확장하겠다"고 3분기 콘퍼런스콜에서 언급했다. 현재 기존 검색 서비스에 적용돼 있는 멀티모달 기능을 큐로도 확장하는 방식이 될 것으로 보인다.

앞서 네이버는 지난해 4월 이미지 검색 서비스 '스마트렌즈'에 자사 멀티모달 AI 모델인 '옴니서치'를 운동화 제품군을 대상으로 적용했다. 텍스트와 이미지를 활용해 검색 정확도와 구체성을 높였다. 가령 특정 신발 이미지를 검색한 후 텍스트로 색상·디자인·소재 등 사용자 기호에 따른 추가 검색어를 더해 찾고자 하는 제품군을 좁혀 나가는 방식이다. 네이버는 이후 문서 검색과 쇼핑 검색 등에도 이를 확대 적용했으며, 카테고리도 원피스·가구·인테리어 등으로 넓혔다. 앞으로 카테고리 등을 점진적으로 확대해 나간다는 방침이다. 

네이버 관계자는 "아직 큐 등 다른 서비스들에서 멀티모달 기능을 어떻게 적용할지 확정하지는 않았지만, 멀티모달 기술을 보유하고 있기 때문에 어떤 방식으로 서비스의 사용성을 높일 수 있을지 고민하고 있다"고 말했다.