컴퓨터 비전은 컴퓨터를 활용해 인간의 시각적 인식 능력을 재현하는 연구 분야다. 네이버클라우드는 올해 이미지 학습 과정에서 초거대 AI와 생성 AI의 역량을 끌어올리는 연구 결과 등을 발표할 예정이다.
2일 업계에 따르면 네이버클라우드는 올해 ICCV에서 총 13편의 메인트랙 논문을 발표한다. 네이버는 지난 2017년부터 ICCV에 참가하고 있는데, AI에 대한 연구개발을 강화하면서 채택 논문 수가 지속적으로 증가하는 추세다. 올해는 네이버클라우드에서만 13편의 논문이 채택됐다. 논문 발표자 중에서는 하정우 네이버클라우드 AI이노베이션 센터장, 윤상두 네이버클라우드 AI랩 소장 등 네이버클라우드의 주요 AI 연구진들도 다수 포함됐다.
논문 중에서는 생성 AI 관련 연구도 포함됐다. 대표적으로 'Dense Text-to-Image Generation with Attention Modulation'은 네이버클라우드 연구진들이 주준얀 카네기멜론대 교수와 협업한 연구 성과다. 주준얀 교수는 세계 최고 이미지 생성 연구자 중 한 명으로 꼽힌다.
초거대 AI의 이미지 모델 학습 과정에서의 효율성을 극대화한 연구 결과도 나온다. 'SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage' 논문에서는 이미지 모델을 학습할 때 병목이 되는 저장공간 문제를 해결하는 방법이 소개된다. 이를 통해 100배 적은 학습 데이터 저장 공간을 사용하면서도 동일한 성능의 이미지 인식 모델을 학습할 수 있게 만든다. 이는 향후 초거대 AI 모델의 학습에 필요한 데이터 확보 측면에서 효율성을 높일 수 있을 것으로 기대된다.
'Generating Instance-level Prompts for Rehearsal-free Continual Learning' 논문을 통해서는 AI 학습 기법인 '지속 학습'의 효율을 강화하는 방법을 발표한다. 일반적으로 AI가 새로운 데이터를 학습하면 기존에 습득한 정보를 잊어버리는 경우가 있는데, 지속 학습을 통해 이러한 문제를 해결할 수 있다. 다만 기존 지속 학습은 이전 학습 내용을 기억하는 저장 공간과 방법이 필요했다. 이번 논문에서는 세계 최초로 저장 공간을 전혀 쓰지 않고 입력에 대해 자동으로 프롬프트를 생성해 새로운 데이터를 학습할 수 있는 기법을 소개한다. 해당 연구는 상위 약 3%의 연구에만 주어지는 구두(Oral) 세션 발표로 선정됐다.
네이버클라우드는 이미 올해 상반기에만 총 61건에 달하는 컴퓨터비전, 머신러닝, 자연어처리 등의 논문을 글로벌 AI 학회에서 발표했다. 지난해 네이버는 클로바, 파파고 등 네이버 내 흩어져 있던 여러 AI 관련 조직들을 네이버클라우드로 통합한 바 있는데, 연구개발 분야에서부터 시너지 효과가 나타나는 모습이다. 초거대 AI 기술 생태계 발전부터 서비스 적용, 사회적 가치 창출을 위한 연구 등 다양한 분야에서 논문을 발표하며 연구개발 성과를 이끌었다.
네이버는 지난 8월 자체 초거대 언어모델 '하이퍼클로바X' 공개를 필두로 생성 AI를 적용한 다양한 서비스를 출시하고 있다. 대화형 AI 서비스 '클로바X', 생성 AI를 접목한 검색 서비스 큐(Cue:)가 대표적이다. 하이퍼클로바X를 탑재한 기업용 솔루션인 '클로바 스튜디오' 등 B2B 서비스도 조만간 선보인다. 네이버는 지속적으로 생성 AI를 접목한 서비스를 출시함과 동시에 연구개발을 통한 자체 기술 고도화로 서비스 수준을 끌어올리는 데 박차를 가하겠다는 방침이다.