네이버가 세계 최고 권위의 컴퓨터 비전 학회 ICCV(International Conference on Computer Vision, 국제 컴퓨터 비전 학회)에서 기술 공유 및 인재 영입에 나선다고 29일 밝혔다.
올해로 17회를 맞은 ICCV는 CVPR(Conference on Computer Vision and Pattern Recognition)과 더불어 컴퓨터 비전 및 패턴 인식 분야 최고 권위의 국제 학회로, 세계 유수 연구 기관과 마이크로소프트(MS), 구글, 페이스북, 아마존 등 글로벌 IT 기업들이 참석해 최신 연구 성과를 공유하는 자리다. 컴퓨터 비전 분야의 중요성이 갈수록 높아지며, 지난 학회 대비 올해 제출된 논문 수가 2배(4323개)로 증가하는 등, 학계와 업계에서 가장 주목받는 행사 중 하나로 자리잡았다.
특히 올해는 1987년 ICCV가 시작된 이래 처음으로 한국에서 학회가 열리면서 국내 AI 연구자들의 관심이 더욱 집중됐다. ICCV 2019는 지난 27일을 시작으로 내달 2일까지 서울 삼성동 코엑스 컨벤션센터에서 진행된다.
네이버는 이번 ICCV 2019 정규 세션 및 워크샵을 통해 총 10개 논문을 발표하며, 그 중 2개는 정규 오럴(Oral) 세션에도 채택되는 성과를 얻었다.
오럴 발표 논문 중 하나인 ‘사진 내 문자 인식 분야의 모델 비교 시의 문제는 무엇인가? 데이터셋 및 모델 분석(What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis)’는 이미지 내 텍스트 인식 분야의 모델을 총망라해 비교하고, 모델의 성능을 공정하게 평가할 수 있는 방법을 제안한다.
또한 ‘컷믹스: 지역적 특징을 가지는 분류기 학습을 위한 학습 데이터 생성 방법(CutMix: Regularization Strategy to Train Strong Classifiers With Localizable Features)’은 데이터를 추가적으로 수집하지 않고도 간단하게 증강시켜, 이미지 인식 모델의 성능을 효과적으로 향상시킬 수 있는 학습 기법을 제시하는 연구다. 이 기술은 문자 및 얼굴을 인식하는 네이버 서비스의 기반 기술로 적용된다.
이외에도 이미지 스타일을 실제 사진처럼 변환하는 기술을 다룬 ‘웨이블릿 변환 기법을 이용한 사실적 스타일 변환(Photorealistic Style Transfer via Wavelet Transforms)’와 경량화된 이미지 인식 모델 학습 방법을 제안한 ‘특징점 기반 지식 증류 방법에 대한 포괄적 분석 및 설계(A Comprehensive Overhaul of Feature Distillation)’ 등의 클로바 AI 연구가 포스터 세션을 통해 소개된다.
네이버랩스도 이번 ICCV 에서 논문이 채택됐다. 논문 저자는 네이버랩스 자율주행그룹 소속의 김남일 연구원과 2명의 인턴으로, 딥러닝을 위한 가상 환경의 데이터를 실제 데이터처럼 활용하기 위한 도메인 적용(domain adaptation) 연구이며, 기존 방식에 비해 간단하지만 성능은 높으며 기존 영상 기반 모델에 광범위하게 적용이 가능한 방법론을 제시했다.
네이버랩스유럽도 다양한 서비스에 적용될 수 있는 미래 기술 연구를 공개한다. 비디오 내의 동작을 텍스트로 추출하거나 텍스트를 입력해 비디오를 검색하는 VTT(Video-to-Text) 및 TTV(Text-to-Video) 기술에 대한 연구, 사진 한 장만으로 사람을 3D shape로 생성하는 기술에 대한 연구, Image Retrieval(이미지 검색)의 새로운 기법을 제시한 연구 등이 다양하게 공유된다.
네이버는 국내 최초로 개최되는 이번 ICCV 현장에 대형 부스를 설치하고, 국내 AI 생태계를 선도하는 기술 기업으로서 존재감을 드러내는 한편, 글로벌 AI 인재 영입을 위한 적극적인 노력을 이어갈 계획이다.
김성훈 네이버 클로바 AI 리더는 “AI 기술 연구에 대한 지속적인 투자와 자유로운 연구 기회를 보장하는 문화가 국제 학회에서의 성과로 가시화되고 있다”며 “이렇게 연구된 기술들은 네이버 서비스에도 적용되며 이용자 가치를 더욱 높이는 데 기여할 것”이라고 말했다.
올해로 17회를 맞은 ICCV는 CVPR(Conference on Computer Vision and Pattern Recognition)과 더불어 컴퓨터 비전 및 패턴 인식 분야 최고 권위의 국제 학회로, 세계 유수 연구 기관과 마이크로소프트(MS), 구글, 페이스북, 아마존 등 글로벌 IT 기업들이 참석해 최신 연구 성과를 공유하는 자리다. 컴퓨터 비전 분야의 중요성이 갈수록 높아지며, 지난 학회 대비 올해 제출된 논문 수가 2배(4323개)로 증가하는 등, 학계와 업계에서 가장 주목받는 행사 중 하나로 자리잡았다.
특히 올해는 1987년 ICCV가 시작된 이래 처음으로 한국에서 학회가 열리면서 국내 AI 연구자들의 관심이 더욱 집중됐다. ICCV 2019는 지난 27일을 시작으로 내달 2일까지 서울 삼성동 코엑스 컨벤션센터에서 진행된다.
네이버는 이번 ICCV 2019 정규 세션 및 워크샵을 통해 총 10개 논문을 발표하며, 그 중 2개는 정규 오럴(Oral) 세션에도 채택되는 성과를 얻었다.
또한 ‘컷믹스: 지역적 특징을 가지는 분류기 학습을 위한 학습 데이터 생성 방법(CutMix: Regularization Strategy to Train Strong Classifiers With Localizable Features)’은 데이터를 추가적으로 수집하지 않고도 간단하게 증강시켜, 이미지 인식 모델의 성능을 효과적으로 향상시킬 수 있는 학습 기법을 제시하는 연구다. 이 기술은 문자 및 얼굴을 인식하는 네이버 서비스의 기반 기술로 적용된다.
이외에도 이미지 스타일을 실제 사진처럼 변환하는 기술을 다룬 ‘웨이블릿 변환 기법을 이용한 사실적 스타일 변환(Photorealistic Style Transfer via Wavelet Transforms)’와 경량화된 이미지 인식 모델 학습 방법을 제안한 ‘특징점 기반 지식 증류 방법에 대한 포괄적 분석 및 설계(A Comprehensive Overhaul of Feature Distillation)’ 등의 클로바 AI 연구가 포스터 세션을 통해 소개된다.
네이버랩스도 이번 ICCV 에서 논문이 채택됐다. 논문 저자는 네이버랩스 자율주행그룹 소속의 김남일 연구원과 2명의 인턴으로, 딥러닝을 위한 가상 환경의 데이터를 실제 데이터처럼 활용하기 위한 도메인 적용(domain adaptation) 연구이며, 기존 방식에 비해 간단하지만 성능은 높으며 기존 영상 기반 모델에 광범위하게 적용이 가능한 방법론을 제시했다.
네이버랩스유럽도 다양한 서비스에 적용될 수 있는 미래 기술 연구를 공개한다. 비디오 내의 동작을 텍스트로 추출하거나 텍스트를 입력해 비디오를 검색하는 VTT(Video-to-Text) 및 TTV(Text-to-Video) 기술에 대한 연구, 사진 한 장만으로 사람을 3D shape로 생성하는 기술에 대한 연구, Image Retrieval(이미지 검색)의 새로운 기법을 제시한 연구 등이 다양하게 공유된다.
네이버는 국내 최초로 개최되는 이번 ICCV 현장에 대형 부스를 설치하고, 국내 AI 생태계를 선도하는 기술 기업으로서 존재감을 드러내는 한편, 글로벌 AI 인재 영입을 위한 적극적인 노력을 이어갈 계획이다.
김성훈 네이버 클로바 AI 리더는 “AI 기술 연구에 대한 지속적인 투자와 자유로운 연구 기회를 보장하는 문화가 국제 학회에서의 성과로 가시화되고 있다”며 “이렇게 연구된 기술들은 네이버 서비스에도 적용되며 이용자 가치를 더욱 높이는 데 기여할 것”이라고 말했다.