[네이버 테크인사이드] ⑩ 中 알리바바 제친 AI 클로바 문자인식(OCR) 기술... B2B 사업 박차
2019-08-02 00:05
메신저 자회사 라인, 일본서 AI 클로바 솔루션 사업 개시
클로바 기술 중 OCR, 지난해 국제 경연대회서 알리바바, 텐센트 제치고 1위
단어 아닌 글자 단위로 인식하고, 인접 글자 거리 파악해 정확도 높여
클로바 기술 중 OCR, 지난해 국제 경연대회서 알리바바, 텐센트 제치고 1위
단어 아닌 글자 단위로 인식하고, 인접 글자 거리 파악해 정확도 높여
지난달 23일, 네이버의 메신저 플랫폼 자회사 라인이 일본에서 ‘라인 브레인(LINE BRAIN)’ 사업설명회를 열었다. 라인 브레인은 네이버와 라인의 AI 플랫폼 ‘클로바(Clova)’를 활용한 기업용 인공지능(AI) 솔루션 사업이다. 챗봇, 음성인식(STT, Speech to Text), 문자인식(OCR, Optical Character Recognition) 등의 AI 기술을 패키지로 판매하는 것이 핵심 사업 모델이다.
올해 3분기부터 챗봇과 OCR을 실제 적용하기 위한 실험을 시작하고 4분기에 베타 서비스, 내년에 SaaS(Software as a Service) 형태로 월 이용료를 받는 정식 사업을 시작한다는 구체적인 로드맵도 제시했다.
라인 브레인 사업을 총괄하는 이사고 신이치로 실장은 “GAFA(구글·애플·페이스북·아마존)가 세계 시장을 선도하는 가운데 라인의 AI는 일본어를 포함한 아시아 언어에 초점을 맞췄다”고 강조했다. 영어권 이외에 시장에서 충분히 경쟁력을 발휘할 수 있다는 판단이 깔려있다.
라인(혹은 네이버)이 AI 기술로 B2B(기업과 기업 간 거래) 사업에 본격적으로 나선 것은 그동안 쌓아온 기술력이 본궤도에 올랐음을 의미한다. 특히 OCR 기술은 세계적인 수준이라는 평가를 받는다. OCR은 스마트폰 카메라로 촬영한 사진이나 이미지 속 문자를 기계가 읽을 수 있는 언어로 변환하는 기술로, 컴퓨터 비전 기술 중에 하나다.
실제로 네이버의 클로바 AI팀은 지난해 6월 국제패턴인식협회(IAPR)가 개최한 문자 인식 경연 ‘ICDAR 챌린지’에서 기존에 선두권을 차지하던 중국 알리바바, 텐센트를 제치고 1위에 올랐다.
네이버의 OCR 기술 노하우는 클로바 AI 연구원들의 논문 ‘Character Region Awareness for Text Detection(텍스트 감지를 위한 문자 영역 이해, 백영민 외 5명)’에 잘 드러나 있다.
OCR은 문자를 인식할 때 일반적으로 단어 단위로 글자를 읽는다. 그러나 사진이나 이미지는 촬영 각도에 따라 글자의 형태가 왜곡되기도 하고, 불규칙한 모양을 하고 있어 인식이 어려운 경우가 빈번하다. 이에 단어가 아닌 ‘글자(Characters)’ 하나씩 인식한 후 이를 합치는 방식으로 정확도를 높였다.
인식률을 높이기 위한 아이디어도 담겨 있다. 표지판과 메뉴판에 적힌 문자는 크기와 글자체, 배열 디자인 등이 모두 제각각이어서 기계가 문자로 인식하지 못하는 경우가 있다. 이에 클로바 AI 연구원들은 특정 이미지에서 △글자 크기 △인접한 글자 사이의 거리 △글자와 글자 중심의 거리 등을 계산, 점수화해 컴퓨터가 글자를 인식할 확률을 높인다.
연구원들은 “우리가 제안한 방식은 문자 영역 점수와 문자 친화성 점수를 제공해 다양한 텍스트를 포함한 사진을 완전히 커버할 수 있다”고 강조했다.
현재 OCR은 네이버의 주요 서비스에도 반영돼 있다. 네이버의 개편된 모바일 앱 하단에 있는 AI 인터렉티브 버튼 ‘그린닷’의 ‘스마트렌즈’ 기능으로 특정 이미지나 상품을 촬영하면 그 안에 적힌 글자를 자동으로 인식하고 번역해준다.
네이버가 라인과 일본에서 합작 개발한 맛집 추천 서비스 ‘코노미’에도 OCR이 적용됐다. 영수증 내 정보를 읽어 리뷰 작성에 활용하는 식이다. 국내 시중은행인 우리은행도 네이버의 OCR 기술을 금융 서비스에 활용할 예정이다.
네이버 관계자는 “네이버의 OCR 기술력은 글로벌 무대에서 1위를 차지할 정도로 수준이 높고 정확도 또한 구글보다 15% 정도 우위에 있다”며 “AI가 불러올 파급효과는 인터넷이나 스마트폰의 등장을 뛰어넘는 만큼, 클로바는 지금보다 뻗어 나갈 영역이 무궁무진하다”고 말했다.
올해 3분기부터 챗봇과 OCR을 실제 적용하기 위한 실험을 시작하고 4분기에 베타 서비스, 내년에 SaaS(Software as a Service) 형태로 월 이용료를 받는 정식 사업을 시작한다는 구체적인 로드맵도 제시했다.
라인 브레인 사업을 총괄하는 이사고 신이치로 실장은 “GAFA(구글·애플·페이스북·아마존)가 세계 시장을 선도하는 가운데 라인의 AI는 일본어를 포함한 아시아 언어에 초점을 맞췄다”고 강조했다. 영어권 이외에 시장에서 충분히 경쟁력을 발휘할 수 있다는 판단이 깔려있다.
라인(혹은 네이버)이 AI 기술로 B2B(기업과 기업 간 거래) 사업에 본격적으로 나선 것은 그동안 쌓아온 기술력이 본궤도에 올랐음을 의미한다. 특히 OCR 기술은 세계적인 수준이라는 평가를 받는다. OCR은 스마트폰 카메라로 촬영한 사진이나 이미지 속 문자를 기계가 읽을 수 있는 언어로 변환하는 기술로, 컴퓨터 비전 기술 중에 하나다.
네이버의 OCR 기술 노하우는 클로바 AI 연구원들의 논문 ‘Character Region Awareness for Text Detection(텍스트 감지를 위한 문자 영역 이해, 백영민 외 5명)’에 잘 드러나 있다.
OCR은 문자를 인식할 때 일반적으로 단어 단위로 글자를 읽는다. 그러나 사진이나 이미지는 촬영 각도에 따라 글자의 형태가 왜곡되기도 하고, 불규칙한 모양을 하고 있어 인식이 어려운 경우가 빈번하다. 이에 단어가 아닌 ‘글자(Characters)’ 하나씩 인식한 후 이를 합치는 방식으로 정확도를 높였다.
연구원들은 “우리가 제안한 방식은 문자 영역 점수와 문자 친화성 점수를 제공해 다양한 텍스트를 포함한 사진을 완전히 커버할 수 있다”고 강조했다.
현재 OCR은 네이버의 주요 서비스에도 반영돼 있다. 네이버의 개편된 모바일 앱 하단에 있는 AI 인터렉티브 버튼 ‘그린닷’의 ‘스마트렌즈’ 기능으로 특정 이미지나 상품을 촬영하면 그 안에 적힌 글자를 자동으로 인식하고 번역해준다.
네이버가 라인과 일본에서 합작 개발한 맛집 추천 서비스 ‘코노미’에도 OCR이 적용됐다. 영수증 내 정보를 읽어 리뷰 작성에 활용하는 식이다. 국내 시중은행인 우리은행도 네이버의 OCR 기술을 금융 서비스에 활용할 예정이다.
네이버 관계자는 “네이버의 OCR 기술력은 글로벌 무대에서 1위를 차지할 정도로 수준이 높고 정확도 또한 구글보다 15% 정도 우위에 있다”며 “AI가 불러올 파급효과는 인터넷이나 스마트폰의 등장을 뛰어넘는 만큼, 클로바는 지금보다 뻗어 나갈 영역이 무궁무진하다”고 말했다.