네이버클라우드 광학문자판독(OCR) 기술 기반 문서인식 서비스가 클로바 인공지능(AI) 자연어처리(NLP) 기술로 진화했다. 민감정보와 개인정보를 포함해 워터마크나 형광인쇄같은 위변조 방지 기술이 적용된 문서와 증서까지 OCR 기술로 인식시켜 처리를 자동화할 수 있게 만들었다.
네이버클라우드는 비정형 업무문서에서 사용자가 원하는 정보만 추출할 수 있는 '클로바 도큐먼트 OCR' 특화 서비스를 출시했다고 11일 밝혔다. 이 서비스는 클로바 AI로 업무문서에서 상호, 지점명, 사업자번호 등 주요 정보만 추출해 항목 분류까지 자동화해 주는 상품이다.
기업들은 이 상품으로 문서 양식과 글자 위치에 관계 없이 결과물을 얻을 수 있고, 발급기관이 상이하거나 위변조 방지 기술이 적용돼 OCR 기술 적용이 까다로웠던 분야에도 문서인식 기술을 활용할 수 있게 됐다. 영수증, 신용카드, 사업자등록증, 명함, 신분증 등을 처리할 수 있다. 의료비 지출 영수증을 처리하는 AI 모델은 오는 5월 이후 서비스에 업데이트될 예정이다.
네이버클라우드는 문자 이미지를 텍스트로 인식하는 수준을 넘어 구겨지거나 오염된 서류에서 추출된 텍스트를 AI 기술로 읽어내고 항목별 자동 기입을 할 수 있다고 설명했다. 영문, 한자, 기호 등 여러 문자가 인쇄되거나 방향이 일정하지 않은 명함, 신용카드 등에서도 필요한 값을 정확하게 추출할 수 있다고 덧붙였다. 이 기술은 네이버웍스와 명함관리 앱 '리멤버' 서비스에 활용돼 높은 성능을 보여주고 있다고 회사측은 설명했다.
네이버클라우드 측은 신용카드, 주민등록증, 여권 등은 빛 반사가 많은 재질이거나 워터마크, 형광인쇄 등의 위변조 방지기술이 적용돼 OCR 적용이 고난도에 속하는 대상이지만 이 역시 인식할 수 있다고 강조했다. 신용카드나 주민등록증과 같은 민감정보, 개인정보 인식시 철저한 보안이 요구되는만큼, 도큐먼트OCR 서비스를 사전승인된 기업에만 선별적으로 제공한다고 밝혔다.
한상영 네이버클라우드 상무는 "향후 도큐먼트OCR 특화 모델을 확장하고 네이버 클라우드 플랫폼의 다른 서비스와 유기적으로 연계한 솔루션을 출시해 네이버클라우드만이 제공할 수 있는 차별화된 서비스로 혁신을 선도해나가겠다"고 말했다.
네이버클라우드는 비정형 업무문서에서 사용자가 원하는 정보만 추출할 수 있는 '클로바 도큐먼트 OCR' 특화 서비스를 출시했다고 11일 밝혔다. 이 서비스는 클로바 AI로 업무문서에서 상호, 지점명, 사업자번호 등 주요 정보만 추출해 항목 분류까지 자동화해 주는 상품이다.
기업들은 이 상품으로 문서 양식과 글자 위치에 관계 없이 결과물을 얻을 수 있고, 발급기관이 상이하거나 위변조 방지 기술이 적용돼 OCR 기술 적용이 까다로웠던 분야에도 문서인식 기술을 활용할 수 있게 됐다. 영수증, 신용카드, 사업자등록증, 명함, 신분증 등을 처리할 수 있다. 의료비 지출 영수증을 처리하는 AI 모델은 오는 5월 이후 서비스에 업데이트될 예정이다.
네이버클라우드는 문자 이미지를 텍스트로 인식하는 수준을 넘어 구겨지거나 오염된 서류에서 추출된 텍스트를 AI 기술로 읽어내고 항목별 자동 기입을 할 수 있다고 설명했다. 영문, 한자, 기호 등 여러 문자가 인쇄되거나 방향이 일정하지 않은 명함, 신용카드 등에서도 필요한 값을 정확하게 추출할 수 있다고 덧붙였다. 이 기술은 네이버웍스와 명함관리 앱 '리멤버' 서비스에 활용돼 높은 성능을 보여주고 있다고 회사측은 설명했다.
한상영 네이버클라우드 상무는 "향후 도큐먼트OCR 특화 모델을 확장하고 네이버 클라우드 플랫폼의 다른 서비스와 유기적으로 연계한 솔루션을 출시해 네이버클라우드만이 제공할 수 있는 차별화된 서비스로 혁신을 선도해나가겠다"고 말했다.