업스테이지, 차세대 OCR 모델 '도큐먼트 파스' 공개

2024-10-17 13:38
  • * AI기술로 자동 요약된 내용입니다. 전체 맥락과 내용을 이해하기 위해서는 기사 본문 전체를 보시길 권장합니다

    업스테이지가 가장 정확하고 빠르게 문서를 분석해 초거대언어모델(LLM)로 처리가 가능한 차세대 광학문자인식(OCR) 모델 '도큐먼트 파스(Document Parse)를' 공개했다고 17일 밝혔다.

    업스테이지는 업그레이드된 OCR 기술력을 바탕으로 보안이 필수적인 금융권·제조업 주요 기업들을 고객으로 확보하고 있으며, 향후 대규모 문서의 디지털 전환을 통해 LLM 활용 예정인 전 산업 영역에서 유용하게 활용될 전망이다.

    김성훈 업스테이지 대표는 "도큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구"라며 "다양한 비즈니스에서 활용돼 업무 혁신을 현실화할 것"이라고 말했다.

  • 글자크기 설정
사진업스테이지
[사진=업스테이지]
업스테이지가 가장 정확하고 빠르게 문서를 분석해 초거대언어모델(LLM)로 처리가 가능한 차세대 광학문자인식(OCR) 모델 '도큐먼트 파스(Document Parse)를' 공개했다고 17일 밝혔다.

도큐먼트 파스는 기존 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서에서도 각 구조와 텍스트 정보를 정확히 분석해 데이터 자산화를 가능하게 한다. 어떤 형식의 문서도 HTML과 같은 구조화된 텍스트 형식으로 전환해 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다는 설명이다.

업스테이지는 도큐먼트 파스를 통해 검색증강생성(RAG) 시스템 성능과 LLM의 응답 정확도를 결정하는 핵심 요소인 데이터 전처리 과정에서의 정확성은 물론, 속도와 사용성 측면에서도 현재 가장 진보한 형태의 문서 처리 기술을 선보이게 됐다고 강조했다.

업스테이지는 관련 기술의 성능 측정에 통용될 수 있는 객관적 기준 마련을 위해 문서 구조 분석 벤치마크인 DP-벤치(Bench)를 함께 공개했다. 해당 벤치마크를 통해 측정한 결과에 따르면, 도큐먼트 파스는 모든 지표에서 아마존웹서비스(AWS)와 마이크로소프트(MS)를 포함한 빅테크 5개사의 관련 서비스와 비교해 5% 이상 높은 점수를 받았다. 

또 DOCX, PDF, PPTX, PNG 등 업무에 사용하는 9종의 문서 처리뿐만 아니라 수식 인식·이미지 추출과 같은 새로운 기능을 추가했다. HTML 외에도 헤더·테이블 요소를 마크다운 형식으로 제공해 LLM 사용자가 입력 문서의 토큰 크기를 줄일 수 있다는 것 역시 큰 강점이다.

업스테이지는 업그레이드된 OCR 기술력을 바탕으로 보안이 필수적인 금융권·제조업 주요 기업들을 고객으로 확보하고 있으며, 향후 대규모 문서의 디지털 전환을 통해 LLM 활용 예정인 전 산업 영역에서 유용하게 활용될 전망이다.

김성훈 업스테이지 대표는 "도큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구"라며 "다양한 비즈니스에서 활용돼 업무 혁신을 현실화할 것"이라고 말했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기