​마인즈랩, 음성분리∙이미지생성 등 10개 인공지능 API 오픈

2019-07-17 08:56

마인즈랩이 음성분리, 이미지 생성 등 최신 딥러닝 인공지능 엔진 API 서비스를 시작한다. 마인즈랩은 이번에 오픈한 인공지능 API를 월 구독 형태로 전담 기술 지원, 아카데미 참여 기회 등과 함께 패키지 형태로 제공한다.

인공지능 전문기업 마인즈랩은 자사 인공지능(AI) 서비스 플랫폼인 마음AI(maum.ai)에서 이미지 생성, 음성∙화자 분리, 텍스트 제거 등 신규 AI 엔진 서비스를 오픈했다고 17일 밝혔다.

이번에 공개된 마음AI 신규 서비스는 음성정제, 음성인증, 음성분리(화자분리) 등 음성 엔진 3종, 이미지 생성(TTI∙Text to Image), 이미지 내 텍스트 제거(Text Removal), 물체∙얼굴 검출, 차량 및 번호판 인식과 차량 유리 마스킹이 가능한 AVR 등 시각지능 엔진 4종, AI 작문, 버트(BERT) 기반 MRC 및 XDC 등 자연어 처리 엔진 3종 등 모두 10종이다. 이 엔진들의 API(애플리케이션 프로그래밍 인터페이스)는 마음AI 웹사이트에서 정기 구독 서비스로 이용할 수 있다.
 

[사진=마인즈랩]


마음AI를 통해 공개된 10개 종류의 신규 AI 엔진에는 모두 세계적인 수준의 첨단 딥러닝 기술이 적용됐다.

토론회나 회의에서처럼 여러 명의 화자가 겹쳐 말해도 화자별로 음성을 분리할 수 있는 음성분리(화자분리) 서비스가 대표적이다. 이 기술은 마인즈랩이 지난 6월 구글에 이어 마인즈랩이 최초로 기술 구현에 성공하고 오픈소스를 공개하면서 화제가 된 바 있다.

AI가 주어진 텍스트를 독해하고 정확한 답을 내는 기계독해(MRC)와 분류와 그 분류 근거를 함께 제시하는 텍스트 분류기인 XDC 엔진의 경우, 현존하는 가장 우수한 자연어 처리 언어모델로 평가받는 버트(BERT)를 기반으로 정확도와 처리 속도를 획기적으로 개선했다.

이 외에도 마인즈랩은 주변의 잡음을 제거하는 음성정제(Denoise), 입력한 텍스트대로 이미지를 만드는 이미지 생성(TTI), 이미지 안에 있는 텍스트만 지우는 텍스트 제거 엔진 등 언어 및 시각지능 전 영역에 걸친 최신 인공지능 엔진을 발빠르게 선보였다.

마인즈랩 관계자는 “마음AI의 비즈니스 플랜(월 9만9000원)을 이용할 경우 매달 정기 구독 형태로 마음AI에서 제공하는 모든 인공지능 엔진 API는 물론 아카데미 참여, 전담 기술지원, 커스터마이징 데이터 학습 지원 등을 한 데 묶은 패키지 서비스를 제공받을 수 있다”고 설명했다.

유태준 마인즈랩 대표는 “이번에 마음AI에 반영된 최신 인공지능 엔진들은 세계적으로 봐도 손색이 없는 마인즈랩 R&D 기술력의 산물”이라며 “인공지능 기술이 필요한 기업이라면 누구나 기술 장벽이나 전문 인력에 대한 고민 없이 쉽고 빠르게 최신 기술을 활용할 수 있도록 마음AI 인공지능 서비스의 품질과 서비스 만족도를 높이는 데 더욱 집중하겠다”고 말했다.