[클라우드 테크] ② 글로벌 클라우드3사, 다음 격전지는 '인공지능 플랫폼'

2021-05-25 06:02
퍼블릭클라우드 올해 314조원 규모 전망
실무자·개발자 겨냥 AI 툴 주력하는 3사
AWS 데이터 준비, 추론·훈련 가속 지원
MS 여러 개발툴 지원, 실무 연계 강점
구글 단계별 MLOps, 모델 관리 간소화

[로고=각 사]


올해 2783억 달러(약 314조원) 규모로 커지는 세계 퍼블릭클라우드 시장의 다음 격전지는 클라우드 기반 '인공지능(AI) 개발 플랫폼'이다. 경쟁의 초점이 단순히 데이터센터 서버·스토리지 자원을 제공하던 IT인프라 영역을 벗어나 빅데이터처리·데이터분석·비즈니스최적화에 초점을 맞춘 기술과 서비스 제공으로 바뀔 전망이다.

24일 업계에 따르면 글로벌 퍼블릭클라우드 선두 기업들을 중심으로 클라우드 기반의 AI 개발기술 수요 공략 움직임이 활발하다. 아마존웹서비스(AWS), 마이크로소프트(MS), 구글클라우드 등이 저마다 자사 클라우드 인프라를 활용하는 기업·개인 대상 도구와 솔루션을 앞다퉈 내놓고 있다. 데이터과학 전문가가 아닌 일반 개발자와 현업 실무자를 겨냥했다.

한국지능정보사회진흥원(NIA)은 최근 발간한 '클라우드 플랫폼 테크엣지 보고서'를 통해 AWS, MS, 구글클라우드 등 글로벌 클라우드3사의 AI·머신러닝 개발 플랫폼과 관련 주요 기술을 소개했다. 각사 플랫폼과 기술의 특성을 제시하고 이같은 클라우드 기반 AI 개발 플랫폼의 등장 배경을 간단히 소개했다.

AWS는 '아마존 세이지메이커'라는 AI 개발 플랫폼을 제공한다.

세이지메이커는 '그라운드 트루스(Ground Truth)'라는 AI 학습 데이터셋 구축 서비스를 포함하고 있다. 50만명의 레이블링 작업 개발자가 참여하는 '메카니컬 터크(Mechanical Turk)'를 연계해 외부의 레이블링 지원을 받거나, 자체 레이블링을 할 수 있는 기능을 제공한다. AWS는 그라운드 트루스로 데이터 레이블링 비용을 70% 절감할 수 있다고 주장한다.

세이지메이커 브랜드의 핵심 제품은 머신러닝 모델을 만들기 위한 과정을 웹 기반 통합개발환경(IDE)으로 지원하는 '세이지메이커 스튜디오'다. 노트북, 익스페리먼츠, 디버거, 모델 모니터, 오토파일럿 등 모델 제작 단계별 도구를 시각적으로 통합된 화면에서 제공하고 코드 작성부터 데이터를 적용한 실험, 시각화, 디버깅·모니터링 업무를 지원한다.

AWS는 최근 세이지메이커 사용자들에게 '데이터 랭글러'라는 데이터 준비 자동화 패키지를 추가로 제공하기 시작했다. 머신러닝 모델과 AI 앱 개발의 사전 단계인 데이터 수집과 준비 소요기간을 기존 '몇 주'에서 '몇 분'으로 감축시킬 수 있다고 주장한다. 이밖에 '인퍼런시아'와 '트레이니엄' 등 가속 칩을 활용해 머신러닝 추론·훈련 속도도 높여 준다고 한다.
 

AWS 세이지메이커 그라운드 트루스 작동방식. [자료=NIA 보고서]


MS의 클라우드서비스 '애저' 기반 AI·머신러닝 플랫폼은 다양한 오픈소스·언어 사용환경을 지원한다.

NIA에 따르면 MS는 일찍부터 애저를 '지능형 클라우드'로 선언했고 비교적 다양한 사용자가 여러 단계에서 AI 기술을 활용할 수 있게 했다. 애저 환경에서 머신러닝 전 단계를 관리하는 'MLflow', 쿠버네티스 기반 머신러닝 툴 쿠버플로(Kubeflow), 텐서플로(TensorFlow), 파이토치(PyTorch), 파이썬, R 등의 오픈소스 프레임워크·라이브러리·언어를 지원한다.

다른 기업들과 마찬가지로 자동화된 머신러닝(Auto ML)과 MLOps, 책임성을 갖는 AI 개발이나 오픈소스 라이브러리 지원 서비스도 내놓았다. 사전학습된 모델 기반 서비스인 '코그니티브(Cognitive) 서비스'로 기업에 필요한 AI 앱 개발을 위한 컴퓨터 비전 기반 영상·사진 분석, 사물·얼굴·서식 인식, 동영상 색인 제작도구 '비디오인덱서' 등을 제공한다.

애저는 AI 기반 지식 네트워크 '코텍스(Cortex)'를 구독형 소프트웨어 '마이크로소프트365'에 결합된 서비스로 제공한다. 코텍스 AI는 업무 자료·콘텐츠에 대한 추론으로 중요 정보를 추출하거나 고객·제품 관점에서 내용을 자동으로 재구성할 수 있다. 아웃룩 메일함 같은 외부 저장소와 연결해 일정관리를 자동화하는 등 AI와 결합된 업무 시나리오를 지원한다.
 

MS애저 기반 머신러닝 자동화 프로세스. [자료=NIA 보고서]


구글클라우드는 'AI 플랫폼'이라는 이름으로 모델 개발환경을 제공한다.

NIA는 보고서를 통해 구글클라우드가 "AI와 머신러닝을 위한 파이프라인 전체를 아우르는 기능을 모두 제공하고 있는데 여기에 데이터를 준비하기 위한 레이블링, 클라우드 스토리지, 전문지식이 부족한 개발자도 니즈에 맞게 고품질 모델을 준비하게 하는 '클라우드 오토ML'과 시각·자연어·정형데이터 처리를 위한 사전학습 모델을 제공"한다고 설명했다.

이어 구글클라우드에 "다른 클라우드 기업과 달리 모델의 공정성이나 설명을 지원하게 만드는 왓이프나 AI 설명 기능이 들어가 있는 것이 특별"하다고 평가했다. 구글클라우드는 AWS와 마찬가지로 '데브옵스' 개념을 머신러닝에 적용한 'MLOps 파이프라인' 개념을 도입하고 있고 이를 각 단계별로 지원하는 기능을 제공하는 것으로 분석됐다.

구글클라우드는 지난해 10월부터 AI 플랫폼 위에 머신러닝 파이프라인을 위한 매니지드서비스를 제공했다. 업계에 널리 사용되는 모델 제작 프레임워크 '텐서플로'에 구글클라우드가 사전 구성한 컴포넌트와 템플릿을 결합한 '텐서플로익스텐디드' 라이브러리를 활용할 수 있게 했다. 메타데이터 관리 서비스로 성능 모니터링, 디버깅 등 모델 관리를 간소화해 준다.
 

구글클라우드 MLOps 작동 흐름. [자료=NIA 보고서]