구글 클라우드가 기업이 데이터 기반의 신속한 의사결정을 지원할 수 있도록 클라우드 기반 데이터 시스템 포트폴리오를 강화한다고 27일 밝혔다.
핵심 내용은 최근 공개한 '빅레이크'다. 빅레이크는 데이터 레이크와 데이터 웨어하우스를 통합한 시스템으로, 구글의 데이터 웨어하우스 시스템인 '빅쿼리'를 데이터 레이크로 확장해 페타바이트(PB)급의 비정형 데이터까지도 실시간으로 분석할 수 있는 역량을 제공한다.
데이터 웨어하우스는 기업이 그간 비즈니스를 통해 얻은 정보를 정형화해 보관하고, 과거 성과를 확인할 수 있도록 지원하는 시스템이다. 이와 달리 데이터 레이크는 비즈니스 과정에서 발생한 비정형 데이터를 인공지능(AI) 등으로 분석하고 미래 전략을 수립하기 위해 쓰인다.
기업은 성과 분석과 미래 전략을 위해 두 가지 솔루션을 동시에 활용하고 있으나, 이 때문에 솔루션과 인프라에 대한 중복 투자가 발생하고, 특히 동일한 데이터를 서로 다른 유형(정형·반정형·비정형 등)으로 가공해 활용하기 때문에 데이터가 각 솔루션에 고립되는 '사일로화'도 발생한다. 특히 이러한 데이터 유형과 관리정책 차이로 인해 데이터를 공유하기 어려워, 데이터 분석가와 AI 모델 개발자 등 담당자 사이의 소통 역시 원활히 이뤄지지 못한다.
황경태 구글 클라우드 매니저는 "빅레이크는 데이터 한계를 극복하는 솔루션으로, 데이터 레이크와 데이터 웨어하우스를 통합해 사일로화를 없이고, 데이터 관리 리스크와 운영 비용을 낮출 수 있다. 특히 구글 클라우드 빅쿼리의 혁신 기능을 모두 활용할 수 있는 것이 가장 큰 강점"이라고 강조했다.
빅레이크는 데이터 레이크와 데이터 웨어하우스를 통합한 '데이터 레이크 스토리지 엔진'으로, 기업이 개방형 분석 엔진과 여러 공급사의 클라우드 저장소를 동시에 활용할 수 있도록 지원한다. 빅레이크를 통해 저장소의 종류나 파일을 저장하는 방식과 관계없이 데이터를 분석할 수 있으며, 서로 다른 저장소 사이에 데이터를 복제하거나 옮길 필요도 없어 운영 비용 절감과 효율성을 높일 수 있다.
빅레이크는 빅쿼리의 데이터 웨어하우스 성능을 데이터 레이크 스토리지로 확장했다는 점에서 타 사 대비 차별화된 경쟁력이 있다. 특히 빅쿼리는 구글의 강점인 '검색' 노하우를 집약한 기술이다. 기업은 빅레이크를 통해 대규모 정형·비정형 데이터를 안전하고 유연한 환경에서 실시간으로 분석할 수 있으며, 특히 구글의 기계학습(ML)과 AI와도 직접 연결해 데이터 활용 모델을 신속히 구축할 수 있는 것이 장점이다.
구글 클라우드에 따르면 화물운송기업 UPS는 구글의 데이터 플랫폼을 활용해 배송 서비스를 최적화해 연간 4억 달러(약 5059억원)의 주유비를 절감할 수 있었으며, 월마트는 데이터 처리 시간을 23% 단축해 회계장부 마감 업무를 3일가량 줄였다.
구글 클라우드는 이와 함께 빠른 AI 모델 개발과 손쉬운 유지보수를 지원하는 '버텍스 AI 워크벤치'를 정식 출시했다. 버텍스 AI 워크벤치는 데이터와 ML 시스템을 통합된 인터페이스에서 제공해, 데이터를 활용해야 하는 모든 부서에서 분석, 데이터 과학, ML 등을 위한 공통된 도구를 사용할 수 있도록 지원한다. 또한, 모ML 모델 유지보스를 간소화할 수 있도록 AI 모델 레지스트리에 신규 ML옵스(MLOps) 기능을 프리뷰 버전으로 공개했다.
이외에도 구글 클라우드는 통합형 비즈니스 인텔리전스 플랫폼 '루커용 커넥티드 시트'와 '데이터 스튜디오'에서 루커 데이터 모델을 활용할 수 있는 기능을 발표했다. 이를 통해 사용자는 더 쉽게 데이터에 접근하고, 보기 쉬운 형태로 가공·연산해 동료와 협업할 수 있다.
김정훈 구글 클라우드 데이터 분석 전문가는 "AI 기반 의사결정으로 기업은 비즈니스 과제를 개선하고 있다. 유통에서 소비자에게 고도화한 개인화 제품 추천을 제공하고, 금융 서비스에서는 수상한 거래를 탐지하는 자금세탁방지 업무에 AI를 활용한다. 구글 클라우드는 앞으로도 많은 국내 기업이 AI를 활용해 데이터 기반 혁신을 가속화하도록 지원할 것"이라고 말했다.
핵심 내용은 최근 공개한 '빅레이크'다. 빅레이크는 데이터 레이크와 데이터 웨어하우스를 통합한 시스템으로, 구글의 데이터 웨어하우스 시스템인 '빅쿼리'를 데이터 레이크로 확장해 페타바이트(PB)급의 비정형 데이터까지도 실시간으로 분석할 수 있는 역량을 제공한다.
데이터 웨어하우스는 기업이 그간 비즈니스를 통해 얻은 정보를 정형화해 보관하고, 과거 성과를 확인할 수 있도록 지원하는 시스템이다. 이와 달리 데이터 레이크는 비즈니스 과정에서 발생한 비정형 데이터를 인공지능(AI) 등으로 분석하고 미래 전략을 수립하기 위해 쓰인다.
기업은 성과 분석과 미래 전략을 위해 두 가지 솔루션을 동시에 활용하고 있으나, 이 때문에 솔루션과 인프라에 대한 중복 투자가 발생하고, 특히 동일한 데이터를 서로 다른 유형(정형·반정형·비정형 등)으로 가공해 활용하기 때문에 데이터가 각 솔루션에 고립되는 '사일로화'도 발생한다. 특히 이러한 데이터 유형과 관리정책 차이로 인해 데이터를 공유하기 어려워, 데이터 분석가와 AI 모델 개발자 등 담당자 사이의 소통 역시 원활히 이뤄지지 못한다.
빅레이크는 데이터 레이크와 데이터 웨어하우스를 통합한 '데이터 레이크 스토리지 엔진'으로, 기업이 개방형 분석 엔진과 여러 공급사의 클라우드 저장소를 동시에 활용할 수 있도록 지원한다. 빅레이크를 통해 저장소의 종류나 파일을 저장하는 방식과 관계없이 데이터를 분석할 수 있으며, 서로 다른 저장소 사이에 데이터를 복제하거나 옮길 필요도 없어 운영 비용 절감과 효율성을 높일 수 있다.
빅레이크는 빅쿼리의 데이터 웨어하우스 성능을 데이터 레이크 스토리지로 확장했다는 점에서 타 사 대비 차별화된 경쟁력이 있다. 특히 빅쿼리는 구글의 강점인 '검색' 노하우를 집약한 기술이다. 기업은 빅레이크를 통해 대규모 정형·비정형 데이터를 안전하고 유연한 환경에서 실시간으로 분석할 수 있으며, 특히 구글의 기계학습(ML)과 AI와도 직접 연결해 데이터 활용 모델을 신속히 구축할 수 있는 것이 장점이다.
구글 클라우드에 따르면 화물운송기업 UPS는 구글의 데이터 플랫폼을 활용해 배송 서비스를 최적화해 연간 4억 달러(약 5059억원)의 주유비를 절감할 수 있었으며, 월마트는 데이터 처리 시간을 23% 단축해 회계장부 마감 업무를 3일가량 줄였다.
구글 클라우드는 이와 함께 빠른 AI 모델 개발과 손쉬운 유지보수를 지원하는 '버텍스 AI 워크벤치'를 정식 출시했다. 버텍스 AI 워크벤치는 데이터와 ML 시스템을 통합된 인터페이스에서 제공해, 데이터를 활용해야 하는 모든 부서에서 분석, 데이터 과학, ML 등을 위한 공통된 도구를 사용할 수 있도록 지원한다. 또한, 모ML 모델 유지보스를 간소화할 수 있도록 AI 모델 레지스트리에 신규 ML옵스(MLOps) 기능을 프리뷰 버전으로 공개했다.
이외에도 구글 클라우드는 통합형 비즈니스 인텔리전스 플랫폼 '루커용 커넥티드 시트'와 '데이터 스튜디오'에서 루커 데이터 모델을 활용할 수 있는 기능을 발표했다. 이를 통해 사용자는 더 쉽게 데이터에 접근하고, 보기 쉬운 형태로 가공·연산해 동료와 협업할 수 있다.
김정훈 구글 클라우드 데이터 분석 전문가는 "AI 기반 의사결정으로 기업은 비즈니스 과제를 개선하고 있다. 유통에서 소비자에게 고도화한 개인화 제품 추천을 제공하고, 금융 서비스에서는 수상한 거래를 탐지하는 자금세탁방지 업무에 AI를 활용한다. 구글 클라우드는 앞으로도 많은 국내 기업이 AI를 활용해 데이터 기반 혁신을 가속화하도록 지원할 것"이라고 말했다.