"엔비디아 종속된 AI 시장 개선해야"...인텔·네이버 AI칩 공동전선
2024-06-05 14:14
엔비디아 독점=기업 AI 비용 증가로 이어져
저렴하고 더 좋은 AI칩 '가우디' 공급 강조
네이버·스퀴즈비츠, 가우디 SW 생태계 조성...오픈소스로 공개
저렴하고 더 좋은 AI칩 '가우디' 공급 강조
네이버·스퀴즈비츠, 가우디 SW 생태계 조성...오픈소스로 공개
인텔코리아는 5일 서울 서초구 JW메리어트 호텔에서 '인텔 AI 서밋 서울 2024'를 개최하고 이러한 내용을 담은 양사 협력 방안을 공개했다.
행사 기조연설을 진행한 저스틴 호타드 인텔 데이터센터·AI부문 부사장은 엔비디아에 대항해 AI칩 '개방형 생태계'를 강조했다. 호타드 부사장은 인텔이 AI 데이터센터 사업을 강화하기 위해 지난 2월 HPE에서 영입한 인물이다.
그는 먼저 "2030년까지 모든 기업은 AI 기업이 될 것이고 이를 통해 AI 반도체 시장은 1조 달러(약 1370조원) 규모에 도달할 것"이라고 말했다.
하지만 지난해 생성 AI를 상용화하는 데 성공한 기업은 전체 기업의 약 10% 수준에 불과하며, 생성 AI에 대한 기업 지출은 2027년까지 4배 이상 늘어날 것이라는 게 호타드 부사장의 주장이다.
생성 AI 구축·운영을 위한 비용이 급격히 늘어나는 이유에 관해 호타드 부사장이 따로 설명하지는 않았다.
하지만 현재 AI 반도체 시장을 사실상 독점하고 있는 엔비디아를 겨냥한 발언으로 해석된다. 특정 기업이 시장을 독점하면서 AI 서버 가격이 지속해서 상승하고 기업 AI 서비스 구축·운영에 부담으로 작용한다는 것이다.
이런 문제를 해소하기 위해 인텔은 자사 AI 반도체 '가우디'를 엔비디아의 동급 AI칩보다 30~60% 저렴한 가격에 공급하기로 했다. 구체적으로 8개의 '가우디3'를 탑재한 AI 서버는 12만5000달러, 8개의 '가우디2'를 탑재한 AI 서버는 6만5000달러에 공급한다.
호타드 부사장은 저렴한 가격뿐 아니라 기업과 개발자를 위한 하드웨어·소프트웨어 개방형 생태계를 지원하는 게 인텔과 가우디 플랫폼의 강점이라고 설명했다.
그는 "가우디3는 효율적인 대규모 AI 컴퓨팅을 위해 설계된 최신 AI 반도체"라며 "첨단 아키텍처와 HBM(고대역폭 메모리) D램을 토대로 더 빠른 생성 AI 학습·추론 성능을 제공한다"고 말했다.
인텔에 따르면 가우디3는 엔비디아의 동급 데이터센터GPU와 비교해 2배 더 우수한 총소유비용(TCO)이 특징이다.
일례로 8192개의 가우디3를 연결한 슈퍼컴퓨터(HPC)는 같은 규모의 엔비디아 H100 기반 슈퍼컴퓨터와 비교해 AI 모델 학습 속도가 최대 40%, 64개의 가우디3를 연결한 AI 서버는 H100 기반 AI 서버보다 라마2-70B(매개변수 700억개) 모델 학습 속도가 최대 15% 더 빠르다고 밝혔다.
호타드 부사장은 "한국의 대표 IT·클라우드 기업인 네이버를 필두로 독일 보쉬, 인도 올라·크루트림 등이 가우디를 도입해 생성 AI 학습·추론에 활용하고 있다"고 전했다.
하 센터장은 "가우디를 기반으로 vLLM(시각대형언어모델) 운영을 위한 여러 실험을 진행하고 관련 결과를 오픈소스로 문서화해서 공개할 것"이라고 말했다.
인텔·네이버·카이스트·스퀴즈비츠 등은 지난 4월 AI 반도체 개방형 생태계 조성을 위해 협력하기로 하고 이와 관련해 AI 공동연구센터를 조성했다. 스퀴즈비츠는 무거운 AI 모델 경량화(압축) 관련 연구를 하는 AI 스타트업이다.
하 센터장은 "기업 입장에서 특정 회사가 AI칩 시장을 독점하는 것은 행복한 시나리오가 아니다. 공급 우선순위 문제가 생길 수 있기 때문"이라며 "그점에서 (엔비디아 등) 특정 GPU(AI 반도체)에 종속된 현재 AI 시장 상황은 개선돼야 한다"고 말했다.
인텔과 네이버, 두 회사의 뜻이 일치하는 부분이다. 하 센터장은 "대규모 생성 AI 서비스(하이퍼클로바X)를 직접 개발해서 운영해본 기업(네이버)만 AI 반도체를 제대로 다룰 수 있다"고 주장했다.
그러면서 "네이버는 인텔이 가우디2 하드웨어를 제공하면 스퀴즈비츠와 함께 가우디에서 AI 모델 학습·트레이닝을 할 수 있는 기본 프로그래밍 코드를 만든 후 이를 국내 대학 연구실에 제공할 예정"이라고 구체적인 양사 협업 구도에 관해 설명했다.
기조연설이 끝나고 진행한 기자간담회에서 호타드 부사장은 가우디3의 후속제품인 '팔콘쇼어'에 관해 언급하기도 했다.
가우디가 AI 모델 학습·추론에 특화한 제품이라면, 내년 말 출시하는 팔콘쇼어는 AI뿐만 아니라 대규모 시뮬레이션 연산 등 전통적인 슈퍼컴퓨터 영역에도 강점이 있는 제품이다. 단종한 슈퍼컴퓨터용 보조연산장치 '데이터센터GPU 맥스'와 가우디 제품군을 하나로 합치겠다는 야심이다.
다만 호타드 부사장은 가우디2와 가우디3가 최신 HBM인 HBM3E(5세대) D램을 속속 채택하는 경쟁사 제품과 달리 구형 HBM인 HBM2E(3세대) D램을 쓰는 이유에 관해 뾰족한 해답을 내놓지 못했다. 그는 "가우디는 프로세서와 메모리 간 균형과 성능 효율성을 중시해서 설계한 제품"이라고 말했다. 팔콘쇼어에 탑재하는 HBM D램의 종류와 제작사는 아직 알려지지 않았다.