[하이테크리포트] "엔비디아 비켜"… 2세대 K-AI 반도체, 글로벌 공략 나선다
2023-11-28 00:15
사피온·퓨리오사AI·리벨리온…내년부터 본격 양산
자체 개발에 외부 공급 확대까지
엔비디아 'L 시리즈'와 어깨 나란히
자체 개발에 외부 공급 확대까지
엔비디아 'L 시리즈'와 어깨 나란히
실제로 마이크로소프트(MS)·구글·아마존웹서비스(AWS) 등 글로벌 클라우드 기업들은 자체 AI 반도체를 개발하고, 엔비디아 외에 다른 AI 반도체 사업자 제품도 물색하는 등 공급망 다각화 전략에 나섰다. 이들 기업은 공급망을 다각화함으로써 AI 반도체 시장을 사실상 독점하는 엔비디아가 가격·공급 시기 등을 쥐락펴락하는 것을 최대한 막을 계획이다.
26일 AI업계에 따르면 초거대언어모델(LLM)을 포함한 AI의 두뇌 역할을 하는 AI 반도체 시장에서 '탈(脫) 엔비디아' 열풍이 뜨겁다. 시장조사업체마다 수치는 조금씩 다르지만, 엔비디아는 현재 데이터센터용 AI 반도체 시장에서 90% 이상 점유율을 보이는 것으로 알려졌다.
AI 반도체는 AI 근간이 되는 딥러닝(심층신경망) 학습·추론(실행)에 특화한 '시스템+메모리 통합 반도체'를 말한다. 시장조사업체 가트너는 지난해 423억 달러(약 55조원) 규모였던 AI 반도체 시장이 오는 2027년 1370억 달러(약 178조원) 규모로 5년 만에 세 배 이상 급성장할 것으로 예측했다.
단순연산에 특화한 수만개 코어와 대용량 데이터를 처리할 수 있는 고속 메모리를 탑재해야 하는 AI 반도체 구조는 3차원(3D) 그래픽 출력에 필요한 그래픽처리장치(GPU)와 매우 유사하다. 이에 엔비디아는 10년 전부터 GPU를 AI 학습·추론에 적합하게 일부 변경한 'GPGPU(일반목적용 GPU, 현 데이터센터 GPU)'를 선보이고, AI 모델과 AI 반도체를 연결하는 소프트웨어 '쿠다'를 상용화하며 초거대 AI 시대에 대비했다.
AI 인프라 시장 급성장으로 최근 AWS를 제치고 세계 1위 클라우드 사업자가 된 MS는 지난 15일(현지시간) 연례개발자행사 '이그나이트'에서 자체 개발한 추론용 AI 반도체 '애저 마이아 100'을 공개했다. MS는 애저 마이아 100을 개발하기 위해 AMD·오픈AI와 긴밀히 협력한 것으로 알려졌다. 당장 애저 마이아 100을 클라우드 상품화(AIaaS)하지는 않지만, 사내 AI 서비스 운영에 적극 활용할 방침이다.
AWS도 이번 주 미국 라스베이거스에서 열리는 연례개발자 행사 '리인벤트'에서 자체 개발한 AI 반도체 '인퍼런시아(추론)'와 '트레이니엄(학습)'의 후속 모델을 공개할 전망이다. 특히 AWS는 엔비디아 최고급 AI 반도체 'H100'을 싹쓸이하다시피 사들이고 있는 MS와 달리 엔비디아와 불화로 AI 반도체를 제때 공급받지 못하고 있어 자체 AI 반도체 개발에 더 속도를 낼 것으로 예상된다.
최근 샘 올트먼 최고경영자(CEO)와 이사회 간 분열로 내홍을 겪은 오픈AI도 챗GPT를 포함한 초거대 AI 학습·운영 비용을 절감하고자 올트먼 CEO 주도로 별도 스타트업을 설립, 엔비디아 AI 반도체를 대체할 AI 반도체 개발에 착수할 계획이다.
사피온은 지난 16일 서울 삼성동 코엑스에서 열린 SK그룹 연례 개발자 행사 'SK 테크서밋 2023'에서 2세대 AI 반도체 모델인 'X330'을 공개하고 내년부터 양산한다고 밝혔다. TSMC 28나노미터(㎚) 공정에서 양산된 전작 X220과 달리, X330은 TSMC 7㎚ 공정에서 양산돼 발열과 전력 소모가 크게 줄었다. 전작보다 연산 성능은 4배 이상, 전력효율(TCO)은 2배 이상 향상됐다. 경쟁사의 중급(미드레인지) AI 반도체와 비교해도 시각지능(ResNet 50) 기준 연산 성능은 약 2배, 전력효율은 1.3배 이상 우수하다고 사피온 측은 설명한다.
구체적으로 보면 X330은 8비트 부동소수점(FP8) 연산 기준 367(컴팩트)·734(프라임) 테라플롭스(TFLOPS)의 연산능력을 갖췄고, 75~120·250W의 전력을 소모한다. SK하이닉스가 만든 16·32GB의 GDDR6 D램을 탑재했다.
퓨리오사AI는 지난 17일 삼성동 인터컨티넨탈 서울 코엑스에서 열린 'ARM 테크 심포지아' 행사에서 백준호 대표가 직접 2세대 AI 반도체 모델인 '레니게이드'와 '레니게이드-S'를 공개했다. 현재 반도체 설계를 파운드리로 넘기는 '테이프 아웃' 절차를 마쳤고, 내년 2분기부터 본격 양산한다.
백 대표는 "퓨리오사AI의 1세대 AI 반도체 '워보이'가 시각지능(컴퓨터 비전)에 중점을 뒀다면, 2세대 레니게이드는 LLM을 포함해 모든 AI 작업을 지원하는 게 특징"이라며 "현시점에서 보기 힘든 고대역메모리(HBM3) 기반 제품"이라고 강조했다. 실제로 2세대 K-AI 반도체 가운데 HBM D램을 채택한 것은 레니게이드가 유일하다. 사피온과 리벨리온은 3세대 AI 반도체부터 HBM D램을 탑재할 계획이다.
레니게이드와 레니게이드-S는 각각 512·230 테라플롭스 연산능력을 갖췄고, 150·60W의 전력을 소모한다. 레니게이드는 삼성전자가 만든 것으로 추정되는 48GB HBM3 D램을, 레니게이드-S는 64GB LP(저전력)DDR5 D램을 탑재했다.
리벨리온은 올해 양산한 1세대 AI 반도체 '아톰'을 바탕으로 성능을 한층 끌어올린 2세대 AI 반도체 '아톰 플러스'를 내년 중 선보인다. 칩 설계부터 양산까지 전 과정을 삼성전자와 함께하는 3세대 AI 반도체 '리벨' 개발에도 착수했다. 리벨리온 관계자는 일찍 출시돼 경쟁사 AI 반도체보다 성능이 다소 떨어지는 아톰과 달리 아톰 플러스는 경쟁사를 넘어서는 성능을 보여줄 것이라고 자신했다. 아톰 플러스의 구체적인 성능은 조만간 공개한다.
업계에선 K-AI 반도체 업체들이 급성장하는 추론용 AI 반도체 시장 공략에 집중함으로써 내년부터 엔비디아의 중고가 추론용 AI 반도체 'L 시리즈'와 경쟁할 것으로 본다. 학습·추론용 AI 반도체 'H 시리즈'와 비교해 절대 성능은 다소 낮지만, 전력 소모(TDP)가 우수하고 도입 비용이 저렴해 자체 LLM을 운용하길 원하는 기업과 글로벌 이동통신사의 선호도가 높을 것이란 분석이다. 글로벌 클라우드 기업들도 현재 북미 정보기술(IT) 서비스·서버 업체를 통해 일부 K-AI 반도체 샘플을 전달받은 후 실제 서비스 도입 가능성을 검토하고 있는 것으로 알려졌다. 엔비디아 제품을 충분히 대체할 수 있다는 확신이 서면 도입을 위한 본계약을 맺을 예정이다.