"레니게이드, 엔비디아 AI칩보다 전성비 60% 우수"...백준호 퓨리오사AI 대표 자신감
2024-08-28 10:25
엔비디아 최상위 추론용 칩과 대등한 성능, 전력소모는 절반 이하
SK하닉 HBM3 탑재하고 TSMC 5나노 공정서 양산
"SW 지원에 집중...라마 3.1 100B LLM 추론"
SK하닉 HBM3 탑재하고 TSMC 5나노 공정서 양산
"SW 지원에 집중...라마 3.1 100B LLM 추론"
28일 반도체 업계에 따르면 백준호 퓨리오사AI 대표는 지난 26일(현지시간) 미국 캘리포니아주 스탠퍼드대에서 열린 '핫칩스 2024' 행사에서 "레니게이드는 엔비디아의 추론용 AI칩과 대등한 추론 성능을 갖췄음에도 전력대 성능비가 약 60% 우수하다"고 발표했다.
구체적으로 레니게이드가 소형언어모델(SLM, MLPerf GPT-J 6B 모델 기준)을 추론할 때 초당 12의 쿼리(8비트 부동소수점)를 처리하면서 185W(와트)의 전력을 사용했는데, 경쟁 제품인 엔비디아 'L40s'는 초당 12.3 쿼리를 처리하면서 320W의 전력을 소모했다.
L40s는 엔비디아의 학습·추론용 AI칩 'H100' 다음에 위치하는 최상위 추론용 AI칩으로, 구형 학습·추론용 AI칩인 'A100'을 넘어서는 성능을 갖춘 제품이다.
업계에선 이번 백 대표의 발표를 두고 국산 AI칩의 성능이 엔비디아와 대등한 수준으로 올라선 것이 확인됐다는 점에서 의의가 크다고 평가했다. 특히 소비자용 GPU(그래픽처리장치) '에이다 러브레이스'의 설계를 그대로 활용해서 전력 낭비가 큰 L40s와 달리 기업 AI 서비스·데이터센터 운영비 절감을 위해 전력 소모 감축에 집중한 것에 주목하고 있다. 국산 AI칩이 GPU보다 AI 운영비 절감 면에서 유리하다는 것을 전 세계 반도체 전문가들 앞에서 입증한 것이다.
퓨리오사AI가 직접 설계한 AI칩인 레니게이드는 SK하이닉스가 공급한 HBM3(4세대 고대역폭 메모리) D램을 탑재하고 TSMC 5㎚(나노미터) 공정에서 양산된다. 지난 5월 첫 번째 샘플칩이 나왔고 7월부터 고객사에 실제 AI칩 전달을 시작했다. 지속해서 레니게이드 생산량을 확대함으로써 내년 초에는 고객사가 원하는 AI칩 수량을 충분히 공급할 수 있을 것으로 회사 측은 기대하고 있다.
퓨리오사AI에 따르면 레니게이드는 단입 칩에서 매개변수 80억(8B)에서 100억개(10B)의 소형언어모델을 추론할 수 있다. AI 서버에 8개의 레니게이드를 연결해 매개변수 1000억개(100B)의 초거대언어모델(LLM) 추론도 지원한다.
이러한 AI 서버 사업을 위해 퓨리오사AI는 대만 에이수스에 이어 슈퍼마이크로와도 협력하기로 했다. 양사 협력으로 향후 기업들은 슈퍼마이크로에서 AI 서버를 도입할 때 엔비디아 GPU뿐만 아니라 레니게이드도 옵션으로 선택할 수 있게 될 전망이다.
이를 두고 빅 말얄라 슈퍼마이크로 AI부문 수석 부사장은 "퓨리오사AI의 레니게이드 추론 솔루션은 슈퍼마이크로와 함께 친환경 컴퓨팅의 도입을 주도하고 있다"며 "퓨리오사AI의 기술을 통합함으로써 슈퍼마이크로 시스템은 칩당 전력 소비를 줄이면서도 뛰어난 추론 성능을 제공할 수 있었다"고 설명했다.
백 대표에 따르면 퓨리오사AI는 전체 연구개발 인력의 70%를 소프트웨어 전문가로 구성할 만큼 AI칩 소프트웨어 생태계 구축에 집중하고 있다. 이러한 노력이 성과를 거둬 레니게이드는 ONNX뿐만 아니라 파이토치를 활용해 AI칩과 AI 모델을 연결할 수 있게 됐다. 이를 토대로 퓨리오사AI는 지난 6월 레니게이드에서 메타의 오픈소스 LLM '라마 3.1'을 추론하며 시중의 오픈소스 AI 모델 지원을 위한 모든 준비를 마쳤음을 알렸다. 퓨리오사AI는 지속해서 소프트웨어 성능을 개선함으로써 기업이 AI칩을 더 효과적으로 추론할 수 있도록 지원할 방침이다.
업계에 따르면 퓨리오사AI는 네이버, LG AI연구원 등에 레니게이드 샘플칩을 제공하고 공동으로 성능 검증에 나섬으로써 내년부터 본격적으로 AI칩 판매 관련 매출·영업이익이 발생할 것으로 기대하고 있다. 이와 함께 해외 주요 클라우드 서비스(CSP) 기업에도 레니게이드를 공급해 이들을 고객사로 확보할 계획이다.
한편 퓨리오사AI는 차세대 AI칩 개발을 위한 자금조달을 위해 2025년 하반기를 목표로 기업공개(IPO)를 준비 중이다. IPO 주관사로는 미래에셋증권과 NH투자증권을 선정했다.