“AI 반도체 기업이라면 하드웨어는 물론 소프트웨어를 잘해야 승산이 있다. 고성능 AI 반도체 상용화에 따라 글로벌 기대감이 커지고 있다.”
백준호 퓨리오사AI 대표는 25일 서울 중구 플라자호텔에서 아주경제신문 주최로 열린 ‘제16회 착한 성장, 좋은 일자리 글로벌포럼(2024 GGGF)’에서 이같이 말하면서 퓨리오사AI가 개발한 차세대 AI 가속기 ‘레니게이드(RNGD)'에 대해 소개했다.
레니게이드는 1세대 워보이(Warboy)에 이어 두 번째로 공개되는 AI 가속기다. 총 48GB HBM3 메모리와 엔비디아 L40S 대비 최대 60% 이상 높은 전력 소모대 성능비를 갖췄다고 백 대표는 설명했다.
이날 백 대표는 레니게이드와 엔비디아 제품을 구체적으로 비교하며 자사 제품에 대해 자신감을 드러냈다. 그는 “레니게이드가 벤치마크에서 초당 11.5 쿼리를 처리하는 동안 전력은 185와트를 사용했다. 엔비디아 L40S는 초당 12.3 쿼리를 처리하는 동안 전력을 320와트 사용했다”고 말했다. 그러면서 “레니게이드는 추론에 대한 업계의 실제 요구 사항을 충족하는 지속 가능하고 접근 가능한 AI 컴퓨팅 솔루션”이라고 강조했다.
퓨리오사AI는 파트너인 파운드리 업체 TSMC에서 첫 번째 실리콘 샘플을 받은 후 레니게이드의 전체 가동을 성공적으로 완료했다. 레니게이드는 SK하이닉스가 공급한 HBM3(4세대 고대역폭 메모리) D램을 탑재하고 TSMC 5㎚(나노미터) 공정에서 양산된다.
아울러 레니게이드는 단입 칩에서 매개변수 80억개(8B)에서 100억개(10B)의 소형언어모델을 추론할 수 있다. AI 서버에 8개의 레니게이드를 연결해 매개변수 1000억개(100B)의 초거대언어모델(LLM) 추론도 지원한다.
백 대표는 “공격적으로 개발하고 설계에 발 빠르게 나서 좋은 결과를 냈다고 생각한다”며 “올해 말까지 다양한 모델을 대상으로 경쟁력을 확보할 계획”이라고 말했다. 그러면서 “일각에선 이미 엔비디아가 너무 앞서가고 있어서 잘 되겠느냐는 의문도 있으나 설계 경쟁력과 제품 고도화 등을 통해 승산이 있다고 본다”며 “우리도 반도체 영역에서 선두로 나갈 수 있다”고 강조했다.
한편 2017년 설립된 퓨리오사AI는 고성능 AI 반도체에 필요한 하드웨어와 소프트웨어를 설계·개발하는 국내 스타트업이다. 2021년 1세대 칩 ‘워보이’를 출시했고, 이후 글로벌 최초로 고대역폭메모리(HBM3)를 탑재한 추론용 칩인 ‘레니게이드’를 개발해 지난 5월 TSMC에서 첫 샘플을 공급받았다. 퓨리오사AI는 지속해서 소프트웨어 성능을 향상시켜 기업이 AI칩을 더 효과적으로 추론할 수 있도록 지원한다는 방침이다.