"GPT-3 따라잡아라" 네이버, 세계 1위급 슈퍼컴 도입
2020-10-08 14:22
네이버, 700PF급 병렬 슈퍼컴퓨터 시스템 도입... 기존 1위 日 '후가쿠' 뛰어넘어
영어 특화된 GPT-3 따라잡을 차세대 AI 언어모델 개발 나서... 한국·일본어 특화
영어 특화된 GPT-3 따라잡을 차세대 AI 언어모델 개발 나서... 한국·일본어 특화
네이버가 국내 민간 기업 최초로 전 세계에서도 손꼽히는 성능의 슈퍼컴퓨터를 도입하고, 이를 활용한 차세대 인공지능(AI) 언어모델 개발에 나선다.
구체적으로 네이버는 엔비디아 GPGPU(범용GPU) 클러스터 기반의 슈퍼컴퓨터를 병렬로 연결, 700PF(페타플롭스) 이상의 성능을 확보한 후 클로바AI팀에서 연구 중인 'CLaF(클로바랭기지프레임워크)'를 고도화해 한국어·일본어용 초거대 언어 모델을 완성할 계획이다.
이러한 네이버의 계획이 현실화되면 오픈AI의 언어모델 'GPT-3' 기반 AI를 뛰어넘는 차세대 한국어·일본어 AI 모델이 시장에 등장할 것으로 기대된다.
구체적으로 네이버는 엔비디아 GPGPU(범용GPU) 클러스터 기반의 슈퍼컴퓨터를 병렬로 연결, 700PF(페타플롭스) 이상의 성능을 확보한 후 클로바AI팀에서 연구 중인 'CLaF(클로바랭기지프레임워크)'를 고도화해 한국어·일본어용 초거대 언어 모델을 완성할 계획이다.
이러한 네이버의 계획이 현실화되면 오픈AI의 언어모델 'GPT-3' 기반 AI를 뛰어넘는 차세대 한국어·일본어 AI 모델이 시장에 등장할 것으로 기대된다.
네이버가 국내 민간 기업 최초로 10월 중 자사 데이터센터에 슈퍼컴퓨터(HPC) 환경을 구축하고 AI 기술 경쟁력을 한 단계 끌어올릴 계획이라고 8일 밝혔다.
이를 위해 네이버는 검색, 메신저 등 네이버 서비스에서 확보한 방대한 언어 데이터를 빠르고 정확하게 분석할 수 있도록 미국의 AI 반도체 기업 엔비디아와 협력해 700PF 이상의 슈퍼컴퓨터를 도입한다.
현재 슈퍼컴퓨터 톱500(6월)에 따르면, 전 세계 슈퍼컴퓨터 중 가장 빠른 시스템은 약 415PF의 연산능력을 갖춘 일본의 '후가쿠(Fugaku)' 시스템이다. 별도의 GPGPU를 탑재하지 않고 커스텀한 ARM 칩셋을 병렬 연결한 슈퍼컴퓨터를 개발함으로써 일본은 9년 만에 슈퍼컴퓨터 성능 1위를 탈환할 수 있었다.
반면 네이버의 슈퍼컴퓨터는 현재 톱500 2위에 랭크된 미국 서미트(약 200PF)와 유사한 형태로 구축한다. 엔비디아의 볼타 기반 GPGPU를 병렬로 연결해 연산능력을 끌어올리고, 이를 고성능 중앙처리장치(CPU)가 관리한다. 후가쿠나 중국 '선웨이 타이후라이트'처럼 전용 연산장치(ASIC)를 개발해 만드는 게 아니라 범용 CPU와 GPGPU를 최대한 효율적으로 배치하는 형태다. 다만 네이버는 고성능 CPU를 공급하는 업체는 공개하지 않았다.
네이버의 슈퍼컴퓨터는 여러 대의 서미트급 슈퍼컴퓨터를 병렬로 연결해 700PF의 연산력을 확보했다. 따라서 네이버 슈퍼컴퓨터가 가동에 들어가도 단일 기기 연산력을 기준으로 삼는 톱500의 1위를 차지하는 것은 어렵다.
대신 네이버 슈퍼컴퓨터의 개별 성능도 100~200PF에 달할 것으로 예측되는 만큼 무난히 5위권에 이름을 올릴 것으로 기대된다.
현재 톱500에 이름을 올린 국내 슈퍼컴퓨터는 한국과학기술정보연구원(KISTI)의 누리온(18위)과 기상청의 누리·미리(139·140위) 등 3대에 불과했으나, 여기에 네이버의 슈퍼컴퓨터가 새로 추가될 것이란 설명이다.
네이버는 이렇게 도입한 슈퍼컴퓨터를 GPT-3와 경쟁할 수 있는 한국어·일본어 초거대 AI 언어모델을 만드는 데 활용할 계획이다.
올해 상반기 공개된 GPT-3는 사람처럼 자연스럽게 대화할 수 있는 AI 모델을 만들 수 있어 AI 업계에 충격을 가져왔다. 이에 구글, 페이스북 등 글로벌 기업도 올 하반기부터 GPT-3처럼 자연스러운 대화가 가능한 AI 언어모델 개발에 박차를 가하고 있다.
특히 구글은 4096개의 '4세대 TPU(텐서플로유닛)'를 병렬 연결한 슈퍼컴퓨터 환경을 구축해 자사의 AI 언어모델인 'BERT' 강화에 나섰다. 단 한 대의 TPU만으로 가장 최신 버전의 바둑 AI인 '알파고 제로'를 실행할 수 있다. 차세대 AI 언어모델을 개발하려면 이처럼 슈퍼컴퓨터급 연산능력을 필수적으로 확보해야 한다.
네이버는 GPT-3의 주 영역인 영어 대신 한국어·일본어에 특화된 차세대 AI 언어모델을 만든다. 이를 통해 한·일 이용자와 기업에게 새로운 서비스 경험을 제공함으로써 GPT-3로 접근하기 힘든 아시아 지역에 특화된 AI 사업 모델을 만들 계획이다. 업계에선 기존에 연구하던 AI 언어모델 'LaRva'의 후속 모델이 될 것으로 예측하고 있다.
정석근 네이버 클로바 CIC(사내벤처) 대표는 "네이버 클로바는 네이버, 라인 등의 서비스로 방대한 데이터를 확보했다. 이를 기반으로 초거대 AI 언어모델을 구축해 기업과 개인 창작자까지 사업과 창작에 더욱 집중할 수 있도록 돕는 도구를 만들고자 한다. 네이버는 AI 기술 연구개발에 필요한 인프라와 인재를 지속해서 확충해 글로벌 AI 기술 트렌드를 선도할 계획이다"고 말했다.
현재 슈퍼컴퓨터 톱500(6월)에 따르면, 전 세계 슈퍼컴퓨터 중 가장 빠른 시스템은 약 415PF의 연산능력을 갖춘 일본의 '후가쿠(Fugaku)' 시스템이다. 별도의 GPGPU를 탑재하지 않고 커스텀한 ARM 칩셋을 병렬 연결한 슈퍼컴퓨터를 개발함으로써 일본은 9년 만에 슈퍼컴퓨터 성능 1위를 탈환할 수 있었다.
반면 네이버의 슈퍼컴퓨터는 현재 톱500 2위에 랭크된 미국 서미트(약 200PF)와 유사한 형태로 구축한다. 엔비디아의 볼타 기반 GPGPU를 병렬로 연결해 연산능력을 끌어올리고, 이를 고성능 중앙처리장치(CPU)가 관리한다. 후가쿠나 중국 '선웨이 타이후라이트'처럼 전용 연산장치(ASIC)를 개발해 만드는 게 아니라 범용 CPU와 GPGPU를 최대한 효율적으로 배치하는 형태다. 다만 네이버는 고성능 CPU를 공급하는 업체는 공개하지 않았다.
대신 네이버 슈퍼컴퓨터의 개별 성능도 100~200PF에 달할 것으로 예측되는 만큼 무난히 5위권에 이름을 올릴 것으로 기대된다.
현재 톱500에 이름을 올린 국내 슈퍼컴퓨터는 한국과학기술정보연구원(KISTI)의 누리온(18위)과 기상청의 누리·미리(139·140위) 등 3대에 불과했으나, 여기에 네이버의 슈퍼컴퓨터가 새로 추가될 것이란 설명이다.
네이버는 이렇게 도입한 슈퍼컴퓨터를 GPT-3와 경쟁할 수 있는 한국어·일본어 초거대 AI 언어모델을 만드는 데 활용할 계획이다.
올해 상반기 공개된 GPT-3는 사람처럼 자연스럽게 대화할 수 있는 AI 모델을 만들 수 있어 AI 업계에 충격을 가져왔다. 이에 구글, 페이스북 등 글로벌 기업도 올 하반기부터 GPT-3처럼 자연스러운 대화가 가능한 AI 언어모델 개발에 박차를 가하고 있다.
특히 구글은 4096개의 '4세대 TPU(텐서플로유닛)'를 병렬 연결한 슈퍼컴퓨터 환경을 구축해 자사의 AI 언어모델인 'BERT' 강화에 나섰다. 단 한 대의 TPU만으로 가장 최신 버전의 바둑 AI인 '알파고 제로'를 실행할 수 있다. 차세대 AI 언어모델을 개발하려면 이처럼 슈퍼컴퓨터급 연산능력을 필수적으로 확보해야 한다.
네이버는 GPT-3의 주 영역인 영어 대신 한국어·일본어에 특화된 차세대 AI 언어모델을 만든다. 이를 통해 한·일 이용자와 기업에게 새로운 서비스 경험을 제공함으로써 GPT-3로 접근하기 힘든 아시아 지역에 특화된 AI 사업 모델을 만들 계획이다. 업계에선 기존에 연구하던 AI 언어모델 'LaRva'의 후속 모델이 될 것으로 예측하고 있다.
정석근 네이버 클로바 CIC(사내벤처) 대표는 "네이버 클로바는 네이버, 라인 등의 서비스로 방대한 데이터를 확보했다. 이를 기반으로 초거대 AI 언어모델을 구축해 기업과 개인 창작자까지 사업과 창작에 더욱 집중할 수 있도록 돕는 도구를 만들고자 한다. 네이버는 AI 기술 연구개발에 필요한 인프라와 인재를 지속해서 확충해 글로벌 AI 기술 트렌드를 선도할 계획이다"고 말했다.