삼성전자·네이버 이어 SKT도 슈퍼컴퓨터 품었다...'초거대 AI' 제작에 총력

2022-06-15 14:00
톱500에 85위로 등재...국내 기업 세 번째 쾌거
'초거대 AI' 학습을 위한 용도...사람과 자연스럽게 대화하는 AI 본격화
미국 슈퍼컴퓨터가 엑사플롭스의 벽 넘어...일본·중국 추격 따돌려

[사진=게티이미지뱅크]

삼성전자, 네이버에 이어 SK텔레콤(SKT)도 글로벌 100위권의 성능을 갖춘 슈퍼컴퓨터(HPC)를 구축했다. 세 회사는 대규모 병렬연산에 최적화된 슈퍼컴퓨터를 활용해 '초거대 AI' 모델 학습과 고도화에 속도를 낼 방침이다. 또, 세계 최고 성능을 갖춘 미국의 슈퍼컴퓨터 '프런티어 시스템'이 1엑사플롭스(1000페타플롭스)의 벽을 넘음에 따라 2022년은 진정한 '엑사스케일'에 도달한 첫해로 기억될 전망이다.

◆사람과 대화하는 SKT '에이닷'의 비결은 슈퍼컴퓨터

15일 전 세계 슈퍼컴퓨터 성능을 집계하는 톱500 재단에 따르면 6월 초 SKT가 구축한 슈퍼컴퓨터 'SKT 타이탄'이 린팩 퍼포먼스 기준 초당 6.29페타플롭스(PFlop/s)의 연산 성능을 기록해 전 세계 슈퍼컴퓨터 순위 85위에 올랐다. 이론상 최대 성능은 초당 7.19페타플롭스를 기록했다. 톱500 재단은 매년 2번 성능 집계를 실시하고 이를 토대로 전 세계 슈퍼컴퓨터 성능 순위를 발표하고 있다.

SKT 타이탄은 대량의 AMD 에픽7763 프로세서(32코어, 2.45GHz)를 멜라녹스 HDR 인피니밴드로 상호 연결함으로써 총 5만6544개의 코어를 갖춘 슈퍼컴퓨터로 완성됐다. 운영체제는 레드햇 엔터프라이즈 리눅스 8.5 버전이며, 인텔 MKL(수학커널라이브러리)을 활용해 AI 모델과 하드웨어를 연결한다. 

이동통신사인 SKT가 슈퍼컴퓨터를 올해 갑작스럽게 도입한 이유는 자사 초거대 AI 모델의 성능을 지속해서 강화하기 위함이다. 현재 SKT는 타이탄을 활용해 초거대 AI가 더 자연스럽게 사람과 대화할 수 있도록 GPT-3 기반 언어 데이터를 가르치고 있다. 기존 고성능 컴퓨터에선 일주일이 넘게 걸릴 AI 모델 학습을 병렬 처리와 인공신경망(딥러닝)에 최적화된 슈퍼컴퓨터에선 수 시간 만에 완료할 수 있다. 

실제로 SKT는 이렇게 강화된 초거대 AI 모델을 활용해 5월 초 친구처럼 자연스럽게 사람과 대화하는 성장형 AI 서비스 '에이닷(A.)'을 출시할 수 있었다. SKT는 지속해서 에이닷의 대화 능력을 강화함으로써 급성장할 것으로 예상되는 국내외 AI 비서 시장을 공략할 방침이다.

이번 슈퍼컴퓨터 구축으로 SKT는 국내에서 슈퍼컴퓨터를 자체 운영하는 세 회사 중 하나로 이름을 올렸다.

◆국내 슈퍼컴퓨터 1위는 삼성전자...네이버도 초거대 AI 개발에 활용

현재 국내에서 가장 강력한 슈퍼컴퓨터는 삼성전자가 보유한 'SSC-21'이다. 삼성전자가 지난해 구축한 SSC-21은 초당 25.18페타플롭스의 성능으로 전 세계 15위에 오른 것으로 조사됐다. 이론상 최대 성능도 초당 31.75페타플롭스에 달한다. SSC-21은 AMD 에픽7543 프로세서(32코어, 2.8GHz)를 상호 연결하는 형태로 구성되어 있고, 엔비디아의 AI 반도체를 추가로 탑재해 연산 능력을 끌어올렸다.

삼성전자 SSC-21은 15위권 이내 상위 슈퍼컴퓨터 중에서 마이크로소프트 '보이저-EUS2(13위)'와 함께 민간 기업이 현업에서 AI 개발과 초고성능 연산을 위해 슈퍼컴퓨터를 구축한 둘뿐인 사례다. 삼성전자와 마이크로소프트의 슈퍼컴퓨터를 제외하면 미국, 중국 등의 국가 기관이 분자 움직임 연구나 유전자 분석 같은 특수한 목적을 위해 구축한 국책 사업인 경우가 대부분이다. 8위를 기록한 엔비디아의 슈퍼컴퓨터 '셀린'도 자사 AI 반도체 성능을 홍보하려는 성격이 짙다.

또, 삼성전자는 지난해 SSC-21의 연산능력을 확장하기 위한 보조 슈퍼컴퓨터 'SSC-21 스케일러블 모듈'도 함께 구축했다. SSC-21과 동일한 구조로 되어 있는 스케일러블 모듈은 필요한 경우 SSC-21과 연결되어 성능을 크게 확장할 수 있는 것이 특징이다. 이 슈퍼컴퓨터는 초당 2.27 테라플롭스의 성능으로 전 세계 315위를 기록했다. 

톱500 재단에 성능 기록을 제공하지 않아 순위에선 누락됐지만, 네이버도 지난 2020년 초거대 AI '클로바' 개발을 위한 슈퍼컴퓨터 '슈퍼팟'을 구축했다. 엔비디아와 협력함으로써 셀린과 유사한 구조로 완성된 네이버 슈퍼팟은 초당 14페타플롭스의 성능을 내는 것으로 알려졌다. 구축 후 꽤 시간이 흘렀음에도 전 세계 40위의 성능을 보유한 것으로 풀이된다. 네이버도 클로바가 사람과 더 자연스럽게 대화할 수 있도록 AI 모델을 가르치는 데 슈퍼팟을 활용하고 있다.

업계 관계자는 "세 회사의 슈퍼컴퓨터 구축은 자체 초거대 AI 개발이 기업 경쟁력으로 직결될 것으로 예상됨에 따라 본격적인 행보에 나선 사례"라며 "비록 전 세계 100위권 성능을 갖추진 못하더라도 자체 AI 모델 학습과 고도화를 위해 국내 기업이 슈퍼컴퓨터를 구축하는 사례가 늘어날 전망"이라고 말했다.

반면 세 회사와 마찬가지로 초거대 AI '엑사원'을 고도화 중인 LG AI연구원은 자체 슈퍼컴퓨터를 구축하지 않고 구글클라우드의 AI 반도체 집합인 'TPU(텐서플로유닛)팜'을 활용해 AI 모델을 가르치고 있다. 구글클라우드가 자체 개발한 TPU팜의 성능을 따로 공개하지는 않았지만, 업계 관계자들은 클라우드 사업 경쟁사 마이크로소프트가 전 세계 13위와 36~39위의 슈퍼컴퓨터를 보유한 만큼 구글 TPU팜의 성능도 전 세계 10위권 이내일 것으로 보고 있다.

이밖에 기상청의 슈퍼컴퓨터 '구루'와 '마루'가 초당 18페타플롭스의 성능으로 전 세계 31위와 32위를 차지했고, 한국과학기술정보연구원(KISTI)의 슈퍼컴퓨터 '누리온'도 초당 13.93페타플롭스의 성능으로 42위에 이름을 올렸다. KISTI는 내년 글로벌 상위권 슈퍼컴퓨터 구축을 목표로 예비타당성 조사를 진행 중이다. 
 

[사진=게티이미지뱅크]

◆엑사스케일 벽 넘은 미국...일본·중국에 대반격

올해 전 세계 슈퍼컴퓨터 1위는 미국 오크리지 국립연구소(ORNL)의 프런티어 시스템이 차지했다. 총 873만112개의 코어를 탑재한 프런티어 시스템은 초당 1.1엑사플롭스(초당 1102페타플롭스)라는 압도적인 성능으로 일본과 중국의 슈퍼컴퓨터 패권 도전을 단숨에 제압했다. 이론상 최대 성능도 초당 1.68엑사플롭스에 달한다. 당분간 프런티어 시스템을 넘어서는 슈퍼컴퓨터는 등장하지 않을 것이라는 게 업계 전문가들의 공통된 예측이다.

지난해까지 1위였던 일본 이화학연구소의 '후가쿠'가 2위(초당 442페타플롭스)로 밀려났고, 핀란드의 슈퍼컴퓨터 '루미'가 3위(초당 151.9페타플롭스)에 새로 이름을 올렸다. 루미는 운영 위치는 핀란드이지만, 유럽연합(EU)이 공동 투자하는 유로HPC에서 개발된 슈퍼컴퓨터인 만큼 유럽연합에서 구축한 것으로 보는 게 타당하다.

미국의 회사인 크레이, 인텔, AMD, 엔비디아의 칩셋 대신 독자적인 칩셋 구조로 전 세계 1위 성능을 기록해 파란을 일으켰던 중국의 '선웨이 타이후라이트'는 6위(초당 93페타플롭스)로 밀려났다.