[초거대 AI 시대] ① 슈퍼컴퓨터 만난 AI, 무엇이 달라졌나

2021-05-27 06:00
고성능 컴퓨팅 인프라가 방대한 데이터 학습
사람처럼 언어 구사하는 AI 모델 속속 등장

인공지능이 한 단계 진화한 초거대 인공지능 기술이 주목을 받고 있다. [사진=게티이미지뱅크]

“새로운 인공지능(AI) 시대가 열리고 있습니다.”

지난 25일 네이버 클로바 CIC를 이끄는 정석근 대표가 AI 콘퍼런스 ‘네이버 AI 나우’에서 꺼낸 말이다. 그가 말한 새로운 AI 시대란 ‘초대규모 AI’의 등장을 두고 한 말이다.

초대규모 AI란 데이터 처리가 가능한 슈퍼컴퓨터로 대규모의 데이터를 학습한 AI를 말한다. 기존 AI가 특정 용도에 한정해 사용되는 것과 달리, 초대규모 AI는 종합적이고 자율적인 사고가 가능해 사람의 뇌와 유사하게 작동하는 것으로 평가받는다.

초대규모 AI는 연산 속도가 빠른 슈퍼컴퓨터 덕분에 등장하게 됐다. 네이버는 초대규모 AI 한국어 모델 ‘하이퍼클로바’ 개발을 위해 지난해 10월 700페타플롭스(PF) 이상의 슈퍼컴퓨팅 인프라를 구축했다. 1PF는 1초당 1000조번 연산할 수 있는 능력을 말한다. 네이버의 슈퍼컴퓨터는 1초에 70경번의 연산 처리가 가능한 셈이다.

슈퍼컴퓨터는 AI의 ‘파라미터(매개변수)’를 크게 높인다. 파라미터는 사람의 뇌에서 정보를 학습하고 기억하는 ‘시냅스’와 유사한 역할을 한다. 반도체 산업과 비교하면 ‘집적도’에 해당한다. 반도체의 집적도 수준이 향상될 때마다 그에 맞는 새로운 디바이스와 서비스가 나오는 것처럼, 파라미터가 큰 AI는 그만큼 더 많은 문제를 해결할 수 있다.
 

네이버 초거대 AI 언어모델 '하이퍼클로바' 이미지. [사진=네이버 제공]

슈퍼컴퓨터로 개발된 하이퍼클로바는 2040억개의 파라미터 규모의 언어모델이다. 네이버의 기존 언어모델 대비 3000배 이상의 데이터를 학습했다. 50년치 뉴스, 9년치 블로그 글에 달하는 양이다. 그 결과, 하이퍼클로바는 대량의 데이터를 논리적으로 설명할 수 있고, 사람과 같은 수준의 대화를 이어갈 수 있다.

이에 전 세계적으로 초대규모 AI 기술과 모델을 확보하려는 경쟁이 치열하다. 미국 비영리 AI 기술 개발재단인 오픈AI도 지난해 초대규모 AI 언어모델 ‘GPT-3’를 선보여 전 세계 IT업계의 주목을 받았다. 하이퍼클로바와 차이는 습득 언어로 영어를 택했다는 점이다. GPT-3는 1750억개의 파라미터로 구성됐다. 이전 모델인 GPT-2보다 100배 이상 커진 규모다.

구글도 지난 19일 연례 개발자회의 ‘구글 I/O 2021’에서 AI 대화 언어모델 ‘람다(LaMDA)’를 공개했다. 람다는 자연스러운 대화를 하는 프로그램을 위한 언어 모델이다. 특정 주제에 대해 학습하면 이와 관련한 대화를 사람처럼 자연스럽게 할 수 있는 게 특징이다. 정답이 없는 질문에도 맥락에 맞는 답변을 내놓는다. 방대한 언어 데이터를 학습한 결과다.

순다 피차이 구글 최고경영자(CEO)는 “람다는 미리 정의된 답변을 학습하지 않아 자연스러운 대화를 할 수 있고, 어떤 답변에도 대화를 수행할 수 있다”고 설명했다.
 

순다 피차이 구글 CEO가 지난 19일 온라인으로 열린 연례 개발자회의 '구글 I/O'에서 기조연설하고 있다. [사진=연합·AFP]