[Tech in Trend] ⓛ 인간처럼 사고하는 인공지능, 초거대 AI 시대 도래

2022-02-28 00:00
GPT-3 등장 이후 초거대 AI 연구 본격화...빅데이터, 매개변수, 고성능 컴퓨팅 등 핵심
AI 연구 패러다임 바꿔...신약 개발부터 일상 속 번역 서비스까지 다양한 분야 접목 기대

[사진=게티이미지뱅크]

지난 2016년 3월, 바둑 인공지능(AI) 알파고가 한국 프로기사 이세돌 9단과의 대국에서 승리한 이후, 전 세계 AI 연구는 가속화됐다. 알파고를 개발한 딥마인드는 바둑을 넘어 체스, 일본식 장기 등 여러 종류의 보드게임을 할 수 있는 AI '알파제로'를 선보이는가 하면, 사람처럼 시각적인 정보를 실시간으로 인식하고 이에 맞춰 전략을 펼치는 '알파스타(스타크래프트2)'는 상위 0.2%의 실력을 갖춘 것으로 평가됐다.

최근 AI 업계에서 화두는 '초거대 AI(Hyperscale AI)'다. 이름처럼 거대한 인프라를 이용해 대용량 데이터를 학습·처리하는 AI로, 인간처럼 생각하고 추론할 수 있다. 이를 통해 기존에는 불가능했던 신약 개발이나 기후변화 예측 등의 난제를 해결하고, 나아가 AI 하나를 여러 용도로 활용할 수 있는 범용 인공지능(강인공지능) 개발까지 가능할 전망이다.

초거대 AI는 대규모의 데이터 처리가 가능한 슈퍼컴퓨터를 기반으로 심층학습(딥러닝) 효율을 크게 높인 차세대 AI다. 인간에게 승리한 알파고가 바둑에만 특화된 AI라면, 초거대 AI는 기본적인 것을 사전학습으로 배우고, 이후 스스로 학습하며 진화한다. 이전보다 더 빠른 학습 속도와 함께 분야·용도를 가리지 않는 특성 덕분에 산업 여러 분야에서 맞춤형 서비스에 응용할 수 있는 AI로 기대를 모으고 있다.
 
인간처럼 작문하는 AI 등장, 기존 연구 패러다임 바꿨다
업계에 따르면 초거대 AI 경쟁은 2020년 6월 미국 '오픈AI'가 발표한 GPT-3모델에서 촉발됐다. 오픈AI는 테슬라 창업주 일론 머스크가 지난 2015년 설립한 연구소로, 인간에게 이익을 주는 AI 개발을 목표로 하고 있다.

GPT-3는 딥러닝을 통해 인간과 유사한 문장을 생성하는 AI 모델로, 특히 인간의 일상 언어인 자연어를 자연스럽게 구사한다. 실제로 영국 가디언지에는 GPT-3가 작성한 칼럼이 등록됐다. '인간이 AI 두려워하지 않아도 되는 이유'를 주제로 500단어 정도의 칼럼을 요청한 결과 해당 주제에서 8개의 글을 썼고, 편집국은 이 중 잘된 내용을 뽑아 지면에 게재했다. 편집국 관계자는 AI가 작성한 글을 편집하는 것이 인간 칼럼니스트의 글을 수정하는 것과 크게 다르지 않았다고 설명했다.

GPT-3는 무려 1750억개의 매개변수(파라미터)를 갖추고 있는 것으로 알려져 있다. 매개변수는 AI의 성능을 가늠하는 수치로, AI에 데이터를 입력하고 원하는 결과를 도출하기 위해 찾아내는 변수를 말한다. 이를 통해 AI가 내놓는 결과에서 경우의 수가 늘어나며, 정확도와 성능을 높일 수 있다.

직전 세대인 GPT-2는 약 15억개의 매개변수만으로도 수준 높은 추론 성능을 보였다. GPT-3는 이보다 100배 더 많은 매개변수를 갖추고, 5000억개의 단어를 포함한 데이터셋을 학습했다. 텍스트 용량만 570GB에 이른다.

매개변수가 늘어나면 데이터 처리 속도 역시 늘어난다. 이 때문에 고성능 컴퓨팅 역시 필수적이다. 초거대 AI를 위한 컴퓨팅 인프라는 기존 AI보다 방대하며, 이를 통해 매개변수를 수천억 개 단위로 늘릴 수 있다. GPT-3의 경우 CPU 28만5000개, GPU 1만개 등의 하드웨어와 함께 초당 400Gb(기가비트)급 데이터를 전송할 수 있는 네트워크 인프라도 갖췄다.

전문가들은 GPT-3에 대해 AI 연구의 패러다임을 바꿨다고 평가한다. 단순히 규모가 큰 것에 그치지 않고, 미리 학습된 사전 정보를 바탕으로 목표한 작업에 맞는 최적의 결과를 낼 수 있기 때문이다. 이를 바탕으로 인간처럼 스스로 배우고 판단하는 범용 인공지능 개발도 꿈꿀 수 있게 됐다.
 
​산업의 초지능화, 자연어로 대화하고 신약 개발 앞당겨

[사진=게티이미지뱅크]

초거대 AI는 우리 일상에서 사용하는 서비스는 물론 금융, 제조, 에너지, 통신, 전자정부 등 다양한 영역에서 접목 가능한 기술이다. 초거대 AI는 방대한 데이터를 사전에 학습한 뒤 목적에 맞는 최소한의 추가 데이터 학습만으로도 각 산업 분야에 최적화할 수 있다. 인지, 분석, 결과 도출이 필요한 모든 분야에서 즉각적인 서비스 개선이 가능하며, 특히 빅테크 기업은 구축한 초거대 AI를 클라우드 형태로 제공하는 AIaaS(서비스형 AI) 사업 역시 가능할 것으로 보인다.

초거대 AI가 가장 먼저 활용될 수 있는 분야는 정보검색 등을 중심으로 하는 포털 사이트다. 사용자가 원하는 검색 결과를 정확하게 찾을 수 있으며, 특히 문장이나 단어를 잘못 입력하더라도 AI가 올바른 문장으로 수정해 결과를 보여준다.

지난해 5월 검색 서비스에 초거대 AI 하이퍼클로바를 적용한 네이버는 검색어를 잘못 입력했거나 단어를 잘못 알고 있더라도 올바른 결과를 보여줄 수 있다고 밝혔다. 예를 들어 '민들레꽃과냉이차이끛'이라는 검색어를 입력해도 '민들레꽃과 냉이꽃 차이'로 인식해 검색 결과를 보여준다.

이는 검색 서비스에서 사용자 이탈을 막을 수 있는 중요한 요소다. 결과 창에 아무런 검색 결과가 나타나지 않으면 사용자는 다른 서비스에서 같은 정보를 검색한다. 반면 AI를 통해 검색어를 보정하고 사용자가 의도한 결과를 보여준다면 이는 최적의 UX(사용자 경험)를 제공하는 셈이다.

이러한 검색 기능 고도화는 쇼핑에도 적용할 수 있다. 정보 검색과 마찬가지로 사용자가 찾는 제품을 키워드만으로 빠르고 정확하게 찾아낼 수 있으며, 쇼핑 과정에서 기존 사용자의 제품 후기나 장단점 등 핵심적인 내용만 요약해 보여줄 수도 있다. 

초거대 AI는 신약 개발도 앞당긴다. 지금까지 신약 개발에서 필요한 단백질 접힘구조를 연구하기 위해서는 방사선으로 단백질 내부구조를 예측하는 X선 결정학, 단백질을 급냉각해 정밀 관측하는 극저온 현미경 등 기술이 쓰였다. 하지만 이러한 연구 방식에는 많은 비용과 시간이 든다.

구글 딥마인드가 개발한 알파폴드는 이러한 연구에 AI 적용 가능성을 보여줬으며, 중국이 코로나19 유전정보를 공개하자마자 단백질 구조를 예측하는 데도 성공했다. 이를 계기로 AI 기반 신약 개발과 초거대 AI를 접목하는 시도도 등장하고 있다. 카카오브레인은 최근 AI 신약 개발 기업 갤럭스에 50억원을 투자하고, 자사 초거대 AI와 융합한다고 밝혔다. 이를 통해 신약 후보물질을 개발하고, 화학실험 기반의 기존 연구실을 AI 중심으로 디지털화할 계획이다.

이러한 초거대 AI는 금융 분야에서 신용위험 분석, 부정거래 탐지, 투자자문 등에 쓰일 수 있으며, 제조와 에너지 분야에선 공급망 최적화나 에너지 수요예측 등에 활용할 수 있다. 서비스 분야에서도 맥락 인식 마케팅 등 기존보다 고도화한 정보 제공이 가능하며, 스마트시티와 보안관제 등 전자정부 기능 역시 강화할 수 있다. 이처럼 산업 전반에 초지능화를 가져올 수 있는 만큼 국내외 주요 기업은 물론 정부에서도 초거대 AI 확보를 위해 발 빠르게 움직이고 있다.