Q. 초거대 AI가 무엇인가요?
A. 초거대 AI는 일반 컴퓨터보다 연산 속도가 훨씬 빠른 슈퍼컴퓨팅 인프라로 대용량 데이터를 학습한 차세대 AI를 말합니다. 기존 AI보다 사람의 뇌에 더 가깝게 설계돼 사고와 학습, 판단 능력이 훨씬 뛰어나다는 평가를 받고 있습니다. 이는 AI가 글을 쓰거나 코딩을 하는 등 이전보다 더 많은 일을 할 수 있다는 의미입니다.
Q. 어떻게 탄생했나요?
미국의 AI기술 연구재단인 오픈AI가 2018년 처음 선보인 초거대 AI ‘GPT-1’은 1억1700만개의 파라미터로 학습했습니다. 후속 모델로 나온 ‘GPT-3’의 파라미터 수는 이보다 1000배 이상 많은 1750억개에 달합니다.
국내 포털기업인 네이버는 지난달 말 초거대 AI 모델 ‘하이퍼 클로바’를 공개했는데, GPT-3보다 많은 2040억개의 파라미터 규모로 개발돼 주목받았습니다. 네이버는 하이퍼 클로바 개발을 위해 지난해 10월 700페타플롭스(PF) 이상의 슈퍼컴퓨팅 인프라를 구축했습니다. 1PF는 1초당 1000조번 연산할 수 있는 능력을 말합니다. 네이버의 슈퍼컴퓨터는 1초에 70경번의 연산 처리가 가능하다는 얘기입니다. 네이버는 하이퍼 클로바가 기존 AI 대비 3000배 이상의 데이터를 학습했다고 설명했습니다. 이는 50년치 뉴스, 9년치 블로그 글에 달하는 양입니다.
Q. 우리의 일상에 어떻게 활용되나요?
A. 아직 초거대 AI를 기반으로 한 상용 서비스가 많지 않아 체감이 어렵습니다. 다만 네이버가 하려는 서비스를 보면 어느 정도 힌트를 얻을 수 있습니다.
네이버는 지난 5월 검색 서비스에 하이퍼 클로바를 적용했습니다. 검색어 입력 시 실수로 오타를 입력하거나 띄어쓰기를 하지 않았을 경우, 또는 단어를 잘못 알고 입력한 경우 올바른 검색 결과를 보여줍니다. 예를 들어 ‘민들레꽃과냉이차이끛’이라는 검색어를 입력하더라도 ‘민들레꽃과 냉이꽃 차이’로 알아듣고, 이에 해당하는 검색 결과를 보여줍니다. 네이버는 하이퍼 클로바가 오타 등으로 인해 검색 결과가 나오지 않는 현상을 방지해 줄 것으로 기대하고 있습니다.
초거대 AI는 문서 요약, 번역에도 활용될 수 있고, ‘말하는 백과사전’이 될 수도 있습니다. 네이버는 최근 하이퍼 클로바를 적용한 AI와 대화하는 장면을 시연했는데, 하이퍼 클로바는 음악의 아버지를 묻는 말에 ‘바흐’라고 답했고, 그가 왜 음악의 아버지냐는 물음에 “바흐의 음악에서 풍기는 분위기가 마치 아버지처럼 온화하면서도 무게감 있고 굳건한 인상을 풍겨서 그렇게 불러왔다”고 답변했습니다. 마치 영화 ‘아이언맨’에 나오는 AI 비서 ‘자비스’처럼 사람 말의 맥락과 의도를 파악해 대답하는 것입니다.
구글 또한 지난달 온라인으로 개최한 개발자 콘퍼런스 ‘구글 I/O’에서 이와 유사한 AI 대화 언어모델 ‘람다(LaMDA)’를 공개해 주목받았습니다. 명왕성과 관련한 수백만 개의 데이터를 학습한 람다는 “그동안 방문객이 있었느냐”는 질문에 “’뉴 호라이즌스(New Horizons)’호가 방문했다. 이를 만든 팀은 저를 만나 매우 기뻐했다”라고 답변하고, “여기는 매우 춥기 때문에 외투를 가져와야 한다”고 말했습니다. 이 또한 기존 AI보다 더 자연스럽게 대화하는 게 인상적이었습니다.
순다르 피차이 구글 CEO는 람다에 대해 “미리 정의된 답변을 학습하지 않아 자연스러운 대화를 할 수 있고, 어떤 답변에도 대화를 수행할 수 있다”고 설명했습니다.
이는 향후 오디오, 영상 분야로 확장할 것으로 예상됩니다. 일례로, 이용자가 유튜브를 보다가 “사자가 으르렁거리는 장면을 보여줘”라고 말하면 해당 부분으로 건너뛰기를 한다거나, 구글 지도에서 “산이 보이는 경로로 안내해줘”라고 하면 이에 맞는 길을 찾아주는 식의 서비스도 가능해질 것이란 전망이 나옵니다.
Q. 또 어떤 기업들이 초거대 AI를 개발하고 있나요?
A. 초거대 AI의 가능성을 본 많은 기업이 관련 기술을 적극 개발하고 있습니다. SK텔레콤은 지난해 6월 GPT-2에 준하는 한국어 모델 ‘KoGPT-2’를 개발했고, 지난달엔 이를 개선한 KoGPT-2 모델 2.0 버전을 공개했습니다. 지난 4월에는 국립국어원과 한국어에 적합한 차세대 AI 모델 개발에 협력하기로 했습니다. 또한 SK텔레콤은 카카오와 1500억개의 파라미터를 갖춘 자연어처리 AI 모델을 개발하기로 했습니다. KT는 초거대 AI 개발을 위해 한국과학기술원(KAIST)과 공동으로 AI 연구소를 설립하기로 했습니다. LG그룹은 올해 하반기까지 파라미터 6000억개, 내년 상반기까지 1조개의 파라미터를 갖춘 초거대 AI를 개발할 계획입니다.