카카오브레인이 보는 AI 가상인간의 현재와 미래
2022-04-29 10:00
카카오브레인은 지난 27일 밤 카카오톡 오픈채팅방 보이스룸에서 '디지털 휴먼과 AI 가상 캐릭터'를 주제로 실시간 토크세션을 진행했다. 김일두 카카오브레인 대표와 박병은 부사장, 김재인 사업개발팀장이 발표자로 참여했다.
이날 세션에서는 빠르면 3년 내 AI 가상인간이 나올 수 있다는 전망이 나왔다.
김 대표는 "대화 상대에 따라 직접 생각하고 대답하는 수준의 AI 모델이 빠르면 3~5년 내 만들어질 것으로 보인다. 수학 문제를 읽고, 이를 코딩으로 변환해 문제를 풀어내는 AI는 이미 나와 있다. 여기서 조금만 더 발전하면 금방 도달할 수 있다"고 강조했다.
인간과 상호작용하며 대화가 가능한 AI 가상인간을 제작하기 위해선 대규모 데이터로 학습시킨 언어모델이 필수다. 이에 국내외에서 고도화된 언어모델 연구에 한창이지만 현재로선 기술 수준이 미흡한 상태. 정해진 시나리오대로 말하는 AI가 시장 대다수를 차지하고 있다. AI 콜센터 직원, 은행원 등이 대표적이다.
만약 조금이라도 시나리오에서 벗어난 상황에 놓이거나, 복잡한 사고를 해야 하는 경우 AI는 제대로 대응할 수 없다. 짜인 각본대로 말하는 건 쉬워도 대화를 주고받으면서 분위기를 맞추는 건 어렵다는 얘기다. 감정 교류 역시 불가능하다.
상호작용이 가능한 가상인간을 만들기 위해선 고도화된 언어모델이 필수다. 대규모 데이터를 학습시켜야 하는데, 이 과정에서 자본과 시간이 대거 투입된다. 하지만 지름길은 있다는 게 카카오브레인 측 의견이다. 카카오브레인은 어린아이가 언어를 배우는 과정에 주목했다.
◆ "아이들 말 배우는 모습, 머신러닝 학습과정과 유사…사람 같은 AI 모델 실현 기대"
김 대표는 "(24개월 된 아이가 있는데) 본인이 말하는 게 무슨 뜻인지 모르면서, 그다음에 말할 단어를 맞히는 식으로 (언어를) 배우더라. 예를 들면 '엄마 옷은 핑크'라고 알려주면 핑크가 무슨 의미인지 모르지만 옷과 핑크를 연결한다. 또 '자동차는 블루'라고 알려주면 블루가 무슨 뜻인지 몰라도 자동차 하면 곧바로 블루가 입 밖으로 튀어나오는 식"이라고 실제 경험을 말했다. 쉽게 말해, 다음에 올 단어를 잘 만들어내는 '넥스트 토크 제너레이터' 단계에 불과하다고 했다.
하지만 아이가 색깔의 개념을 알게 되면 실제 파란색인 물체를 보고 '블루'라고 말할 수 있다. 김 대표는 "어느 순간 아이가 '블루'가 뭔지 알기 시작하더라라. 이후부터는 파란색을 봤을 때 블루라는 단어를 말하기 시작했다. 이러한 경험을 해보니 뇌과학이나 어떤 인텔리전스 성장을 잘 찾아보면 (AI 언어모델 학습과) 접점이 있을 수도 있겠다고 생각했다"고 덧붙였다.
두 아이를 키우고 있는 박 부사장도 의견을 더했다. 먼저 그는 "둘째가 첫째 말을 따라 할 때 되게 또 비슷한 현상이 있다"고 운을 뗐다.
이어 "본인은 무슨 말인지 모르는데 누나가 어떤 얘기를 하니까 따라 한다. 그 말을 이해하지 못하더라도 말소리를 따라 하는 거다. 소리를 따라 하다가 비슷한 단어를 책에서 보면 붙여보고 (맞는지) 눈치를 본다. 이 말이 맞았나 틀렸나. 어떻게 보면 머신러닝의 학습과정과 되게 비슷하다고 본다"고 했다.
김 팀장 역시 "아이들은 알지 못하지만 말을 먼저 하지 않나. 그런 다음 말을 하는 동시에 그걸 또 생각하고… 이후 점점 더 개념을 익혀 나가는 것처럼 컴퓨터도 마찬가지다. 모델 학습 시 '말할 수 있으니까 너 잘하고 있어, 근데 너 그거 이해해야 돼' 이런 식으로 진행하다 보면 결국에는 사람 같은 컴퓨터 혹은 모델이 되지 않을까 기대한다"고 말했다.
◆ "디지털 휴먼 소통방식, 온라인 환경에서 가상 인플루언서나 실제 사람과 다르지 않아"
인간과 소통이 어렵더라도 가상인간 자체로 갖는 시장 가치가 큰 것은 사실이다.
김 대표는 "수아 등 가상인간이 이미 마케팅적인 부분에서 많이 활동하고 있다. 전형적인 마케팅 사례다. 지능적인 측면도 중요하지만 가상인간 외형만 갖고도 할 수 있는 영역이 여전히 많을 것 같다. 마케팅 분야가 아니더라도 말이다"라고 말했다.
박 부사장은 "이제는 시각적으로는 조금 더 실제감에 가까운 기술적인 환경이 마련됐고, 디지털 휴먼이 '콘텐츠'로서 활동할 수 있는 제반 플랫폼이나 소셜미디어가 활발하게 운영되고 있다"고 말했다. 이어 "인스타그램을 포함해 굉장히 많은 서비스들이 활용될 수 있다는 점도 영향이 있다. 이와는 별개로 은행원 등 디지털 휴먼으로서 역할을 이미 하고 있지 않나"라고 했다.
김 팀장도 "업체 홍보 시 가상 인플루언서를 매개로 보다 적극적으로 커뮤니케이션하게 되는 것 같다. 실제 사람과 소통할 때도 온라인 방식으로 많이 하지 않나. 디지털 휴먼이라고 해서 의사소통하는 방식이 다르지 않다"고 봤다.
그러면서 "최근 활동을 열심히 하고 있는 '로지' 등의 가상 인플루언서가 더 영역을 확장하면 사람들과 소통을 더 잘할 수 있지 않을까 하는 기대감이 있다"고 덧붙였다.
◆ '생각하지 못한 물음' 도전하는 카카오브레인…초거대 AI 모델 기술 연구개발 집중
카카오브레인은 국내 본사를 둔 AI 기술 연구개발(R&D) 업체다. 회사 미션은 '생각하지 못한 물음(Unthinkable Question)'에 도전하는 것이다. 모두가 더 나은 삶을 살 수 있도록 혁신을 불러일으키자는 의미에서 비롯됐다. 카카오브레인은 민달리(minDALL-E), KoGPT, CLIP·ALIGN 등 사람들의 삶의 질 향상에 중점을 둔 AI 서비스·모델을 다수 개발했다.
최근 카카오브레인은 민달리의 업그레이드 버전인 이미지 생성 모델(RQ-Transformer)을 오픈소스 커뮤니티 깃허브에 공개하기도 했다. 39억개의 매개변수로 구성된 이 모델은 3000만쌍의 텍스트와 이미지를 학습한 '텍스트-투-이미지' AI 모델이다. 계산 비용을 줄이고 이미지 생성 속도를 높인 동시에 이미지의 품질을 크게 향상시킨 것이 특징이다. 카카오브레인은 이 모델이 공공 목적을 위해 활용될 것이라고 기대하고 있다.
RQ-Transformer 모델은 민달리 대비 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘렸다. 특히 민달리의 경우 미국의 AI 개발 기업 '오픈AI'가 공개한 'DALL-E'를 재현하는 것에 가까웠지만, RQ-Transformer는 카카오브레인만의 독자적인 기술로 개발됐다는 점에서 차이가 있다.