카카오브레인은 지난 27일 밤 카카오톡 오픈채팅방 보이스룸에서 '디지털 휴먼과 AI 가상 캐릭터'를 주제로 실시간 토크세션을 진행했다. 김일두 카카오브레인 대표와 박병은 부사장, 김재인 사업개발팀장이 발표자로 참여했다.
이날 세션에서는 빠르면 3년 내 AI 가상인간이 나올 수 있다는 전망이 나왔다.
김 대표는 "대화 상대에 따라 직접 생각하고 대답하는 수준의 AI 모델이 빠르면 3~5년 내 만들어질 것으로 보인다. 수학 문제를 읽고, 이를 코딩으로 변환해 문제를 풀어내는 AI는 이미 나와 있다. 여기서 조금만 더 발전하면 금방 도달할 수 있다"고 강조했다.
만약 조금이라도 시나리오에서 벗어난 상황에 놓이거나, 복잡한 사고를 해야 하는 경우 AI는 제대로 대응할 수 없다. 짜인 각본대로 말하는 건 쉬워도 대화를 주고받으면서 분위기를 맞추는 건 어렵다는 얘기다. 감정 교류 역시 불가능하다.
상호작용이 가능한 가상인간을 만들기 위해선 고도화된 언어모델이 필수다. 대규모 데이터를 학습시켜야 하는데, 이 과정에서 자본과 시간이 대거 투입된다. 하지만 지름길은 있다는 게 카카오브레인 측 의견이다. 카카오브레인은 어린아이가 언어를 배우는 과정에 주목했다.
◆ "아이들 말 배우는 모습, 머신러닝 학습과정과 유사…사람 같은 AI 모델 실현 기대"
김 대표는 "(24개월 된 아이가 있는데) 본인이 말하는 게 무슨 뜻인지 모르면서, 그다음에 말할 단어를 맞히는 식으로 (언어를) 배우더라. 예를 들면 '엄마 옷은 핑크'라고 알려주면 핑크가 무슨 의미인지 모르지만 옷과 핑크를 연결한다. 또 '자동차는 블루'라고 알려주면 블루가 무슨 뜻인지 몰라도 자동차 하면 곧바로 블루가 입 밖으로 튀어나오는 식"이라고 실제 경험을 말했다. 쉽게 말해, 다음에 올 단어를 잘 만들어내는 '넥스트 토크 제너레이터' 단계에 불과하다고 했다.
하지만 아이가 색깔의 개념을 알게 되면 실제 파란색인 물체를 보고 '블루'라고 말할 수 있다. 김 대표는 "어느 순간 아이가 '블루'가 뭔지 알기 시작하더라라. 이후부터는 파란색을 봤을 때 블루라는 단어를 말하기 시작했다. 이러한 경험을 해보니 뇌과학이나 어떤 인텔리전스 성장을 잘 찾아보면 (AI 언어모델 학습과) 접점이 있을 수도 있겠다고 생각했다"고 덧붙였다.
두 아이를 키우고 있는 박 부사장도 의견을 더했다. 먼저 그는 "둘째가 첫째 말을 따라 할 때 되게 또 비슷한 현상이 있다"고 운을 뗐다.
이어 "본인은 무슨 말인지 모르는데 누나가 어떤 얘기를 하니까 따라 한다. 그 말을 이해하지 못하더라도 말소리를 따라 하는 거다. 소리를 따라 하다가 비슷한 단어를 책에서 보면 붙여보고 (맞는지) 눈치를 본다. 이 말이 맞았나 틀렸나. 어떻게 보면 머신러닝의 학습과정과 되게 비슷하다고 본다"고 했다.
김 팀장 역시 "아이들은 알지 못하지만 말을 먼저 하지 않나. 그런 다음 말을 하는 동시에 그걸 또 생각하고… 이후 점점 더 개념을 익혀 나가는 것처럼 컴퓨터도 마찬가지다. 모델 학습 시 '말할 수 있으니까 너 잘하고 있어, 근데 너 그거 이해해야 돼' 이런 식으로 진행하다 보면 결국에는 사람 같은 컴퓨터 혹은 모델이 되지 않을까 기대한다"고 말했다.
◆ "디지털 휴먼 소통방식, 온라인 환경에서 가상 인플루언서나 실제 사람과 다르지 않아"
인간과 소통이 어렵더라도 가상인간 자체로 갖는 시장 가치가 큰 것은 사실이다.
김 대표는 "수아 등 가상인간이 이미 마케팅적인 부분에서 많이 활동하고 있다. 전형적인 마케팅 사례다. 지능적인 측면도 중요하지만 가상인간 외형만 갖고도 할 수 있는 영역이 여전히 많을 것 같다. 마케팅 분야가 아니더라도 말이다"라고 말했다.
박 부사장은 "이제는 시각적으로는 조금 더 실제감에 가까운 기술적인 환경이 마련됐고, 디지털 휴먼이 '콘텐츠'로서 활동할 수 있는 제반 플랫폼이나 소셜미디어가 활발하게 운영되고 있다"고 말했다. 이어 "인스타그램을 포함해 굉장히 많은 서비스들이 활용될 수 있다는 점도 영향이 있다. 이와는 별개로 은행원 등 디지털 휴먼으로서 역할을 이미 하고 있지 않나"라고 했다.
김 팀장도 "업체 홍보 시 가상 인플루언서를 매개로 보다 적극적으로 커뮤니케이션하게 되는 것 같다. 실제 사람과 소통할 때도 온라인 방식으로 많이 하지 않나. 디지털 휴먼이라고 해서 의사소통하는 방식이 다르지 않다"고 봤다.
그러면서 "최근 활동을 열심히 하고 있는 '로지' 등의 가상 인플루언서가 더 영역을 확장하면 사람들과 소통을 더 잘할 수 있지 않을까 하는 기대감이 있다"고 덧붙였다.
◆ '생각하지 못한 물음' 도전하는 카카오브레인…초거대 AI 모델 기술 연구개발 집중
카카오브레인은 국내 본사를 둔 AI 기술 연구개발(R&D) 업체다. 회사 미션은 '생각하지 못한 물음(Unthinkable Question)'에 도전하는 것이다. 모두가 더 나은 삶을 살 수 있도록 혁신을 불러일으키자는 의미에서 비롯됐다. 카카오브레인은 민달리(minDALL-E), KoGPT, CLIP·ALIGN 등 사람들의 삶의 질 향상에 중점을 둔 AI 서비스·모델을 다수 개발했다.
최근 카카오브레인은 민달리의 업그레이드 버전인 이미지 생성 모델(RQ-Transformer)을 오픈소스 커뮤니티 깃허브에 공개하기도 했다. 39억개의 매개변수로 구성된 이 모델은 3000만쌍의 텍스트와 이미지를 학습한 '텍스트-투-이미지' AI 모델이다. 계산 비용을 줄이고 이미지 생성 속도를 높인 동시에 이미지의 품질을 크게 향상시킨 것이 특징이다. 카카오브레인은 이 모델이 공공 목적을 위해 활용될 것이라고 기대하고 있다.
RQ-Transformer 모델은 민달리 대비 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘렸다. 특히 민달리의 경우 미국의 AI 개발 기업 '오픈AI'가 공개한 'DALL-E'를 재현하는 것에 가까웠지만, RQ-Transformer는 카카오브레인만의 독자적인 기술로 개발됐다는 점에서 차이가 있다.