[인터뷰] "네이버클라우드 클로바 챗봇, 대충 말해도 찰떡같이 알아"
2021-08-23 00:05
김혜원 네이버 클로바 CIC 컨버세이션 플래닝 챗봇 PM
코로나19 사태로 비대면 예약·주문을 처리하기 위한 인공지능(AI) 챗봇의 역할이 커졌다. 네이버가 인간 상담원보다 모자란 챗봇의 눈치와 재주를 확 키워 줄 차세대 AI 기술을 준비 중이다. 네이버클라우드의 챗봇 구축 서비스 '클로바 챗봇'을 활용하는 기업에 대충 말해도 사람의 의도와 대화 맥락을 찰떡같이 알아듣는 AI 챗봇 기술이 제공될 전망이다. 네이버의 AI 챗봇 상품기획 담당자인 김혜원 네이버 클로바 CIC 컨버세이션 플래닝 챗봇 PM과 인터뷰했다. 다음은 일문일답.
Q. 소속 부서의 업무와 본인 역할 주요 결과물을 간단히 소개해 달라.
"AI 대화 시스템에 초점을 맞춰 '사람 같은 대화', '사람에게 도움이 되는 대화'를 하는 챗봇을 만드는 부서에 있다. 네이버클라우드의 '클로바 챗봇'과 같은 상품기획 업무 비중이 크다. 서비스를 제안해 개발부서, 엔지니어들과 조율하는 역할이다. 기술의 후속 개발 방향을 설정하거나 시연·테스트하고, 동료들과 진행 상황을 공유한다. 성남시 '코로나19 클로바 케어콜' 등이 내 손을 거쳐 개발된 사례다."
"AI 대화 서비스를 제작·운영하기 위한 클라우드 기반 통합 빌더(Builder)다. 사용처에 적합한 대화 모델을 학습할 수 있는 틀이다. 사업 형태에 맞게 서비스를 설계·구축·운영하고, 모델 성능 테스트나 재학습을 통한 지표 확인 기능을 제공한다. 외부에선 성남시 코로나19 클로바 케어콜, 현대해상 챗봇 등에 활용됐고, 네이버에선 고객센터 챗봇, 플레이스 에이아이콜(AiCall), '클로바 AI 어시스턴트' 등에 쓰였다."
Q. 최근 두드러진 개선점은.
Q. 유명 AI 모델 '버트(BERT)'를 활용한다고 들었다.
"챗봇 플랫폼 품질을 높이기 위해 트랜스포머(Transformer) 계열 언어 모델을 활용했다. 버트 한국어 버전을 만들고 '클로바 프리미엄 언어모델'로 상품화했다. 기존 클로바 챗봇의 '베이직'과 '스탠더드' 영역에 탑재된 AI 모델보다 고수준의 모델로 제공된다."
Q. 클로바 프리미엄 언어모델이 기존 모델보다 얼마나 뛰어난가.
"기존 트랜스포머 계열 언어 모델은 인위적으로 크기를 줄였을 때, 발화(표현)가 달라도 의도가 같다는 것을 잘 인지할 수 있는 '인텐트(intent) 분류'와 같은 작업의 성능이 떨어진다. 클로바 프리미엄 언어모델은 사전학습을 통해 이를 최소화했다. 2만2000개의 인텐트 분류 정확도가 5.28%P 상승하는 등 기존 AI 모델보다 많은 인텐트 분류 작업을 처리할 때 성능을 높여 줬다. 클러스터 구성과 모델의 샤딩 처리로 서버에 탑재 가능한 모델 수를 최적화해 사내 검색장비 1대당 1500여개(BERT-BASE 기준)를 동시에 서비스할 수 있게 했다. 중앙처리장치(CPU) 추론 성능을 최적화하기 위해 단일 코드 기반으로 텐서플로 1.2~2.3 버전에 걸쳐 훈련된 모델을 서비스할 수 있는 라이브러리를 만들어, 원래 모델 대비 20배 수준인 초당 200건의 질의를 처리한다."
Q. 버트를 활용하는 기업들이 많은데 어떻게 차별화했나.
"버트는 대화가 진행되는 방향과 그 역방향의 문맥을 더 잘 이해할 수 있는 모델이지만 영어 기반이어서 한국어 문맥을 이해하는 데 어려움이 있었다. 네이버 클로바에서 만든 버트는 방대한 한국어 데이터를 학습해서 만든 모델로, 다른 버트 모델이 적용된 챗봇보다 뛰어난 한국어 대화 품질을 보여 준다. 여러 고객사에 효율적으로 제공하기 위해 성능 손실을 최소화하면서 경량화했다. 네이버 뉴스 25GB, 네이버 북스 15GB, 한국어 위키백과 1.2GB, 나무위키 6.7GB, 지식 백과 5.2GB 등 대규모 말뭉치를 활용해 655억3600만개 단어를 사전학습했다. 원래 모델(BERT-BASE)의 파라미터 수는 1억1000만개, 크기는 423MB였다. 클로바 프리미엄 언어모델의 파라미터 수는 1400만개, 크기는 52MB로 88% 정도 줄였다."
Q. AI가 아무리 똑똑해져도 한계가 있지 않나.
"대충 말해도 찰떡같이 알아듣는, 눈치 빠르고 똑똑한 챗봇이 나온다. 클로바 챗봇에 연내에 슬롯(slot) 분석 기술이 적용될 예정이다. 슬롯은 챗봇이 대화를 진행하면서 정보를 채워 넣을 수 있는 '빈칸'이라고 할 수 있다. 예를 들어 일정을 예약하거나 미팅 약속을 잡을 때 상대방이 '내일, 몇 시에 간다'고 말하면 내일이 며칠인지와 몇 시인지가 분석할 정보가 된다. 그런데 '내일 간다'고만 말하면, 챗봇이 시간에 대한 정보가 없는 걸 인지하고 되묻는 식이다. 예약을 위한 대화에서 사람 수를 얘기할 때 '어른 둘, 아이 하나'라고 말하면 챗봇이 '3명'으로 인식하고, 이어지는 대화에서 '한 명 추가하겠다'고 덧붙이면 챗봇이 최종적으로 '4명'으로 셈할 수 있게 된다. 기존 AI를 활용할 때 어려움이 있었던 맥락 이해도와 대화 품질을 끌어올릴 수 있다."
Q. 네이버 초거대 AI '하이퍼클로바'도 활용되나.
"클로바 챗봇에 하이퍼클로바의 AI 기술을 접목해 다양한 상황별 소비자의 발화를 자동 생성하고, 기업들이 챗봇 서비스를 더 쉽게 구축하고 운영할 수 있게 할 계획이다. 지금은 챗봇 서비스를 구축할 때 식당 예약과 같은 시나리오에서 챗봇의 대화 품질을 높이기 위해 '식사 예약 되나요', '이번주 토요일에 가려고 하는데요' 이런 질문을 15~20개 정도 등록해야 하는데, 작업자의 부담이 크다. 콘택트센터를 운영하는 기업들은 실제 녹취록에서 고객문의로 접수된 질문을 추출해 활용할 수 있지만, 대부분 기업은 그런 데이터가 없기 때문이다. 하이퍼클로바의 기술을 활용하면 대화 의도에 맞게 다양한 질문을 생성하고, 충분한 사전 테스트를 할 수 있다. 이런 기술 개발이 완료돼 내부에서 테스트 중이고, 실제 서비스에 연내 적용할 예정이다."
Q. 클로바 챗봇은 앞으로 어떻게 발전할까.
"다양한 챗봇 빌더가 나와 있는데 특별히 우열이 가려지지 않은 상황이다. 편의성에 대한 평가는 일부 있지만, 전체적인 기능으로는 차별화가 어려운 것이다. 클로바 챗봇은 서비스에 고성능 AI 모델을 제공하고, 기업 고객사의 챗봇 구축·운영에 드는 부담을 최소화하는 것으로 차별화하려고 한다. 타사의 클라우드 상품과 달리 사용량에 비례해 과금돼 저렴하고 예측 가능한 비용을 청구해왔고, 고객사의 요청에 유연하게 대응하기 위해 연내 구독형 과금 모델도 도입한다. 고객들이 보유하고 있는 데이터를 챗봇에 활용하기 위해 재가공하는 작업도 자동화해 서비스 구축 부담을 더 낮추고, 중소상공인(SME)들도 편리하게 챗봇 서비스를 구축할 수 있게 하고 싶다."