인간은 현재 주어진 문제에 집중하면서도, 해당 문제에 지나치게 집착하지 않고 상황 변화에 따라 유동적으로 대처할 수 있다. 하지만 최근의 인공지능(AI) 모델은 한 문제에 집중해 해결능력을 높이면 다른 문제를 푸는 성능이 떨어지고 여러가지 문제에 대한 해결력을 높이면 특정 문제를 푸는 성능이 낮아진다. 국내 연구진이 이를 개선할 수 있는 기술을 개발해 주목된다.
카이스트(KAIST)는 이상완 바이오·뇌공학과 교수 연구팀이 뇌 기반 AI 기술을 이용해 AI 난제 중 하나인 '과적합-과소적합 상충' 문제를 해결하는 원리를 풀었다고 5일 발표했다.
인간은 현재 주어진 문제에 집중하면서도(과소적합 문제 해결), 당면 문제에 과하게 집착하지 않고(과적합 문제 해결) 변하는 상황에 맞게 유동적으로 대처한다. 연구팀은 뇌 데이터, 확률과정 추론 모형, 강화학습 알고리즘을 통해 인간 뇌가 이 문제를 어떻게 해결하는지 이론적 틀을 마련하고 이로부터 유동적인 메타 강화학습 모델을 도출했다.
연구팀에 따르면, 인간의 뇌는 중뇌 도파민 회로와 전두엽에서 처리되는 '예측 오차'의 하한선이라는 단 한 가지 정보를 이용한다. 뇌의 전두엽, 특히 복외측전전두피질은 현재 본인이 사용하고 있는 문제해결 방식으로 주어진 문제를 얼마나 잘 풀 수 있을지에 대한 기대치의 한계를 추정한다. 어떤 문제를 특정 방법으로 풀때 '이렇게 풀면 90점까지는 받을 수 있어'와 같은 생각이 드는 것이 일례다.
또 사람들은 변하는 상황에 따라 최적인 문제해결 전략을 유동적으로 선택하게 되는데, 이를 통해 과소적합-과적합의 위험을 최소화한다는 설명이다. '이 방법으로 풀면 기껏해야 70점이니 다르게 풀어보자'는 생각이 대표적이다.
이상완 교수 연구팀은 2014년 해당 전두엽 영역이 환경의 불확실성을 바탕으로 강화학습 전략을 유동적으로 조절하는 데 관여한다는 사실을 처음 발견해 국제학술지 '뉴런'에 발표했다. 이 뇌 영역이 인과관계 추론 과정에도 관여한다는 사실(2015년)과 문제의 복잡도까지 고려할 수 있다는 사실(2019년)도 발견했다.
해당 연구 결과는 인간 본인의 학습·추론 능력을 스스로 평가하는 인간의 메타인지 능력이 있다는 것을 보여준다. 연구팀은 이 능력을 바탕으로 AI가 풀기 어려워하는 현실 세계의 다양한 상충적 상황들을 풀어낼 수 있는 '전두엽 메타 학습 이론'을 정립해 학술지인 '사이언스 로보틱스'에 발표했다.
더불어 이번에 개발된 메타 강화학습 모델로 간단한 게임을 통해 인간의 유동적 문제해결 능력을 간접적으로 측정할 수 있게 됐다. 더 나아가 스마트 교육이나 중독과 관련된 인지 행동치료에 적용할 경우, 상황 변화에 유동적으로 대처하는 인간의 문제해결 능력 자체를 향상할 수 있을 거란 기대다. 연구팀은 "차세대 AI, 스마트 교육, 인지 행동치료 등 다양한 분야에 파급력이 큰 원천 기술로 최근 국내외 특허 출원이 완료된 상태"라고 했다.
김동재 박사는 "인간 지능의 특장점에 대한 이해가 얼마나 중요한지 보여주는 연구 중 하나ˮ라고 강조했다. 이상완 교수는 "AI가 우리보다 잘 푸는 문제가 많지만 반대로 AI로 풀기 어려운 문제들이 우리에게는 정말 쉽게 느껴지는 경우들이 많다, 인간의 다양한 고위 수준 능력을 AI 이론 관점에서 형식화하는 연구를 통해 인간 지능의 비밀을 하나씩 풀어나갈 수 있을 것"으로 기대했다.
향후 연구팀은 KAIST 신경과학-AI 융합연구센터에서 기반 기술을 활용해 인간 지능을 모사한 차세대 AI 모델을 개발할 계획이다. 아울러 딥마인드, IBM AI 연구소, 매사추세츠공과대(MIT), 옥스퍼드대 등 국제 공동연구 협약 기관과 공동연구로 기술 파급력을 높인다. 이번 연구는 삼성전자 미래기술육성센터, 과학기술정보통신부 정보통신기획평가원과 한국연구재단의 지원을 받아 수행됐다.