KAIST·네이버 "상품추천 정확도 42% 높인 LLM 추천시스템 개발"

2024-07-17 09:34
박찬영 카이스트 교수팀, 네이버와 공동 연구
경량화 신경망 학습 적용…추론 속도 171%↑

박찬영 한국과학기술원(KAIST) 산업및시스템공학과 교수 [자료=KAIST]

국내 연구진이 초대형언어모델(LLM) 기반 상품 추천을 더 빠르고 정확하게 해주는 기술을 개발했다.

한국과학기술원(KAIST·카이스트)는 박찬영 산업및시스템공학과 교수 연구팀이 네이버와 공동 연구를 통해 전자 상거래 플랫폼·사회관계망서비스(SNS)에서 활용할 수 있는 새로운 LLM 기반 추천 시스템을 개발했다고 17일 밝혔다.

기존 LLM 추천 기술들은 사용자가 소비한 상품 이름을 단순히 텍스트 형태로 나열해 LLM에 넣는 방식으로 고객에게 상품을 추천을 했다. 예를 들어 '사용자가 영화 극한직업·범죄도시1·범죄도시2를 보았을 때 다음으로 시청할 영화는 무엇인가?'라고 질문하는 식이다.

연구팀은 텍스트뿐 아니라 협업 필터링 지식 즉, 사용자와 비슷한 상품을 소비한 다른 고객에 대한 정보가 정확한 상품 추천에 중요한 역할을 한다는 점에 주목했다. 이에 연구팀은 미리 학습된 협업 필터링 기반 추천 모델에서 사용자 선호도 정보를 추출하고, 이를 LLM이 이해할 수 있도록 변환하는 경량화된 신경망을 도입했다. 

이 기술은 LLM이 추가 학습을 하지 않아도 되는 것이 특징이라고 연구팀은 설명했다. 기존 연구들은 상품 추천을 목적으로 학습하지 않은 LLM에 상품 추천이 가능하도록 파인튜닝(미세조정)하는 방법을 사용했는데, 학습과 추론에 드는 시간이 급격히 늘어나 LLM을 추천에 활용하는 데 큰 걸림돌이 돼왔다.
 
박찬영 한국과학기술원(KAIST) 교수 연구팀에서 초대형언어모델(LLM) 기반 추천시스템 모델 개요 [자료=KAIST]

반면 연구팀이 도입한 경량화된 신경망 학습은 직접 학습 없이도 LLM이 사용자 선호를 이해할 수 있어 기존 연구보다 빠른 학습과 추론 속도를 보였다. 학습 속도는 기존보다 253%, 추론 속도는 171% 각각 빨랐다. 상품 추천에선 평균 12%의 성능 향상을 보였다. 사용자 소비 이력이 풍부하지 않은 퓨샷(Few-shot) 상품 추천에서는 20%, A 도메인(쇼핑몰)에서 학습한 모델로 B 도메인에서 추천을 수행하는 다중-도메인(Cross-domain)에서는 42%에 달하는 성능 향상을 기록했다.

박 교수는 "LLM을 추천 문제에 해결하려는 기존 연구들이 간과한 사용자·상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 LLM에 전달하는 새로운 방법을 제안한 것"이라고 이번 연구 성과를 설명했다. 이어 "대화형 추천 시스템·개인화 상품 정보 생성 등 다양한 고도화된 추천 서비스 등장도 가능해졌다"면서 "추천 도메인에 국한하지 않고 이미지와 텍스트, 사용자·상품 상호작용 정보를 모두 사용하는 진정한 멀티모달 추천 방법론으로 나아갈 수 있을 것"이라고 말했다.

네이버와 과학기술정보통신부 재원을 바탕으로 하는 한국연구재단 지원을 받아 이뤄진 이번 연구 성과는 오는 8월 국제데이터마이닝학회가 주관하는 국제 학술대회인 'ADD 2024'에서 발표될 예정이다.