딥러닝과 전통적인 머신러닝 기법의 장점을 결합해, 기존 딥러닝 기술이 취약한 정형 데이터 기반 콘텐츠·검색 서비스의 클릭률 예측과 추천시스템 성능을 높일 수 있는 기술이 국내 연구진과 마이크로소프트의 공동 연구로 개발됐다.
서울대학교 공과대학은 전병곤 컴퓨터공학부 교수팀이 마이크로소프트와 공동으로 전통적인 머신러닝 파이프라인을 신경망으로 변환해 최적화하는 프레임워크인 '윈드터널(WindTunnel)'을 개발했다고 9일 밝혔다. 이번 연구 결과는 다음달 초 호주에서 개최되는 빅데이터 분야 국제학술대회인 'VLDB 2022'에서 'WindTunnel: Towards Differentiable ML Pipelines Beyond a Single Model'이라는 논문 제목으로 발표될 예정이다.
딥러닝 기법이 컴퓨터 비전이나 자연어 처리 등의 분야에서 뛰어난 성능을 보여 각광받고 있지만, 클릭률 예측이나 추천 시스템 등의 인공지능 응용에서 사용되는 표 형식 데이터(tabular data)는 여전히 선형 모델이나 GBDT 등 전통적 머신러닝 기법이 더 나은 성능을 보이는 경우가 많다. 이런 전통적 머신러닝 기법을 사용시 다수의 머신러닝 모델과 데이터 변환 연산을 엮어서 하나의 머신러닝 파이프라인을 구성하고, 학습 시에는 파이프라인을 구성하는 각 요소를 개별적으로 학습한 후 사용하게 된다.
전 교수팀은 이 파이프라인의 각 구성 요소를 개별적으로 학습한 후, 이를 인공신경망으로 변환해 여러 구성 요소를 '역전파(backpropagation)'로 한 번에 최적화하는 기술을 개발하고 GBDT나 범주형 데이터 인코더 등 일반적으로 미분 불가능한 구성 요소를 신경망으로 변환하고 최적화하는 방법을 제안했다. 이 기술로 개발된 윈드터널 프레임워크를 통해 기존 대비 더 높은 예측 성능, 표 형식 데이터에 대한 딥러닝과 전통적인 머신러닝 기법 간의 절충안을 찾는 후속 연구가 진행될 수 있다.
전 교수팀 측은 "이번 성과는 전통적 머신러닝 기법과 최신 딥러닝 기법의 장점을 모두 취하는 핵심 기술로, 클릭률 예측, 추천 시스템 등 다양한 실제 AI 응용에 활용될 것"이라고 기대했다.