전병곤 서울대 교수팀, 딥러닝 약점 절충 기법 개발…MS와 공동연구

2021-08-09 13:31
  • 글자크기 설정

표 데이터 기반 클릭률예측·추천시스템 성능향상

"기존 머신러닝·최신 딥러닝 장점 함께 AI에 활용"

유경인 서울대 공과대학 컴퓨터공학부 박사과정(왼쪽)과 전병곤 서울대 공과대학 교수. [사진=서울대 제공]


딥러닝과 전통적인 머신러닝 기법의 장점을 결합해, 기존 딥러닝 기술이 취약한 정형 데이터 기반 콘텐츠·검색 서비스의 클릭률 예측과 추천시스템 성능을 높일 수 있는 기술이 국내 연구진과 마이크로소프트의 공동 연구로 개발됐다.

서울대학교 공과대학은 전병곤 컴퓨터공학부 교수팀이 마이크로소프트와 공동으로 전통적인 머신러닝 파이프라인을 신경망으로 변환해 최적화하는 프레임워크인 '윈드터널(WindTunnel)'을 개발했다고 9일 밝혔다. 이번 연구 결과는 다음달 초 호주에서 개최되는 빅데이터 분야 국제학술대회인 'VLDB 2022'에서 'WindTunnel: Towards Differentiable ML Pipelines Beyond a Single Model'이라는 논문 제목으로 발표될 예정이다.
윈드터널 프레임워크는 선형모델이나 경사증폭의사결정나무(GBDT·gradient boosting decision tree)와 같은 전통적 머신러닝 기법의 장점을 딥러닝 기법으로 구현된 인공지능(AI) 애플리케이션에 결합해, 딥러닝 AI 앱의 클릭률 예측, 추천시스템 등의 성능 향상을 도울 수 있다.

딥러닝 기법이 컴퓨터 비전이나 자연어 처리 등의 분야에서 뛰어난 성능을 보여 각광받고 있지만, 클릭률 예측이나 추천 시스템 등의 인공지능 응용에서 사용되는 표 형식 데이터(tabular data)는 여전히 선형 모델이나 GBDT 등 전통적 머신러닝 기법이 더 나은 성능을 보이는 경우가 많다. 이런 전통적 머신러닝 기법을 사용시 다수의 머신러닝 모델과 데이터 변환 연산을 엮어서 하나의 머신러닝 파이프라인을 구성하고, 학습 시에는 파이프라인을 구성하는 각 요소를 개별적으로 학습한 후 사용하게 된다.

전 교수팀은 이 파이프라인의 각 구성 요소를 개별적으로 학습한 후, 이를 인공신경망으로 변환해 여러 구성 요소를 '역전파(backpropagation)'로 한 번에 최적화하는 기술을 개발하고 GBDT나 범주형 데이터 인코더 등 일반적으로 미분 불가능한 구성 요소를 신경망으로 변환하고 최적화하는 방법을 제안했다. 이 기술로 개발된 윈드터널 프레임워크를 통해 기존 대비 더 높은 예측 성능, 표 형식 데이터에 대한 딥러닝과 전통적인 머신러닝 기법 간의 절충안을 찾는 후속 연구가 진행될 수 있다.

전 교수팀 측은 "이번 성과는 전통적 머신러닝 기법과 최신 딥러닝 기법의 장점을 모두 취하는 핵심 기술로, 클릭률 예측, 추천 시스템 등 다양한 실제 AI 응용에 활용될 것"이라고 기대했다.
 

전병곤 서울대 교수팀이 개발한 윈드터널 프레임워크를 기존 머신러닝 파이프라인에 적용해 각 구성요소의 성능을 단번에 최적화할 수 있음을 보여 주는 도식. [사진=서울대 제공]

 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기
언어선택
  • 중국어
  • 영어
  • 일본어
  • 베트남어
닫기