유튜브 '추천 시스템' 어떤 비밀이 있을까?

2019-11-30 00:01
  • 글자크기 설정
"유튜브 다음 동영상 추천 때문에 새벽까지 계속 영상만 보고있습니다."

유튜브로 영상 콘텐츠를 시청하다 보면 댓글창에 이런 글을 심심치 않게 볼 수 있습니다. 유튜브를 처음 이용할 땐 키워드 검색으로 보고 싶은 영상을 시청합니다. 이후 유튜브는 이용자가 좋아할 만한 새로운 동영상을 추천해서 계속 영상을 감상하도록 합니다.
 

[사진=게티이미지뱅크]

유튜브는 어떤 방식으로 엄청나게 많은 영상 중에 사용자가 원하는 영상을 추천해주는 걸까요?
정보기술(IT) 전문 매체 테크니들에 따르면 지난 9월 추천 시스템에 관한 국제 포럼 'ACM RecSys'에 공개된 논문 '다음에 볼 동영상추천: 멀티태스킹 랭키 시스템'에서 답을 찾을 수 있습니다.

유튜브는 현재 보는 영상의 데이터를 이용해 비슷한 영상을 찾아내고 이용자의 데이터를 분석해 그중 자신과 가장 비슷한 유형의 영상을 추천해줍니다.

영상 추천에는 데이터가 중요한데요. 먼저 영상의 제목이나 내용 주제, 업로드 시간 등 영상에 직접적인 영향을 주는 데이터가 있습니다. 사용자 프로필이나 기기, 시간 장소 같은 사용자 데이터도 있습니다. 과거 데이터를 바탕으로 이용자가 좋아할 만한 영상을 선별합니다.

유튜브는 추천 영상의 정확도를 높이기 위해서 사용자의 행동을 예측하고 목표로 설정할 수 있는 데이터도 분석합니다. 클릭이나 시청시간, 좋아요 같은 행동지표들입니다. 유튜브는 이용자가 유튜브를 얼마나 오랫동안 시청했는지도 데이터로 활용합니다.

하지만, 유튜브 코리아에 따르면 유튜브는 1분마다 400시간이 넘는 분량의 새 둉영상이 업로드됩니다. 전 세계적으로 19억명이 유튜브를 이용하고 매일 10억 시간을 유튜브 영상 시청에 쓴다고 합니다. 실시간으로 엄청난 양의 영상 콘텐츠가 유튜브를 통해 소비되고 있습니다.

대량의 영상 콘텐츠 중 이용자가 좋아할 만한 콘텐츠를 선별해 실시간으로 추천해주는 건 쉬운 일이 아닙니다. 유튜브는 이 문제를 해결하기 위해 추천 시스템을 이용합니다.

추천 시스템은 세부적으로 후보 생성과 랭킹 두 기능으로 나눠 처리합니다. 첫 번째는 후보 생성 기능입니다. 수많은 영상에서 수백 개 정도로 추려냅니다. 일차적으로 정리된 영상을 가지고 점수를 매기는 게 랭킹 단계입니다.

후보 생성 기능은 최대한 비슷한 영상을 찾아내도록 했다면, 랭킹 단계는 연산이 복잡한 알고리즘을 사용해 섬세하게 점수를 매겨 이용자가 좋아할 영상을 추천해줍니다.

유튜브는 후보 생성과 랭킹 기능을 완전히 분리해 이용합니다. 그래서 서버 부하를 줄이면서도 복잡한 알고리즘을 사용할 수 있는 환경을 만들었습니다. 유튜브가 보고 싶은 영상을 추천해주는 데는 이런 분석 기술이 있었습니다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기
언어선택
  • 중국어
  • 영어
  • 일본어
  • 베트남어
닫기