[네이버 테크인사이드] ① 1000만명 몰리는 BTS 생중계도 끄떡 없는 '브이라이브'
2019-05-27 22:02
방송 시작 알림, 송출 환경 분석, 네트워크로 전송 등 20여단계 거쳐
단계 하나라도 문제 발생하면 방송 어려워...자동 복구 기술 등 적용
5G 시대에 생생한 현장감 전달...오디오 고도화, 영상 지연시간 대폭 줄여
단계 하나라도 문제 발생하면 방송 어려워...자동 복구 기술 등 적용
5G 시대에 생생한 현장감 전달...오디오 고도화, 영상 지연시간 대폭 줄여
다음달 2일 오전 3시 30분(한국시간 기준) 국내 인기 아이돌 그룹 방탄소년단(이하 BTS)이 한국 가수 최초로 영국 웸블리 스타디움에 선다. 웸블리 스타디움은 가수들에게 ‘꿈의 무대’로 손꼽힌다. 국내에서 1000만명에 달하는 관람객을 불러 모은 화제의 영화 ‘보헤미안 랩소디’에서 영국 전설의 록밴드 퀸이 영화 마지막에 감동의 무대를 펼친 무대다. 수용인원은 최대 9만명에 달한다. 비틀즈, 마이클 잭슨 등 세계적인 가수들이 공연했고, 최근까지 국내 대표 축구선수 손흥민의 소속팀 토트넘 홋스퍼가 홈구장으로 사용한 것으로도 유명하다.
세계의 이목이 쏠린 이번 BTS의 공연은 국내 포털 네이버가 단독으로 생중계한다. ‘브이라이브(V LIVE)’를 통해서다. 브이라이브는 인기 가수와 배우 등 연예인을 활용한 실시간 방송·다시보기(VOD) 서비스다. 이용자는 원하는 가수를 구독하고, 그들의 영상 콘텐츠와 굿즈 등을 구매할 수 있다. 스타와 팬을 연결해주는 일종의 엔터테인먼트 플랫폼인 셈이다.
네이버 지난달 13일(현지시간) 미국 뉴욕에서 열린 방탄소년단 컴백 라이브 영상을 안정적으로 방송했다. 당시 라이브 방송은 한 시간 동안 1000만명 이상의 시청자가 몰렸으나, 별다른 문제 없이 방송을 마쳤다. 실제로 네이버는 지난해 브이라이브로 실시간 영상을 1만5000시간 송출하면서 장애를 겪은 시간은 단 4시간(7건)에 불과했다. 서비스 가동률로 따지면 99.95%다. 네이버의 실시간 영상 기술엔 어떤 비밀이 숨어있을까?
◆ 과거 데이터 활용해 사용자 예측...실시간 방송 시작 전 알림이 ‘생명’
네이버TV나 브이라이브를 통해서 실시간 영상을 본 사람은 스마트폰에서 재생 버튼 클릭으로 손쉽게 영상을 본 경험이 있을 것이다. 그러나 영상이 우리의 스마트폰에 오르기까지 우리 눈에 보이지 않는 약 20단계의 과정을 거쳐야 한다.
이를 단순화하면 ‘방송 시작 알림→방송 송출 개시→AI가 송출 환경 분석→실시간 자막 입히기→콘텐츠 전송 네트워크(CDN)로 전송→이용자 스마트폰으로 전송’ 정도다.
방송 시장에 앞서 가장 중요한 것은 정확한 사용자 수 예측이다. 실시간 방송은 짧은 시간에 수많은 이용자가 한꺼번에 몰리기 때문에 서비스 장애 가능성을 늘 염두해야 한다. 네이버는 △자체 사용자 예측 △사용자 최대 트래픽 상관관계 △경험치 비율 등의 변수를 활용해 예상 사용량을 산출한다. 이는 브이라이브를 서비스하는 세계 230개에 국가별로 트래픽을 배정하는 데 활용된다. 이후 국가마다 필요한 장비가 어느 정도인지 검토하고 사전 설치작업에 들어간다. 수요 예측 실패는 곧 서비스 장애로 연결될 수 있기 있기에 세심한 점검이 필요하다.
장준기 네이버 V CIC(사내 독립 기업) 기술 대표는 “이번 이벤트에 얼마나 많은 사용자가 들어올 것인지 예측하기 위해 브이라이브 구독자 기반으로 히스토리 데이터를 보고 전체 용량을 산정한다”며 “이후 이를 국가별로 배정한다. 그러나 회원별 클라우드 광고 등 수많은 요소가 존재하는데 이를 개별 용량으로 산정, 적절히 배치하는 것이 중요하다”고 말했다.
실시간 방송이 시작되기 전에는 구독자를 확인하고 실시간 방송을 시작했음을 빠르게 알려야 한다. BTS의 브이라이브 채널 구독자 수는 현재 1300만명에 달한다. 이들에게 스마트폰 팝업 알림을 전하는 데만 10분 정도가 소요된다. 네이버는 이를 감안해 실시간 방송 시작 15분 전쯤에 알림 전송에 나선다. 알림이 늦으면 팬들은 그만큼 방송의 앞부분을 놓치게 된다. ‘실시간성’은 라이브의 생명이기 때문에 알림 전송은 신속해야 한다. 네이버는 이번 BTS 공연 중계에 알림 전송 방식을 ‘병렬처리(여러 군데서 동시에 데이터 처리)’, ‘비동기 기술(통신 응답에 관계없이 데이터 전송)’ 등을 적용해 팬들에게 알림이 도달하는 시간을 10분에서 34초까지 줄인다는 계획이다.
실시간 영상 중계가 시작되면 송출용 데이터센터(IDC) 내 클라우드에서 변환 과정을 거친다. 인공지능(AI)이 송출 환경을 분석하고, 그에 맞게 영상 품질을 제어한 후 ‘라이브 미디어 서버’로 방송을 전송한다. 여기에서 실시간 번역 자막이 수신되고, 영상과 결합된다. 자막과 결합된 영상은 CDN을 거쳐 이용자의 스마트폰에 도달한다. 끝으로 △사용자 정보 확인(유료 구독 여부 등) △실시간 댓글, 인터렉션 시스템 연결 등의 과정을 거친 후에 V플레이어에서 영상 재생이 시작된다.
◆ 20단계 중 하나라도 문제 발생 시 방송 불가...자동복구, 장애 고립화 기술로 대처
실시간 영상 송출부터 이용자 스마트폰의 도달까지의 이 수많은 과정은 단계적으로 진행·연결되기 때문에 단 한 곳이라도 문제가 발생하면 실시간 방송에 실패한다. 실시간 방송은 안정적 방송 송출이 우선이기 때문에 모든 단계를 완벽하게 준비하고 유지해야 한다.
네이버는 특정 부분에 문제가 발생했을 때 빠르게 보완하는 기술을 적용하고 있다. 전과정에 시스템을 복수로 준비하는 식이다. 1차에서 문제가 발생했을 때 5~10초 안에 대체 시스템을 작동할 수 있는 ‘자동 복구(Failover)’ 시스템이 바로 그것이다. 또한 한 곳의 장애가 주변의 다른 단계에 전파되지 않도록 ‘장애 고립화(Circuit Breaker)’ 기능도 담았다. 장애가 된 기능을 제어해 전체 시스템을 보호하는 구조다.
구간별 문제 발생 여부를 파악하기 위해 실시간 모니터링에도 나선다. 문제가 발생할 지점을 미리 포착해 담당자에게 즉시 전달하는 시스템을 운영한다.
◆ 5G 시대엔 ‘현장감’에 집중...영상 전송, 음향 기술 고도화
네이버의 다음 시선은 ‘현장감’에 맞춰져 있다. 영상으로 공연을 시청하면 생생한 현장을 느끼는 데 한계가 있을 수밖에 없다. 네이버는 IT 기술로 이용자가 스크린을 넘어 마치 현장에 있는 듯한 경험을 주는 것을 브이라이브의 비전으로 삼았다.
네이버는 5세대(5G) 이동통신 기술의 상용화 이후 8K 초고화질 영상을 실시간으로 전송하기 위해 코덱 기술 사양들을 검토하고 있다. 8K 영상이나 가상현실(VR)과 같은 실감형 콘텐츠는 이전보다 전송해야 할 데이터양이 100배 이상 높다.
네이버는 현재 고효율 코덱을 도입, 실시간 영상 재생 시 같은 화질이라도 데이터 전송량을 절반으로 줄였다. 실시간 영상의 자체 인코더를 개발해 4K 영상을 이전보다 개선된 환경에서 전송할 수 있다.
오디오를 개선하고 지연시간도 크게 줄일 예정이다. 사용자들이 영상을 시청하면서 현장감을 느낄 수 있도록 스테레오 음향보다 선명한 ‘이머시브 오디오(Immersive Audio)’ 기술을 적용한다. 실시간 공연 현장이 더 빠르게 영상에 반영될 수 있도록 9~10초대였던 ‘지연시간(Latency)’을 1~2초대로 줄인 ‘초저지연(ULL)’ 기술도 도입한다. 유튜브(3~4초)와 페이스북(9~12초)보다도 지연시간이 낮다.
조성택 네이버 테크리더는 “지연시간이 10초대인 페이스북이나 인스타그램보다 네이버의 지연속도가 낮다”며 “네이버는 동영상 시청자가 네트워크 상황에 따라 지연속도를 정할 수도 있다”고 설명했다.
세계의 이목이 쏠린 이번 BTS의 공연은 국내 포털 네이버가 단독으로 생중계한다. ‘브이라이브(V LIVE)’를 통해서다. 브이라이브는 인기 가수와 배우 등 연예인을 활용한 실시간 방송·다시보기(VOD) 서비스다. 이용자는 원하는 가수를 구독하고, 그들의 영상 콘텐츠와 굿즈 등을 구매할 수 있다. 스타와 팬을 연결해주는 일종의 엔터테인먼트 플랫폼인 셈이다.
네이버 지난달 13일(현지시간) 미국 뉴욕에서 열린 방탄소년단 컴백 라이브 영상을 안정적으로 방송했다. 당시 라이브 방송은 한 시간 동안 1000만명 이상의 시청자가 몰렸으나, 별다른 문제 없이 방송을 마쳤다. 실제로 네이버는 지난해 브이라이브로 실시간 영상을 1만5000시간 송출하면서 장애를 겪은 시간은 단 4시간(7건)에 불과했다. 서비스 가동률로 따지면 99.95%다. 네이버의 실시간 영상 기술엔 어떤 비밀이 숨어있을까?
이를 단순화하면 ‘방송 시작 알림→방송 송출 개시→AI가 송출 환경 분석→실시간 자막 입히기→콘텐츠 전송 네트워크(CDN)로 전송→이용자 스마트폰으로 전송’ 정도다.
방송 시장에 앞서 가장 중요한 것은 정확한 사용자 수 예측이다. 실시간 방송은 짧은 시간에 수많은 이용자가 한꺼번에 몰리기 때문에 서비스 장애 가능성을 늘 염두해야 한다. 네이버는 △자체 사용자 예측 △사용자 최대 트래픽 상관관계 △경험치 비율 등의 변수를 활용해 예상 사용량을 산출한다. 이는 브이라이브를 서비스하는 세계 230개에 국가별로 트래픽을 배정하는 데 활용된다. 이후 국가마다 필요한 장비가 어느 정도인지 검토하고 사전 설치작업에 들어간다. 수요 예측 실패는 곧 서비스 장애로 연결될 수 있기 있기에 세심한 점검이 필요하다.
실시간 방송이 시작되기 전에는 구독자를 확인하고 실시간 방송을 시작했음을 빠르게 알려야 한다. BTS의 브이라이브 채널 구독자 수는 현재 1300만명에 달한다. 이들에게 스마트폰 팝업 알림을 전하는 데만 10분 정도가 소요된다. 네이버는 이를 감안해 실시간 방송 시작 15분 전쯤에 알림 전송에 나선다. 알림이 늦으면 팬들은 그만큼 방송의 앞부분을 놓치게 된다. ‘실시간성’은 라이브의 생명이기 때문에 알림 전송은 신속해야 한다. 네이버는 이번 BTS 공연 중계에 알림 전송 방식을 ‘병렬처리(여러 군데서 동시에 데이터 처리)’, ‘비동기 기술(통신 응답에 관계없이 데이터 전송)’ 등을 적용해 팬들에게 알림이 도달하는 시간을 10분에서 34초까지 줄인다는 계획이다.
실시간 영상 중계가 시작되면 송출용 데이터센터(IDC) 내 클라우드에서 변환 과정을 거친다. 인공지능(AI)이 송출 환경을 분석하고, 그에 맞게 영상 품질을 제어한 후 ‘라이브 미디어 서버’로 방송을 전송한다. 여기에서 실시간 번역 자막이 수신되고, 영상과 결합된다. 자막과 결합된 영상은 CDN을 거쳐 이용자의 스마트폰에 도달한다. 끝으로 △사용자 정보 확인(유료 구독 여부 등) △실시간 댓글, 인터렉션 시스템 연결 등의 과정을 거친 후에 V플레이어에서 영상 재생이 시작된다.
실시간 영상 송출부터 이용자 스마트폰의 도달까지의 이 수많은 과정은 단계적으로 진행·연결되기 때문에 단 한 곳이라도 문제가 발생하면 실시간 방송에 실패한다. 실시간 방송은 안정적 방송 송출이 우선이기 때문에 모든 단계를 완벽하게 준비하고 유지해야 한다.
네이버는 특정 부분에 문제가 발생했을 때 빠르게 보완하는 기술을 적용하고 있다. 전과정에 시스템을 복수로 준비하는 식이다. 1차에서 문제가 발생했을 때 5~10초 안에 대체 시스템을 작동할 수 있는 ‘자동 복구(Failover)’ 시스템이 바로 그것이다. 또한 한 곳의 장애가 주변의 다른 단계에 전파되지 않도록 ‘장애 고립화(Circuit Breaker)’ 기능도 담았다. 장애가 된 기능을 제어해 전체 시스템을 보호하는 구조다.
구간별 문제 발생 여부를 파악하기 위해 실시간 모니터링에도 나선다. 문제가 발생할 지점을 미리 포착해 담당자에게 즉시 전달하는 시스템을 운영한다.
◆ 5G 시대엔 ‘현장감’에 집중...영상 전송, 음향 기술 고도화
네이버의 다음 시선은 ‘현장감’에 맞춰져 있다. 영상으로 공연을 시청하면 생생한 현장을 느끼는 데 한계가 있을 수밖에 없다. 네이버는 IT 기술로 이용자가 스크린을 넘어 마치 현장에 있는 듯한 경험을 주는 것을 브이라이브의 비전으로 삼았다.
네이버는 5세대(5G) 이동통신 기술의 상용화 이후 8K 초고화질 영상을 실시간으로 전송하기 위해 코덱 기술 사양들을 검토하고 있다. 8K 영상이나 가상현실(VR)과 같은 실감형 콘텐츠는 이전보다 전송해야 할 데이터양이 100배 이상 높다.
네이버는 현재 고효율 코덱을 도입, 실시간 영상 재생 시 같은 화질이라도 데이터 전송량을 절반으로 줄였다. 실시간 영상의 자체 인코더를 개발해 4K 영상을 이전보다 개선된 환경에서 전송할 수 있다.
오디오를 개선하고 지연시간도 크게 줄일 예정이다. 사용자들이 영상을 시청하면서 현장감을 느낄 수 있도록 스테레오 음향보다 선명한 ‘이머시브 오디오(Immersive Audio)’ 기술을 적용한다. 실시간 공연 현장이 더 빠르게 영상에 반영될 수 있도록 9~10초대였던 ‘지연시간(Latency)’을 1~2초대로 줄인 ‘초저지연(ULL)’ 기술도 도입한다. 유튜브(3~4초)와 페이스북(9~12초)보다도 지연시간이 낮다.
조성택 네이버 테크리더는 “지연시간이 10초대인 페이스북이나 인스타그램보다 네이버의 지연속도가 낮다”며 “네이버는 동영상 시청자가 네트워크 상황에 따라 지연속도를 정할 수도 있다”고 설명했다.