[뉴스플러스] 언론계·빅테크 화두로 떠오른 데이터 저작권…협력이냐 소송이냐

2024-05-02 05:00
AI 학습에 '뉴스 콘텐츠' 이용...오픈AI·구글과 유력매체 손잡아
NYT 등 매체는 '저작권 침해'로 줄소송...'윈윈'이란 낙관론도

오픈AI와 영국 일간지 파이낸셜타임스(FT) 간 파트너십 계약 관련 공지문. [사진=오픈AI 블로그]

생성형 인공지능(AI)의 발전으로 인해 AI 훈련에 사용되는 데이터를 둘러싼 저작권 문제가 언론계와 AI업계 모두의 화두로 떠올랐다. 파이낸셜타임스(FT), 월스트리트저널(WSJ) 등 세계 주요 매체들은 오픈AI와 구글 등 AI 빅테크업체들과 콘텐츠 이용 계약을 맺는 방식으로 문제를 해결하고 있는 반면 뉴욕타임스(NYT) 등은 소송을 제기하며 강경한 자세를 나타내고 있다.

지난달 29일(이하 현지시간) 챗GPT 개발사 오픈AI는 성명을 내고 영국 일간지 FT와 콘텐츠 이용 및 AI 제품 개발 파트너십을 맺었다고 밝혔다. 오픈AI는 FT 기사를 챗GPT 훈련에 사용하고, FT 독자를 위한 새로운 AI 제품과 기능을 개발하기 위해 협력할 예정이다. 앞으로 챗GPT가 FT 기사를 학습해 요약 작성하는 대신 오픈AI는 FT에 데이터 사용료를 내고 챗봇 응답 내에 원본 기사 링크도 제공할 것으로 알려졌다. 다만 구체적인 계약 금액은 공개되지 않았다.

FT 그룹의 존 리딩 최고경영자(CEO)는 "이번 파트너십을 통해 뉴스 소스와 AI에 관한 실질적인 결과물을 도출하길 기대하고 있다"며 "사람들이 정보에 접근하고 사용하는 방식의 발전을 선도하는 데 도움이 될 것"이라고 말했다. 브래드 라이트캡 오픈AI 최고운영책임자(COO)는 "전 세계 수백만명의 사람들을 위한 풍부한 챗GPT의 경험을 제공할 것"이라고 덧붙였다.

앞서 오픈AI는 미국 AP통신, 프랑스 르몽드 등 다른 세계 주요 언론사들과도 유사한 계약을 맺고 합법적인 AI 훈련용 데이터 확보를 위해 분주히 움직이고 있다.

오픈AI와 FT 간 계약 소식이 전해진 다음 날 구글도 미국 경제전문매체 WSJ의 모회사 뉴스코퍼레이션(뉴스코프)과 AI 콘텐츠 이용 및 제품 개발 계약을 체결했다는 소식이 들려왔다. 구글은 자사 AI 모델 강화 목적으로 뉴스코프 매체의 콘텐츠를 이용하고 관련 AI 기능을 개발할 계획이라고 IT 전문매체 디인포메이션이 30일 보도했다. 뉴스코프는 WSJ을 발행하는 다우존스, 영국 더 타임스, 호주 유로 방송 등을 보유한 글로벌 미디어그룹이다.

뉴스코프는 이번 계약으로 연간 500만~600만 달러(69억~83억원) 정도의 콘텐츠 공급 비용을 받게 될 것이라고 디인포메이션은 전했다. 다만 업체 측은 이번 계약이 구글과 오랜 협력의 일부라고 설명했다. 뉴스코프 측은 "구글과 사업 전반에 걸쳐 다수의 파트너십을 맺고 있다"면서도 "구글과 AI 콘텐츠 라이선스 계약을 맺은 건 전혀 없다"고 로이터통신에 답했다.

이처럼 생성형 AI가 전 세계적 열풍을 몰고 온 가운데 AI업체들은 AI모델 훈련을 위한 뉴스 콘텐츠 라이선스 계약에 공을 들이고 있다. 뉴스 자료 무단 활용에 대한 언론사들의 견제가 시작됐기 때문이다. 일례로 지난달 30일 오픈AI는 마이크로소프트(MS)와 함께 미국 8개 신문 매체로부터 저작권 침해 혐의로 고소당했다. 시카고 트리뷴 등 8개 언론사는 챗GPT와 코파일럿 등 AI모델이 저작권이 있는 기사 수백만건을 무단 도용했다며 뉴욕남부지방법원에 소송을 냈다. 또한 오픈AI는 지난해 12월 소송을 제기한 미·일간 뉴욕타임스(NYT)와도 법정 다툼을 진행 중이다. 이들 매체는 생성형 AI의 뉴스 콘텐츠 학습 자체가 언론 산업 전체를 망가뜨릴 수 있다고 우려한다.

반면 일각에서는 양측의 협업이 서로 도움이 될 수 있는 전략이 될 것이라는 '낙관론'도 나오고 있다. AI업체들은 정보의 신뢰성 향상과 함께 법적 리스크를 피할 수 있다는 것이다. FT는 성명을 통해 "챗GPT 사용자들이 답변으로 FT 콘텐츠의 엄선된 요약, 인용문, 풍부한 링크를 볼 수 있게 될 것"이라며 챗봇 답변의 신뢰성을 높이는 데 도움이 될 것이라고 내다봤다. 챗봇의 치명적 단점으로 거론된 '환각'(할루시네이션·엉뚱한 대답을 내놓는 현상) 문제도 FT 등 유력 매체의 데이터를 학습함으로써 정확성이 높아질 걸 기대하고 있다고 기술 전문 매체 테크크런치는 분석했다. 

또한 언론사 입장에서 자신들이 생산한 뉴스에 대해 합법적 보상 및 잠재적 독자를 확보할 수 있다는 것이다. 챗GPT 등 챗봇 사용자가 늘어날수록 구글 등 검색 엔진을 통한 뉴스 이용률은 떨어질 수 있지만, AI업체와 언론사 간 협력을 통해 기사 링크가 공유된다면 더 많은 독자가 언론사 사이트로 유입될 수 있다고 테크크런치는 설명했다.