[발목잡힌 생성형 AI①] NYT가 쏘아올린 저작권 분쟁..해답은?

2024-01-02 10:06

조상희 아주로앤피 편집장

뉴욕타임즈, AI 기업 저작권 침해로 고소..언론사 첫 사례
韓정부 "보상 등 적법한 이용권한 확보" 지침서 발간

[사진=게티이미지뱅크]

[아주로앤피] 지난해 사람처럼 자연스럽게 대화할 수 있는 생성형 인공지능(AI) 서비스 ‘챗GPT’ 등장으로 소프트웨어 개발과 음악, 미술, 소설, 웹툰, 동영상 제작 등 그동안 인간 고유의 영역으로 여겨졌던 창작물 생성에 AI가 활용되면서 폭발적 인기를 누리고 있다.

생성형 AI 서비스는 텍스트, 오디오, 이미지 등 기존 콘텐츠를 활용해 유사한 콘텐츠를 새롭게 만들어 내는 인공지능 기술이다. 콘텐츠들의 패턴을 학습해 추론 결과로 새로운 콘텐츠를 만들어 내는 방식이다. 기존 AI가 데이터와 패턴을 학습해 대상을 이해했다면 생성형AI는 기존 데이터와 비교 학습을 통해 새로운 창작물을 탄생시킨다는 점이 흥행 비결이다.

하지만 생성형 AI 성장에 상당한 규제로 작용할 수도 있는 ‘빅이슈‘가 터졌다. 전 세계에서 가장 영향력 있는 언론사 중 하나로 꼽히는 뉴욕타임즈(NYT)가 저작권 무단 사용 혐의로 최근 챗GPT 개발사인 오픈AI와 마이크로소프트(MS)를 상대로 수조원대 소송을 제기한 것이다.

오픈AI가 인공지능(AI) 훈련에 NYT 기사 수백만 개를 무단 사용한 것 뿐만 아니라 챗봇이 언론사의 경쟁자임도 문제 삼았다. 전 세계 미디어 시장과 정보통신기술(ICT) 업계는 이번 사안을 주목하고 있다. 구체적인 규정과 판례가 없는 상황에서 관련 업계가 주의해야 할 점을 두 차례에 걸쳐 짚어봤다.

AI 학습 목적 저작물 이용, ’공정이용‘ 여부 판례 없어

생성형 AI 기술은 크게 △필요한 데이터를 수집·가공해 AI를 학습시키는 단계와 △이용자가 학습된 AI를 이용해 산출물을 만들어 내는 단계로 나뉜다.

우선, AI를 학습시키기 위해서는 인공 신경망에 전달하는 텍스트, 이미지, 음악, 영상 등 데이터를 수집, 가공해 이를 데이터셋으로 구성해야 한다. 이런 과정에서 학습 데이터에 포함된 저작물의 복제권 침해 등이 쟁점이 될 수 있다.

이용자가 학습이 완료된 AI 모델에 일정한 명령을 입력해 만들어 낸 산출물이 기존의 저작물과 실질적으로 유사한 경우에도 기존 저작물에 대한 저작권 침해가 성립할 수 있다. AI 산출물이 새로운 창작물에 해당되더라도 저작권법상 저작물로 보호될 수 있는지도 논란이다.

현행 저작권법은 AI 학습 목적으로 저작물을 이용하는 경우를 특별히 저작재산권 제한 사유로 명시하고 있지 않다. 따라서 저작재산권 제한 사유를 일반적·포괄적으로 규정한 저작권법 제35조의5 ‘공정이용’ 조항 적용 여부가 쟁점으로 부각된다.

공정이용은 △이용의 목적 및 성격 △저작물의 종류 및 용도 △이용된 부분이 저작물 전체에서 차지하는 비중과 그 중요성 △저작물의 이용이 그 저작물의 현재 시장 또는 가치나 잠재적인 시장 또는 가치에 미치는 영향 등을 고려해 판단한다. 다만, AI 학습 목적으로 저작물을 이용하는 것이 공정이용에 해당하는지에 대해선 국내는 물론 외국에서도 아직 법원의 판단이 이뤄진 바 없다.

저작물 이용 목적·범위·기간 구체적 명시 중요

AI 학습에 대한 공정이용 규정의 적용 여부나 그 요건이 다소 불명확한 상황에서 문화체육관광부와 한국저작권위원회는 지난달 27일 생성형 AI의 산출물이 만들어지는 과정에서 이해관계를 가지는 각 주체들이 저작권과 관련해 알아둬야 할 내용을 정리한 ‘생성형 AI 저작권 안내서’(이하 안내서)를 발간했다.

안내서는 저작물을 학습 데이터로 활용하고자 할 경우 가급적 저작권자에게 적절한 보상을 제공하고 적법한 이용권한을 확보하는 방안을 권고했다. 특히 학습용으로 복제한 데이터를 계속 보관하거나 다른 목적으로 이용하는 경우 새로운 분쟁이 발생할 여지가 있으므로, 이용권한을 확보할 때에는 저작물의 이용 목적, 범위, 기간 등을 구체적으로 명시하도록 했다.

이에 위원회는 해당 안내서는 관련 쟁점에 대한 최종적 결론 또는 유권해석이 아닌만큼 크게 우려할 필요가 없다고 밝혔다. 그러면서 향후 개정될 저작권 관련 법령을 안내서에 반영하고, 보다 명확하고 분명한 기준을 제시할 수 있도록 꾸준히 업데이트 해 나갈 것이며, 그 때 관련 사업자들의 의견을 충분히 수렴할 계획이라고 덧붙였다.

유럽, 일본 등에서는 저작권자로부터 이용허락을 받지 않더라도 일정한 범위 내에서 텍스트 및 데이터로부터 통계적인 규칙이나 패턴 등을 찾아내 유의미한 정보를 추출할 수 있는, 이른바 ‘텍스트 데이터 마이닝(TDM)’을 입법하는 움직임이 있다. 우리나라도 이에 관한 저작권법 개정안이 국회에 계류돼 있다. 전문가들은 구체적인 입법이 이뤄지고 법원의 판례가 축적되기 전까지는 분쟁 발생 가능성을 미연에 방지할 필요가 있다고 강조했다.

<도움말: 법무법인 화우·법무법인 태평양>

[발목잡힌 생성형 AI①] NYT가 쏘아올린 저작권 분쟁..해답은?

관련기사

Koiners

오늘의 주요뉴스