AI 학습을 위한 저작권 예외 조항의 증가
최근 몇 년 동안, 점점 더 많은 국가들이 AI 기업의 텍스트 및 데이터 마이닝을 용이하게 하기 위해 저작권법에 예외 조항을 만들고 있습니다. 이러한 예외 조항은 모든 저작권 소유자의 명시적인 허가 없이도 LLM이 방대한 데이터 세트에 대해 학습할 수 있도록 허용함으로써 인공 지능 분야의 혁신을 촉진하는 것을 목표로 합니다.
예를 들어, 싱가포르는 2021년에 저작권법을 개정하여 이러한 예외 조항을 만들었습니다. 이러한 움직임은 싱가포르의 AI 개발자들이 모델 학습을 위해 저작권이 있는 저작물에 접근하고 처리할 수 있는 길을 열었습니다. 현재 홍콩과 인도네시아를 포함한 아시아의 다른 관할 지역에서도 유사한 법률 변경을 고려하고 있습니다.
중국의 관점: 획기적인 침해 사례
세계 AI 환경의 주요 주자인 중국도 LLM 시대의 저작권 복잡성과 씨름하고 있습니다. iQiyi 대 MiniMax라는 획기적인 사건은 이 문제를 집중 조명했습니다.
이 사건에서 저명한 비디오 스트리밍 플랫폼인 iQiyi는 AI 회사인 MiniMax가 허가 없이 저작권이 있는 비디오 자료를 사용하여 AI 모델을 훈련했다고 주장하며 소송을 제기했습니다. 이 소송은 중국 최초의 AI 비디오 LLM 침해 사건으로서 AI 기술 개발에서 저작권이 있는 콘텐츠의 무단 사용에 대한 우려가 커지고 있음을 강조하는 중요한 사건입니다.
인도의 출판 산업, LLM 훈련 관행에 도전하다
논쟁은 아시아를 넘어 확장됩니다. 인도에서는 여러 출판사가 LLM 개발자를 상대로 법적 조치를 시작했으며, 이러한 모델이 저작권이 있는 저작물을 포함하는 스크랩된 데이터로 훈련되고 있다고 주장했습니다. 이러한 사례는 AI 역량을 발전시키려는 욕구와 창작자의 지적 재산권을 보호해야 할 필요성 사이의 긴장을 강조합니다.
단순한 수집을 넘어: LLM 훈련의 미묘한 차이
LLM 훈련으로 인해 발생하는 문제는 단순히 데이터를 수집하고 처리하는 행위보다 훨씬 더 복잡합니다. 인도 사례와 싱가포르 법률의 좁게 정의된 조항은 이 문제의 다면적인 성격을 강조합니다.
많은 지적 재산 소유자는 저작권이 있는 저작물에 대한 접근 및 사용을 명시적으로 제한하는 반면, 다른 소유자는 그러한 접근 및 복제에 동의하지 않습니다. 상당수의 창작자는 라이선스 모델을 비즈니스의 핵심 부분으로 사용하며, AI 훈련을 위해 저작물을 무단으로 사용하는 것은 이러한 모델을 직접적으로 훼손합니다.
또한, 많은 훈련이 클라우드에서 발생할 수 있다는 사실은 복잡한 관할권 문제를 야기합니다. 데이터가 국경을 넘어 처리될 때 어떤 법률이 적용되는지 결정하는 것은 이미 복잡한 법적 환경에 또 다른 복잡성을 더합니다.
궁극적으로 핵심 문제는 LLM이 훈련 데이터를 어떻게 확보하고, 저작권 소유자에게 사용에 대한 보상을 해야 하는지, 그리고 어떻게 해야 하는지에 관한 것입니다.
미국 저작권 단체, 법적 예외 조항에 반대
논쟁은 개별 국가에 국한되지 않습니다. 국제 무대로도 확산되었습니다. Digital Creators Coalition이라고 알려진 미국의 거의 50개 무역 협회 및 산업 그룹 연합은 저작권법에서 허가 또는 보상 조항 없이 LLM 훈련에 대한 법적 예외 조항을 만드는 것에 대해 강력한 반대 의사를 표명했습니다.
이러한 단체들은 미국 무역대표부(USTR)에 의견을 제출하여 전 세계 지적 재산권 보호 및 집행 관행을 조사하는 연례 특별 301조 검토에서 이 문제를 다룰 것을 촉구했습니다. 연합은 이러한 예외 조항을 시행했거나 제안하고 있는 국가 목록을 제공하여 이 문제의 전 세계적인 규모를 강조했습니다.
미국의 논쟁: OpenAI의 입장과 내부 모순
미국 내에서도 논쟁은 여전히 활발합니다. 인기 있는 ChatGPT의 배후 회사인 OpenAI는 백악관 과학기술실에 공개 서한을 제출하여 논의에 목소리를 더했습니다.
이 서한에서 OpenAI는 공정 사용 원칙에 따라 인터넷에서 데이터를 스크랩할 권리를 옹호하며, 사실상 훈련 목적으로 저작권이 있는 자료에 대한 광범위한 접근을 주장합니다. 그러나 역설적이게도 OpenAI는 외국 LLM 개발자가 동일한 작업을 수행하는 것을 제한해야 한다고 제안하며, 이는 잠재적으로 미국 수출 정책을 통해 이루어질 수 있습니다. 이러한 입장은 자신에게는 개방된 접근을 옹호하면서 다른 사람의 접근을 제한하려는 내부 모순을 드러냅니다.
앞으로 나아갈 길: 계속되는 논쟁
2025년이 다가옴에 따라 저작권 및 AI 훈련에 대한 논쟁은 더욱 심화될 것입니다. 전 세계적으로 새로운 LLM이 계속 등장함에 따라 명확하고 균형 잡힌 법적 프레임워크의 필요성이 점점 더 시급해지고 있습니다.
현재의 법적 환경은 국가별 법률의 패치워크이며, 일부는 AI 훈련에 대한 명시적인 예외 조항이 있고 다른 일부는 그러한 조항이 없습니다. 이러한 불일치는 AI 개발자와 저작권 소유자 모두에게 불확실성을 야기하여 혁신을 저해하고 잠재적으로 창작자의 권리를 훼손합니다.
균형 잡힌 프레임워크를 위한 주요 고려 사항:
- 투명성 및 책임: LLM 개발자는 모델 훈련에 사용된 데이터 소스에 대해 투명해야 하며 저작권이 있는 자료의 무단 사용에 대해 책임을 져야 합니다.
- 공정한 보상: AI 훈련에서 저작물 사용에 대해 저작권 소유자에게 보상하는 메커니즘을 모색해야 합니다. 여기에는 라이선스 계약, 집단 권리 관리 또는 기타 혁신적인 솔루션이 포함될 수 있습니다.
- 국제적 조화: 여러 관할 지역에서 AI 훈련과 관련된 저작권법을 조화시키려는 노력은 법적 불확실성을 줄이고 국경 간 협력을 촉진할 것입니다.
- 혁신과 창작자 권리의 균형: 법적 프레임워크는 AI 혁신 촉진과 창작자 권리 보호 사이의 균형을 유지해야 합니다. 이를 위해서는 관련된 다양한 이해 관계를 신중하게 고려해야 합니다.
- 공정 사용의 역할: AI 훈련에 대한 공정 사용 원칙의 적용 가능성을 명확히 해야 합니다. 여기에는 훈련 목적으로 저작권이 있는 자료를 사용하는 것이 공정 사용에 해당하는지 여부를 결정하기 위한 특정 기준을 정의하는 것이 포함될 수 있습니다.
저작권 및 AI 훈련을 둘러싼 지속적인 논의는 급변하는 기술에 기존 법적 프레임워크를 적용하는 데 따르는 어려움을 강조합니다. 모든 이해 관계자의 이익을 균형 있게 조정하는 솔루션을 찾으려면 지속적인 대화, 협력 및 디지털 시대의 변화하는 환경에 적응하려는 의지가 필요합니다. AI 개발의 미래와 창작물 보호는 이 중요한 논쟁의 결과에 달려 있을 수 있습니다. 훈련에 대한 질문은 오랫동안 우리와 함께 할 것입니다.