디지털 시대는 특히 인공지능(AI) 분야에서 전례 없는 혁신의 기회를 열었습니다. 그러나 이러한 발전은 데이터 사용의 윤리적, 법적 경계, 특히 저작권이 있는 자료와 관련된 중요한 질문을 제기했습니다. AI 모델을 훈련하기 위해 불법 복제된 책을 사용하는 것에 대한 논쟁이 끓어오르고 있으며, 기존 저작권법을 재평가하고 지적 재산권 침해에 대한 보다 확고한 입장을 요구하고 있습니다.
핵심 문제: 저작권이 있는 자료의 무단 사용
문제의 핵심은 AI 모델을 훈련하기 위해 저작권이 있는 책을 무단으로 사용하는 것입니다. Meta와 같은 기술 대기업이 고용했다고 알려진 이 관행은 상업적 이익을 위해 자신의 권리가 침해당하고 있다고 느끼는 작가와 출판사들 사이에서 분노를 불러일으켰습니다. Waitrose의 전무 이사였던 Mark Price는 이 관행에 대해 목소리를 높여 비판했으며, Meta CEO Mark Zuckerberg에게 직접 연설하여 회사가 허가 없이 영국 작가들의 작품을 착취하는 것에 대한 정당성에 의문을 제기했습니다.
Price의 법률팀은 영국에서 Meta에 대한 법적 조치를 추구하기 위해 여러 가지 방법을 모색하고 있습니다. 한 가지 접근 방식은 해적 데이터베이스 LibGen에서 가져온 책이 영국 내에서 "섭취 및 처리"되었는지 여부를 확인하는 것입니다. 입증되면 이는 영국 저작권법에 따라 Meta에 대한 명확한 사례를 설정할 수 있습니다.
결과물 검사: 침해 증명의 핵심
또 다른, 어쩌면 더 흥미로운 접근 방식은 Meta의 AI 모델인 Llama가 생성한 콘텐츠를 분석하는 데 중점을 둡니다. Price는 Llama가 훈련하는 데 사용된 책의 구절과 매우 유사한 콘텐츠를 생성하면 이는 저작권 침해의 강력한 증거가 될 수 있다고 주장합니다. 이러한 조사 방향은 Stability AI의 Stable Diffusion 모델에 의한 저작권이 있는 이미지의 복제 혐의를 중심으로 진행 중인 Getty Images 사건과 유사합니다.
2025년 6월에 재판이 예정된 Getty Images 사건은 AI 생성 콘텐츠와 관련된 미래의 저작권 분쟁에 대한 중요한 선례를 세울 수 있습니다. Getty Images 사건의 청구인은 Stable Diffusion이 훈련 중에 사용된 저작권이 있는 이미지의 상당 부분을 복제했다고 주장합니다. Getty Images가 승소하면 작가와 출판사는 Meta와 같은 회사에 대해 유사한 법적 조치를 취할 수 있습니다.
Meta는 자사의 AI 모델이 저작권이 있는 작품을 복제하지 않고 훈련 목적으로만 사용한다고 주장하면서 자사의 관행을 옹호했습니다. 회사는 또한 작가가 결과적으로 경제적 손실을 입지 않는다고 주장합니다. 그러나 Getty Images가 AI 모델이 실제로 저작권이 있는 콘텐츠를 복제할 수 있음을 입증할 수 있다면 Meta의 방어를 훼손하고 회사에 상당한 법적 책임을 부과할 수 있습니다.
라이선스 계약: 잠재적인 해결책?
AI 시대의 저작권의 복잡성은 출판사와 AI 회사 간의 라이선스 계약에 의해 더욱 강조됩니다. 예를 들어 HarperCollins는 계약의 일부로 액세스할 수 있는 책의 양에 대한 제한 사항을 포함하는 Microsoft와의 라이선스 계약을 체결한 것으로 알려졌습니다. 이러한 계약은 저작권 소유자에게 보상할 수 있는 잠재적인 경로를 제공하는 동시에 AI 훈련에서 공정 사용의 범위와 제한 사항에 대한 질문을 제기합니다.
Meta와 권리 소유자 간의 유사한 계약이 없으면 회사는 법적 문제에 취약합니다. Meta의 전 변호사는 AI 시스템의 의도치 않은 결과로 인해 저작권을 침해할 가능성이 회사가 법원에서 상당한 위협이 될 수 있다고 인정했습니다.
데이터(사용 및 액세스) 법안: 입법 기회
영국의 데이터(사용 및 액세스) 법안은 저작권법을 강화하고 AI로 인해 발생하는 문제에 대처할 수 있는 중요한 기회를 제공합니다. 하원에서 논의될 법안 수정안은 저작권 규정의 준수, 투명성 및 집행을 보장하는 것을 목표로 합니다. 승인되면 이러한 수정안은 AI 훈련을 위해 게시된 자료를 사용하는 것과 관련하여 기술 회사에 면제를 부여하려는 영국 정부의 시도를 억제할 수 있습니다. 이것은 많은 사람들이 정부가 처음부터 채택했어야 한다고 믿는 입장입니다.
Publisher’s Licensing Services의 CEO인 Tom West는 데이터(사용 및 액세스) 법안이 콘텐츠 라이선스를 "터보 충전"할 수 있다고 주장합니다. 그는 책임에 대한 요구가 반 기술 또는 반 혁신이 아니라고 강조합니다. 대신 생성 AI가 우리 삶에서 점점 더 중요한 역할을 수행함에 따라 정보의 정확성과 품질이 가장 중요하다는 인식을 반영합니다.
전환점: AI의 영향 규제
현재 상황은 전환점을 나타냅니다. AI의 힘과 영향력이 계속 증가함에 따라 해를 끼치거나 혼란을 일으키거나 후회로 이어질 수 있는 행위를 방지하기 위해 명확한 경계와 규정을 설정하는 것이 필수적입니다. ChatGPT에서 빌린 이 원칙은 AI 기술의 책임 있는 개발과 배포의 필요성을 강조합니다.
법적 및 윤리적 수렁에 더 깊이 들어가기
AI 훈련에서 저작권이 있는 자료의 사용에 대한 논쟁은 단순히 법적 문제가 아닙니다. 또한 기본적인 윤리적 고려 사항도 다룹니다. AI 회사가 창작물의 무단 사용으로 이익을 얻는 것이 허용되어야 하는지 여부는 공정성과 지적 재산권 존중에 대한 문제입니다.
공정 사용 교리: 복잡한 법적 논쟁
이 논쟁의 중심적인 법적 논쟁 중 하나는 공정 사용 교리를 중심으로 전개됩니다. 공정 사용은 저작권 소유자의 허가 없이 저작권이 있는 자료의 제한된 사용을 허용하는 법적 원칙입니다. 이 교리는 저작권이 있는 작품의 특정 변형 사용을 허용함으로써 표현의 자유를 증진하고 창의성을 장려하기 위한 것입니다.
그러나 AI 훈련의 맥락에서 공정 사용 교리의 적용은 복잡하고 논쟁의 여지가 있습니다. AI 회사는 종종 저작권이 있는 자료의 사용이 새로운 변형 기술을 만들기 위해 자료를 사용하고 있기 때문에 공정 사용에 해당한다고 주장합니다. 그들은 AI 모델이 단순히 저작권이 있는 작품을 복제하는 것이 아니라 새로운 결과물을 생성하기 위해 학습하고 있다고 주장합니다.
반면에 저작권 소유자는 AI 모델을 훈련하기 위해 작품을 사용하는 것이 잠재적 수익을 박탈하는 상업적 사용이라고 주장합니다. 그들은 AI 회사가 다른 상업적 용도와 마찬가지로 훈련에 사용하는 저작권이 있는 자료에 대한 라이선스를 획득해야 한다고 주장합니다.
작가와 출판사에 미치는 경제적 영향
승인되지 않은 AI 훈련이 작가와 출판사에 미치는 경제적 영향은 중요한 문제입니다. AI 회사가 보상 없이 저작권이 있는 작품을 자유롭게 사용할 수 있다면 작가와 출판사가 새로운 콘텐츠를 만들도록 장려하는 인센티브를 약화시킬 수 있습니다. 이는 창작물의 품질과 가용성이 저하되어 궁극적으로 사회 전체에 해를 끼칠 수 있습니다.
또한 저작권이 있는 자료의 무단 사용은 시장에서 불균등한 경쟁의 장을 만들 수 있습니다. 허가 없이 저작권이 있는 작품을 사용하는 AI 회사는 라이선스를 획득하거나 자체 훈련 데이터를 만드는 회사보다 경쟁 우위를 점하게 됩니다. 이는 혁신을 억압하고 소수의 지배적인 AI 회사의 손에 권력이 집중될 수 있습니다.
투명성 및 책임에 대한 필요성
투명성과 책임은 AI 회사가 저작권이 있는 자료를 책임감 있게 사용하는지 확인하는 데 필수적입니다. AI 회사는 모델을 훈련하는 데 사용하는 데이터의 출처를 공개해야 합니다. 이를 통해 저작권 소유자는 작품 사용을 모니터링하고 적절한 보상을 받을 수 있습니다.
또한 AI 회사는 AI 모델의 결과로 발생하는 저작권 침해에 대해 책임을 져야 합니다. 여기에는 직접 침해에 대한 책임뿐만 아니라 AI 모델이 침해 작품을 만드는 데 사용되는 경우 기여 침해에 대한 책임도 포함될 수 있습니다.
대안적 해결책 모색
저작권법을 강화하고 투명성을 장려하는 것 외에도 AI 회사와 저작권 소유자의 이익의 균형을 맞추는 데 도움이 될 수 있는 대안적 해결책을 모색하는 것이 중요합니다.
집단 라이선스
집단 라이선스는 잠재적인 해결책입니다. 집단 라이선스 제도에서는 집단 관리 조직(CMO)이 저작권 소유자를 대신하여 AI 회사와 라이선스를 협상합니다. 그런 다음 CMO는 라이선스에서 수집한 로열티를 저작권 소유자에게 배포합니다.
집단 라이선스는 AI 회사가 필요한 저작권이 있는 자료에 대한 라이선스를 획득하는 보다 효율적이고 간소화된 방법을 제공할 수 있습니다. 또한 저작권 소유자가 작품 사용에 대해 공정하게 보상받을 수 있도록 할 수 있습니다.
오픈 소스 데이터
또 다른 잠재적인 해결책은 AI 훈련을 위한 오픈 소스 데이터 세트 개발을 장려하는 것입니다. 오픈 소스 데이터 세트는 누구나 자유롭게 사용, 수정 및 배포할 수 있는 데이터 세트입니다.
오픈 소스 데이터 세트 개발은 AI 회사의 저작권이 있는 자료에 대한 의존도를 줄일 수 있습니다. 또한 AI 산업의 혁신과 경쟁을 장려할 수 있습니다.
기술적 해결책
기술적 해결책 또한 AI로 인해 발생하는 저작권 문제 해결에 역할을 할 수 있습니다. 예를 들어 워터마킹 기술을 사용하여 AI 훈련에서 저작권이 있는 자료의 사용을 추적할 수 있습니다. 이를 통해 저작권 소유자는 작품 사용을 모니터링하고 승인되지 않은 사용 사례를 식별할 수 있습니다.
또한 AI 기술을 사용하여 침해 작품의 생성을 감지하고 방지할 수 있습니다. 예를 들어 AI 기반 도구를 사용하여 저작권이 있는 작품과 실질적으로 유사한 콘텐츠를 식별할 수 있습니다.
나아갈 길
AI 훈련에서 저작권이 있는 자료의 사용에 대한 논쟁은 복잡하고 다면적입니다. 쉬운 답은 없습니다. 그러나 저작권법을 강화하고 투명성과 책임을 장려하고 대안적 해결책을 모색하고 AI 회사와 저작권 소유자 간의 공개 대화를 육성함으로써 모든 이해 관계자의 이익의 균형을 맞추고 지적 재산권을 보호하면서 혁신을 장려하는 프레임워크를 만들 수 있습니다. 데이터(사용 및 액세스) 법안은 이러한 긴급한 문제를 해결하고 디지털 시대에 저작권법의 미래를 형성하는 입법적 방법을 제공하여 이 방향으로 나아가는 중요한 단계입니다. 지금 내린 결정은 창작 산업과 AI 개발에 오랫동안 영향을 미칠 것입니다.