메타, AI 학습 CMI 제거 혐의로 법적 문제 직면

저작권 관리 정보(CMI) 제거 혐의의 핵심

Kadrey et al. vs Meta Platforms 소송은 2025년 1월 원고들이 Meta가 저작권이 있는 자료를 사용했다는 것을 인지했을 뿐만 아니라, 그 결과 AI 모델이 CMI를 포함하는 결과물을 생성할 것이라는 점을 주장하면서 중대한 전환점을 맞았습니다. CMI는 창작자 신원, 라이선스 조건, 생성 날짜 및 기타 관련 정보와 같이 저작권으로 보호되는 저작물과 관련된 중요한 세부 정보를 포함합니다.

원고들의 핵심 주장은 Meta가 훈련 자료에서 이 CMI를 의도적으로 제거했다는 것입니다. 그들은 AI 생성 결과물이 저작권이 있는 출처에서 파생되었다는 사실을 숨기기 위한 목적이었다고 주장합니다. 이러한 제거 행위는 Meta가 디지털 밀레니엄 저작권법(DMCA)을 위반했다는 주장의 근거가 됩니다.

판사의 판결: DMCA 청구 진행

샌프란시스코 연방 법원의 Vince Chhabria 판사는 DMCA 위반에 대한 원고의 청구가 진행될 수 있다고 판결했습니다. 이 판결은 사건이 합의에 도달하거나 재판으로 진행될 가능성을 높입니다.

Chhabria 판사는 원고의 주장이 Meta가 Llama AI 모델이 CMI를 출력하여 훈련에 저작권이 있는 자료를 사용했다는 사실을 밝히는 것을 방지하기 위해 CMI를 제거했다는 “합리적인, 특별히 강력하지는 않더라도, 추론”을 제기한다고 말했습니다. 그는 더 나아가 저작권이 있는 자료의 이러한 사용이 명확하게 식별 가능한 (주장된) 침해를 구성한다고 강조했습니다.

Meta의 인정과 Books3 데이터 세트

Meta는 Llama 1 대규모 언어 모델 훈련에 Books3라는 데이터 세트를 사용했음을 인정했습니다. 이 데이터 세트는 저작권이 있는 저작물을 포함하는 것으로 확인되어 원고의 주장에 무게를 더합니다.

청구의 부분 기각

DMCA 청구는 진행되지만, Chhabria 판사는 원고의 청구 중 하나를 기각했습니다. 기각된 이 청구는 P2P 토렌트를 통해 얻은 무단 도서를 Llama 훈련에 사용한 Meta의 행위가 캘리포니아의 포괄적인 컴퓨터 데이터 접근 및 사기 방지법(CDAFA)을 위반했다고 주장했습니다.

전문가 의견: DMCA 청구 및 공정 사용

산타클라라 대학교 법학 교수인 Edward Lee는 제거된 CMI와 관련된 DMCA 청구만을 근거로 공정 사용에 대한 추론을 하는 것에 대해 경고했습니다. 그는 Chhabria 판사가 원고가 DMCA 청구를 증명할 수 있는 능력에 대해 회의적인 입장을 표명했으며 약식 판결에서 이를 다시 검토할 가능성을 시사했다고 언급했습니다. Lee는 원고 측 변호사들이 이전에 기각되었던 DMCA 청구에 대한 보다 구체적인 사실적 근거를 성공적으로 식별했다고 강조했습니다.

다른 AI 관련 소송에 대한 시사점

Meta에 대한 CMI 청구의 진행과 Thomson Reuters가 Ross Intelligence를 상대로 승소한 이전 판결은 법원이 AI 훈련에서 저작권이 있는 자료의 사용을 보는 방식에 잠재적인 변화를 시사합니다. 이러한 결정은 진행 중인 다른 AI 관련 소송에서 원고의 입장을 강화할 수 있습니다.

예를 들어, Tremblay et al. vs OpenAI et al. 사건은 최근 이전에 기각된 DMCA 청구를 되살리기 위해 수정되었습니다. 수정된 소장은 증거 개시 과정에서 발견된 새로운 증거를 인용하여 OpenAI도 대규모 언어 모델 훈련 중에 CMI를 제거했다고 주장합니다.

더 넓은 맥락: 저작권 및 AI 훈련

AI와 저작권을 둘러싼 법적 분쟁은 혁신과 지적 재산권의 균형을 맞추는 복잡한 과제를 강조합니다. AI 훈련을 위해 저작권이 있는 자료를 무차별적으로 수집하는 것은 특히 AI 모델이 저작권이 있는 저작물과 매우 유사하거나 직접적으로 복제하는 결과물을 생성할 때 잠재적인 침해에 대한 우려를 불러일으켰습니다.

이러한 사건의 결과는 AI 개발의 미래와 훈련 데이터 세트에서 저작권이 있는 자료의 사용에 중대한 영향을 미칠 수 있습니다. 이 결정은 AI 회사가 데이터 획득 및 모델 훈련에 접근하는 방식에 영향을 미쳐 라이선스, 저작자 표시 및 저작권 관리 정보 보호에 더 큰 중점을 두도록 할 수 있습니다.

Meta와 저자 간의 분쟁은 AI와 지적 재산권을 둘러싼 진화하는 법적 환경을 강조합니다. AI 기술이 계속 발전함에 따라 법원은 허용 가능한 사용의 경계를 정의하고 AI 생성 콘텐츠가 제기하는 고유한 문제를 해결하는 법적 선례를 확립하는 데 중요한 역할을 할 것입니다. 진행 중인 소송은 저작권법을 존중하고 급변하는 인공 지능 영역에서도 창작자가 자신의 저작물 사용에 대해 공정하게 보상받도록 하는 것이 중요하다는 점을 상기시켜 줍니다.

이러한 사건에서 제시된 법적 주장은 저작권법, DMCA 및 AI 맥락에서 공정 사용 원칙의 적용에 대한 복잡성을 파고듭니다. 원고는 Meta의 행위가 저작권 보호를 우회하고 창작자의 정당한 인정과 보상을 박탈하려는 의도적인 시도라고 주장합니다. 반면에 Meta는 저작권이 있는 자료의 사용이 공정 사용에 해당하거나 CMI 제거가 기술적인 이유로 필요했다고 주장할 수 있습니다. 법원은 궁극적으로 이러한 주장을 저울질하고 Meta의 행위가 저작권 침해의 선을 넘었는지 여부를 결정해야 합니다.

이 사건은 또한 AI 개발자가 자신의 모델이 합법적으로 획득한 데이터로 훈련되도록 할 책임에 대한 의문을 제기합니다. AI가 점점 더 보편화됨에 따라 데이터 소싱 및 모델 훈련의 투명성과 책임성의 필요성이 가장 중요해졌습니다. 이러한 분쟁의 법적 결과는 업계 관행을 형성하고 AI 개발을 위한 윤리적 지침 개발을 장려할 수 있습니다.

저작권과 AI에 대한 논쟁은 법적 영역에만 국한되지 않습니다. 또한 창의적인 노력에서 AI의 역할과 인간 예술가 및 저자에게 미칠 잠재적 영향에 대한 더 광범위한 사회적 논의로 확장됩니다. 어떤 사람들은 AI 생성 콘텐츠가 인간의 창의성을 위협한다고 주장하는 반면, 다른 사람들은 AI를 인간의 능력을 향상시키고 증강시킬 수 있는 도구로 봅니다. 이러한 논의는 AI와 인간 창의성의 관계에 대한 미묘한 이해의 필요성과 창작자와 기술 개발자 모두에게 이익이 되는 협력적인 환경을 조성하는 것이 중요하다는 점을 강조합니다.

현재 진행 중인 법적 분쟁은 저작권법과 인공 지능의 복잡한 교차점을 탐색하는 중요한 단계를 나타냅니다. 이러한 사건에서 내려진 결정은 AI 개발의 미래, 지적 재산권 보호, 기술과 창의성의 관계를 형성하면서 광범위한 결과를 초래할 것입니다. 법률 전문가, 기술 개발자 및 창작자 간의 지속적인 대화는 AI 혁신이 법적 프레임워크와 창작자의 권리를 모두 존중하는 방식으로 진행되도록 하는 데 필수적입니다.