Meta因AI訓練移除版權信息面臨訴訟

指控核心:移除版權管理資訊

Kadrey et al. vs Meta Platforms 一案在 2025 年 1 月出現重大轉折,當時原告聲稱 Meta 不僅知道其使用了受版權保護的材料,而且其 AI 模型因此會產生包含 CMI 的輸出。CMI 包含與受版權保護作品相關的重要細節,例如創作者的身份、授權條款、創作日期和其他相關資訊。

原告的主要論點是 Meta 故意從訓練材料中剝離了 CMI。他們聲稱,這樣做的目的是為了掩蓋 AI 生成的輸出內容源自受版權保護的來源。這種被指控的移除行為構成了 Meta 違反《數位千禧年版權法案》(DMCA) 的主張的基礎。

法官裁決:DMCA 索賠繼續進行

舊金山聯邦法院法官 Vince Chhabria 裁定,原告關於違反 DMCA 的索賠可以繼續進行。這項裁決增加了案件達成和解或進入審判的可能性。

Chhabria 法官的命令指出,原告的指控提出了「合理,即使不是特別強烈,的推論」,即 Meta 移除 CMI 是為了防止其 Llama AI 模型輸出 CMI,從而揭示在訓練中使用了受版權保護的材料。他進一步強調,這種使用受版權保護材料的行為構成了明顯可識別的(被指控的)侵權行為。

Meta 的承認和 Books3 資料集

Meta 承認在其 Llama 1 大型語言模型的訓練中使用了名為 Books3 的資料集。該資料集已被確定包含受版權保護的作品,這增加了原告主張的可信度。

部分駁回索賠

雖然 DMCA 索賠繼續進行,但 Chhabria 法官駁回了原告的一項索賠。這項被駁回的索賠聲稱,Meta 使用通過點對點 torrent 獲得的未經許可的書籍進行 Llama 訓練,違反了加州的《綜合電腦數據訪問和欺詐法案》(CDAFA)。

專家意見:DMCA 索賠和合理使用

聖塔克拉拉大學法學教授 Edward Lee 告誡不要僅根據與已刪除 CMI 相關的 DMCA 索賠來推斷合理使用。他指出,Chhabria 法官對原告證明 DMCA 索賠的能力表示懷疑,並建議有可能在簡易判決中重新審視該問題。Lee 強調,原告的律師成功地為他們的 DMCA 索賠確定了一個更具體的事實依據,該索賠先前已被駁回。

對其他 AI 相關訴訟的影響

針對 Meta 的 CMI 索賠的進展,以及先前有利於 Thomson Reuters 對抗 Ross Intelligence 的裁決,表明法院在看待 AI 訓練中使用受版權保護材料的方式上可能發生轉變。這些決定可能會加強原告在其他正在進行的 AI 相關訴訟中的地位。

例如,Tremblay et al. vs OpenAI et al. 一案最近進行了修改,以恢復先前被駁回的 DMCA 索賠。修改後的訴狀引用了在證據開示期間發現的新證據,認為 OpenAI 也在其大型語言模型的訓練過程中刪除了 CMI。

更廣泛的背景:版權和 AI 訓練

圍繞 AI 和版權的法律鬥爭凸顯了在創新與知識產權之間取得平衡的複雜挑戰。不加區別地將受版權保護的材料用於 AI 訓練引起了人們對潛在侵權的擔憂,特別是當 AI 模型生成的輸出內容與受版權保護的作品非常相似或直接複製時。

這些案件的結果可能會對 AI 開發的未來以及在訓練資料集中使用受版權保護的材料產生重大影響。這些決定可能會影響 AI 公司獲取數據和模型訓練的方式,可能導致更加重視許可、歸屬和版權管理信息的保護。

Meta 與作者之間的爭議突顯了圍繞 AI 和知識產權不斷發展的法律格局。隨著 AI 技術的不斷進步,法院將在界定允許使用的界限和建立解決 AI 生成內容帶來的獨特挑戰的法律先例方面發揮關鍵作用。正在進行的訴訟提醒人們尊重版權法的重要性,並確保創作者因其作品的使用而獲得公平的補償,即使在快速發展的人工智慧領域也是如此。

這些案件中提出的法律論點深入探討了版權法、DMCA 以及在 AI 背景下應用合理使用原則的複雜性。原告聲稱 Meta 的行為構成故意規避版權保護並剝奪創作者應有的認可和補償。另一方面,Meta 可能會辯稱其使用受版權保護的材料屬於合理使用,或者出於技術原因需要刪除 CMI。法院最終需要權衡這些論點,並確定 Meta 的行為是否越界進入了版權侵權。

這些案件還提出了 AI 開發者有責任確保其模型使用合法獲取的數據進行訓練的問題。隨著 AI 變得越來越普遍,數據來源和模型訓練的透明度和問責制變得至關重要。這些爭議的法律結果可能會影響行業慣例,並鼓勵制定 AI 開發的道德準則。

關於版權和 AI 的爭論不僅限於法律領域。它還延伸到更廣泛的社會討論,關於 AI 在創意事業中的作用以及對人類藝術家和作者的潛在影響。一些人認為 AI 生成的內容對人類創造力構成威脅,而另一些人則將 AI 視為可以增強和擴展人類能力的工具。這些討論強調了需要細緻地理解 AI 與人類創造力之間的關係,以及促進有利於創作者和技術開發者的協作環境的重要性。

目前正在進行的法律鬥爭代表著在駕馭版權法和人工智慧的複雜交叉點方面邁出的關鍵一步。這些案件中做出的決定可能會產生深遠的影響,塑造 AI 開發的未來、知識產權的保護以及技術與創造力之間的關係。法律專家、技術開發者和創作者之間正在進行的對話對於確保 AI 創新以尊重法律框架和創作者權利的方式進行至關重要。