Pertikaian Hak Cipta AI Generatif Memuncak

Lanskap pembangunan AI sekali lagi terlibat dalam pertikaian undang-undang, apabila sekumpulan organisasi berita dan media terkemuka telah melancarkan tuntutan mahkamah pelanggaran hak cipta dan tanda dagangan terhadap syarikat permulaan AI generatif, Cohere. Difailkan di Mahkamah Daerah A.S. untuk Daerah Selatan New York pada Februari 2025, saman itu menamakan lebih sedozen plaintif, termasuk penerbitan yang dihormati seperti Forbes, The Guardian dan Los Angeles Times. Inti permasalahan terletak pada penggunaan teknologi Retrieval-Augmented Generation (RAG) oleh Cohere, yang didakwa oleh plaintif melibatkan penggunaan bahan berhak cipta mereka tanpa kebenaran untuk membina pangkalan data dan menjana output.

Teknologi RAG Di Bawah Penelitian

Retrieval-Augmented Generation (RAG) muncul sebagai penyelesaian yang berpotensi untuk beberapa cabaranInheren yang berkaitan dengan model bahasa yang besar (LLM). Dicadangkan oleh Patrick Lewis dan rakan-rakannya pada tahun 2020, RAG bertujuan untuk mengurangkan isu-isu seperti halusinasi (penjanaan maklumat yang faktanya tidak betul atau tidak masuk akal), pengetahuan yang sudah lapuk, dan kekurangan ketelusan dalam penaakulan model. Menariknya, Patrick Lewis sendiri kini menjadi penyelidik di Cohere, meneruskan kerjanya pada teknologi RAG. Penerimaan RAG telah meluas, dengan pemain utama seperti Microsoft, Google, Amazon dan NVIDIA menyepadukannya ke dalam sistem AI mereka.

Tuntutan mahkamah yang dibawa oleh penerbit berita berpusat pada beberapa dakwaan utama pelanggaran hak cipta terhadap Cohere. Tuntutan ini menyoroti soalan undang-undang yang kompleks mengenai penggunaan bahan berhak cipta dalam latihan dan operasi model AI generatif.

Dakwaan Pelanggaran Hak Cipta Terhadap Cohere

Dakwaan plaintif terhadap Cohere boleh dipecahkan kepada empat kategori utama:

1. Latihan Model AI

Inti hujah plaintif berkisar tentang cara Cohere melatih model bahasanya yang besar, yang dikenali sebagai "Command Family." Mereka mendakwa Cohere terlibat dalam "pengikisan" teks yang meluas daripada internet, termasuk kandungan berhak cipta daripada penerbitan plaintif. Data yang dikikis ini kemudian digunakan untuk mencipta set data yang diperlukan untuk melatih model Command Family. Tambahan pula, plaintif mendakwa bahawa Cohere menggunakan set data pihak ketiga seperti C4 Common Crawl, yang mengandungi sejumlah besar bahan berhak cipta mereka, tanpa mendapatkan kebenaran yang diperlukan.

Penggunaan bahan berhak cipta dalam latihan model AI telah menjadi isu yang dipertikaikan. Pembangun AI sering berhujah bahawa penggunaan sedemikian termasuk dalam doktrin "penggunaan adil," yang membenarkan penggunaan bahan berhak cipta yang terhad untuk tujuan seperti kritikan, ulasan, pelaporan berita, pengajaran, biasiswa atau penyelidikan. Walau bagaimanapun, pemegang hak cipta berhujah bahawa pengikisan berskala besar dan penggunaan kandungan mereka untuk tujuan komersial, seperti melatih model AI, melampaui skop penggunaan adil. Pertempuran undang-undang ini mungkin bergantung kepada sama ada mahkamah bersetuju dengan penilaian plaintif.

2. Penggunaan Masa Nyata / RAG

Satu lagi aspek penting dalam tuntutan mahkamah ialah tumpuan kepada cara perkhidmatan Cohere, khususnya antara muka Chatnya, menggunakan teknologi RAG dalam masa nyata. Plaintif mendakwa bahawa model Cohere mengikis kandungan daripada sumber luaran, termasuk tapak web mereka, untuk menjana respons kepada pertanyaan pengguna. Pengikisan masa nyata ini, menurut plaintif, merupakan pelanggaran hak cipta, terutamanya apabila model Cohere memintas paywall atau mengabaikan arahan "robots.txt," yang merupakan arahan yang mengarahkan pelayan web (termasuk yang digunakan oleh model AI) untuk tidak mengikis kandungan tertentu daripada tapak web.

Pintasan paywall dan arahan robots.txt menimbulkan soalan etika dan undang-undang yang serius. Paywall direka untuk melindungi kandungan berhak cipta dan memastikan penerbit diberi pampasan untuk kerja mereka. Arahan Robots.txt ialah mekanisme standard untuk pemilik laman web mengawal cara kandungan mereka diakses dan digunakan oleh pelayan web. Dengan mengabaikan perlindungan ini, Cohere dituduh menunjukkan sikap tidak menghiraukan undang-undang hak cipta dan hak pencipta kandungan.

3. Output yang Melanggar

Plaintif mendakwa bahawa perkhidmatan Cohere menyediakan output yang melanggar dalam bentuk salinan, petikan yang besar atau ringkasan penggantian karya berhak cipta mereka sebagai tindak balas kepada pertanyaan pengguna. Mereka memetik contoh output Chat Cohere di mana panel "Under the Hood" memaparkan artikel penuh atau separa yang disalin terus daripada tapak web plaintif.

Plaintif berhujah bahawa output ini, sama ada salinan verbatim atau ringkasan, secara langsung menggantikan keperluan pengguna untuk melawati artikel asal. Ini, seterusnya, menjejaskan langganan digital dan hasil pengiklanan yang bergantung kepada plaintif untuk meneruskan perniagaan mereka. Inti hujah ini ialah model AI Cohere pada dasarnya bertindak sebagai pengedar kandungan berhak cipta tanpa kebenaran, menafikan pampasan yang sah kepada penerbit asal.

4. Adaptasi Tanpa Kebenaran

Sebagai tambahan kepada memaparkan bahagian kerja plaintif dalam panel "Under the Hood," perkhidmatan Cohere juga menyediakan ringkasan atau abstrak kerja ini. Plaintif berhujah bahawa tahap perincian dalam ringkasan ini sangat besar sehingga ia pada dasarnya menggantikan kerja asal, melebihi batasan penggunaan adil.

Undang-undang hak cipta melindungi bukan sahaja pengeluaran semula verbatim karya berhak cipta tetapi juga penciptaan karya terbitan, yang merupakan adaptasi atau transformasi asal. Plaintif berhujah bahawa ringkasan Cohere sangat komprehensif sehingga ia merupakan karya terbitan tanpa kebenaran, melanggar hak eksklusif mereka untuk mencipta dan mengedarkan adaptasi bahan berhak cipta mereka.

Liabiliti Sekunder untuk Tindakan Pengguna

Di sebalik tuntutan pelanggaran hak cipta langsung, plaintif juga berhujah bahawa Cohere bertanggungjawab secara sekunder untuk tindakan melanggar hak cipta penggunanya. Mereka berhujah bahawa perkhidmatan Cohere memudahkan pengeluaran semula, paparan dan pengedaran karya plaintif oleh pengguna, dan bahawa Cohere tidak boleh mengelak tanggungjawab dengan hanya mengaitkan pelanggaran kepada tindakan pengguna. Asas untuk tuntutan ini ialah produk Cohere menjana jawapan hanya selepas pengguna memasukkan gesaan, menjadikan syarikat itu peserta dalam aktiviti melanggar tersebut.

Hujah liabiliti sekunder ini adalah penting kerana ia berusaha untuk memastikan pembangun AI bertanggungjawab atas tindakan pengguna mereka, walaupun pengguna tersebut adalah orang yang terlibat secara langsung dalam pelanggaran hak cipta. Jika berjaya, hujah ini boleh membawa implikasi yang meluas untuk pembangunan dan penggunaan teknologi AI, kerana ia akan memerlukan pembangun untuk melaksanakan perlindungan untuk menghalang pengguna mereka daripada melanggar hak cipta.

Tuntutan Pelanggaran Tanda Dagangan

Tuntutan mahkamah meluas di sebalik pelanggaran hak cipta untuk memasukkan tuntutan pelanggaran tanda dagangan. Plaintif mendakwa bahawa amalan Cohere mengaitkan sumber merupakan pelanggaran tanda dagangan kerana ia menggunakan tanda dagangan terkenal plaintif tanpa kebenaran atau mengaitkannya dengan kandungan erroneous yang dijana AI. Ini, di hujah mereka, membawa kepada kerosakan pada reputasi jenama plaintif dan pencairan perbezaan mereka.

Tanda dagangan ialah simbol, reka bentuk atau frasa yang didaftarkan secara sah untuk mewakili syarikat atau produk. Penggunaan tanda dagangan tanpa kebenaran boleh menyebabkan kekeliruan di kalangan pengguna dan merosakkan reputasi jenama. Plaintif berhujah bahawa penggunaan tanda dagangan mereka oleh Cohere berhubung dengan kandungan yang dijana AI boleh mengelirukan pengguna untuk mempercayai bahawa plaintif menyokong atau bergabung dengan perkhidmatan Cohere, yang tidak berlaku.

Konteks yang Lebih Luas: RAG dan Masa Depan Undang-undang Hak Cipta AI

Tuntutan mahkamah terhadap Cohere ini bukanlah kejadian terpencil. Ia menyusuli tuntutan mahkamah hak cipta sebelumnya di A.S. pada Oktober 2024 yang juga menumpukan pada aplikasi RAG dalam perkhidmatan AI. Jumlah kes yang semakin meningkat ini menyoroti peningkatan ketegangan antara pembangun AI dan pemegang hak cipta apabila seni bina RAG menjadi lebih lazim dalam perkhidmatan AI.

Pertempuran undang-undang di sekitar teknologi RAG mungkin akan menjadi isu penting pada masa depan undang-undang hak cipta AI. RAG membentangkan cabaran yang unik kerana ia melibatkan pengambilan dan penggunaan masa nyata bahan berhak cipta untuk menjana output. Ini menimbulkan soalan yang kompleks tentang skop penggunaan adil, tanggungjawab pembangun AI untuk tindakan pengguna, dan perlindungan harta intelek dalam era kecerdasan buatan.

Keputusan tuntutan mahkamah ini boleh memberi impak yang mendalam terhadap pembangunan dan penggunaan teknologi AI. Jika mahkamah memutuskan memihak kepada pemegang hak cipta, pembangun AI mungkin terpaksa melaksanakan perlindungan yang lebih ketat untuk mencegah pelanggaran hak cipta, yang boleh meningkatkan kos dan kerumitan pembangunan model AI. Sebaliknya, jika mahkamah memutuskan memihak kepada pembangun AI, pemegang hak cipta mungkin perlu mencari cara baharu untuk melindungi harta intelek mereka dalam menghadapi teknologi AI yang semakin canggih.

Perbalahan antara penerbit berita dan Cohere berfungsi sebagai titik genting dalam perdebatan yang berterusan mengenai AI, hak cipta dan masa depan penciptaan kandungan. Keputusan kes ini, bersama-sama yang lain seperti itu, sudah pasti akan membentuk landskap undang-undang untuk AI generatif dan interaksinya dengan bahan berhak cipta untuk tahun-tahun akan datang. Memandangkan AI terus berkembang dan menjadi lebih bersepadu ke dalam pelbagai aspek kehidupan kita, adalah penting untuk mencapai keseimbangan antara menggalakkan inovasi dan melindungi hak pencipta kandungan. Mahkamah, penggubal undang-undang dan komuniti AI mesti bekerjasama untuk mewujudkan garis panduan dan peraturan yang jelas yang memupuk kreativiti sambil memastikan harta intelektual dihormati.

Industri berita, khususnya, menghadapi satu set cabaran unik dalam era AI. Memandangkan model AI semakin mampu menjana kandungan berita, adalah penting untuk penerbit diberi pampasan untuk penggunaan bahan berhak cipta mereka dan integriti jenama mereka dilindungi. Tuntutan mahkamah terhadap Cohere mewakili usaha oleh penerbit berita untuk menegaskan hak mereka dan memastikan karya mereka tidak dieksploitasi oleh syarikat AI tanpa kebenaran yang betul.