Lanskap pengembangan AI sekali lagi terlibat dalam pertikaian hukum, ketika sekelompok organisasi berita dan media terkemuka telah meluncurkan gugatan pelanggaran hak cipta dan merek dagang terhadap startup AI generatif Cohere. Diajukan di Pengadilan Distrik AS untuk Distrik Selatan New York pada Februari 2025, gugatan tersebut menyebutkan lebih dari selusin penggugat, termasuk publikasi yang dihormati seperti Forbes, The Guardian, dan Los Angeles Times. Inti dari masalah ini adalah pemanfaatan teknologi Retrieval-Augmented Generation (RAG) oleh Cohere, yang menurut penggugat melibatkan penggunaan tidak sah materi berhak cipta mereka untuk membangun basis data dan menghasilkan keluaran.
Teknologi RAG di Bawah Pengawasan
Retrieval-Augmented Generation (RAG) muncul sebagai solusi potensial untuk beberapa tantangan inheren yang terkait dengan model bahasa besar (LLM). Diusulkan oleh Patrick Lewis dan rekan-rekannya pada tahun 2020, RAG bertujuan untuk mengurangi masalah seperti halusinasi (generasi informasi yang faktual salah atau tidak masuk akal), pengetahuan yang ketinggalan zaman, dan kurangnya transparansi dalam penalaran model. Menariknya, Patrick Lewis sendiri saat ini menjadi peneliti di Cohere, melanjutkan pekerjaannya pada teknologi RAG. Adopsi RAG telah meluas, dengan pemain utama seperti Microsoft, Google, Amazon, dan NVIDIA mengintegrasikannya ke dalam sistem AI mereka.
Gugatan yang diajukan oleh penerbit berita berpusat pada beberapa tuduhan utama pelanggaran hak cipta terhadap Cohere. Klaim ini menyoroti pertanyaan hukum yang kompleks seputar penggunaan materi berhak cipta dalam pelatihan dan pengoperasian model AI generatif.
Klaim Pelanggaran Hak Cipta Terhadap Cohere
Tuduhan penggugat terhadap Cohere dapat dipecah menjadi empat kategori utama:
1. Pelatihan Model AI
Inti dari argumen penggugat berkisar pada bagaimana Cohere melatih model bahasa besarnya, yang dikenal sebagai "Command Family." Mereka mengklaim Cohere terlibat dalam "scraping" teks secara ekstensif dari internet, termasuk konten berhak cipta dari publikasi penggugat. Data yang di-scrape ini kemudian digunakan untuk membuat dataset yang diperlukan untuk melatih model Command Family. Selain itu, penggugat menuduh bahwa Cohere menggunakan dataset pihak ketiga seperti C4 dari Common Crawl, yang berisi sejumlah besar materi berhak cipta mereka, tanpa memperoleh izin yang diperlukan.
Penggunaan materi berhak cipta dalam pelatihan model AI telah menjadi masalah yang diperdebatkan. Pengembang AI sering berpendapat bahwa penggunaan tersebut termasuk dalam doktrin "penggunaan wajar" (fair use), yang memungkinkan penggunaan terbatas materi berhak cipta untuk tujuan seperti kritik, komentar, pelaporan berita, pengajaran, beasiswa, atau penelitian. Namun, pemegang hak cipta berpendapat bahwa scraping dan penggunaan konten mereka secara besar-besaran untuk tujuan komersial, seperti pelatihan model AI, melampaui ruang lingkup penggunaan wajar. Pertempuran hukum ini kemungkinan akan bergantung pada apakah pengadilan setuju dengan penilaian penggugat.
2. Penggunaan Real-time / RAG
Aspek kunci lain dari gugatan tersebut berfokus pada bagaimana layanan Cohere, khususnya antarmuka Chat-nya, menggunakan teknologi RAG secara real-time. Penggugat menuduh bahwa model Cohere mengikis konten dari sumber eksternal, termasuk situs web mereka, untuk menghasilkan respons terhadap kueri pengguna. Scraping real-time ini, menurut penggugat, merupakan pelanggaran hak cipta, terutama ketika model Cohere melewati paywall atau mengabaikan arahan "robots.txt", yang merupakan perintah yang menginstruksikan perayap web (termasuk yang digunakan oleh model AI) untuk tidak mengikis konten tertentu dari sebuah situs web.
Melewati paywall dan arahan robots.txt menimbulkan pertanyaan etis dan hukum yang serius. Paywall dirancang untuk melindungi konten berhak cipta dan memastikan bahwa penerbit diberi kompensasi atas pekerjaan mereka. Arahan Robots.txt adalah mekanisme standar bagi pemilik situs web untuk mengontrol bagaimana konten mereka diakses dan digunakan oleh perayap web. Dengan mengabaikan perlindungan ini, Cohere dituduh menunjukkan pengabaian terhadap undang-undang hak cipta dan hak-hak pembuat konten.
3. Keluaran yang Melanggar
Penggugat berpendapat bahwa layanan Cohere memberikan keluaran yang melanggar dalam bentuk salinan, kutipan substansial, atau ringkasan pengganti dari karya berhak cipta mereka sebagai tanggapan terhadap kueri pengguna. Mereka mengutip contoh keluaran Cohere Chat di mana panel "Under the Hood" menampilkan artikel lengkap atau sebagian yang disalin langsung dari situs web penggugat.
Penggugat berpendapat bahwa keluaran ini, apakah itu salinan verbatim atau ringkasan, secara langsung menggantikan kebutuhan pengguna untuk mengunjungi artikel asli. Ini, pada gilirannya, merugikan langganan digital dan pendapatan iklan yang diandalkan penggugat untuk menopang bisnis mereka. Inti dari argumen ini adalah bahwa model AI Cohere pada dasarnya bertindak sebagai distributor konten berhak cipta yang tidak sah, menghilangkan kompensasi yang sah dari penerbit asli.
4. Adaptasi yang Tidak Sah
Selain menampilkan bagian dari karya penggugat di panel "Under the Hood", layanan Cohere juga memberikan ringkasan atau abstrak dari karya-karya ini. Penggugat berpendapat bahwa tingkat detail dalam ringkasan ini begitu luas sehingga pada dasarnya menggantikan karya aslinya, melebihi batas penggunaan wajar.
Undang-undang hak cipta melindungi tidak hanya reproduksi verbatim karya berhak cipta tetapi juga pembuatan karya turunan, yang merupakan adaptasi atau transformasi dari yang asli. Penggugat berpendapat bahwa ringkasan Cohere begitu komprehensif sehingga merupakan karya turunan yang tidak sah, melanggar hak eksklusif mereka untuk membuat dan mendistribusikan adaptasi dari materi berhak cipta mereka.
Tanggung Jawab Sekunder untuk Tindakan Pengguna
Di luar klaim pelanggaran hak cipta langsung, penggugat juga berpendapat bahwa Cohere secara sekunder bertanggung jawab atas tindakan pelanggaran penggunanya. Mereka berpendapat bahwa layanan Cohere memfasilitasi reproduksi, tampilan, dan distribusi karya penggugat oleh pengguna, dan bahwa Cohere tidak dapat menghindari tanggung jawab dengan hanya menghubungkan pelanggaran dengan tindakan pengguna. Dasar untuk klaim ini adalah bahwa produk Cohere menghasilkan jawaban hanya setelah pengguna memasukkan perintah, menjadikan perusahaan peserta dalam aktivitas pelanggaran.
Argumen tanggung jawab sekunder ini signifikan karena berupaya meminta pengembang AI bertanggung jawab atas tindakan pengguna mereka, bahkan ketika pengguna tersebut yang secara langsung terlibat dalam pelanggaran hak cipta. Jika berhasil, argumen ini dapat memiliki implikasi yang luas bagi pengembangan dan penerapan teknologi AI, karena akan mengharuskan pengembang untuk menerapkan perlindungan untuk mencegah pengguna mereka melanggar hak cipta.
Klaim Pelanggaran Merek Dagang
Gugatan meluas di luar pelanggaran hak cipta untuk memasukkan klaim pelanggaran merek dagang. Penggugat menuduh bahwa praktik Cohere dalam menghubungkan sumber merupakan pelanggaran merek dagang karena menggunakan merek dagang terkenal penggugat tanpa izin atau mengaitkannya dengan konten keliru yang dihasilkan AI. Ini, menurut mereka, menyebabkan kerusakan pada reputasi merek penggugat dan pengenceran kekhasan mereka.
Merek dagang adalah simbol, desain, atau frasa yang terdaftar secara hukum untuk mewakili perusahaan atau produk. Penggunaan merek dagang yang tidak sah dapat menyebabkan kebingungan di antara konsumen dan merusak reputasi merek. Penggugat berpendapat bahwa penggunaan merek dagang mereka oleh Cohere sehubungan dengan konten yang dihasilkan AI dapat menyesatkan pengguna untuk percaya bahwa penggugat mendukung atau berafiliasi dengan layanan Cohere, yang tidak demikian halnya.
Konteks yang Lebih Luas: RAG dan Masa Depan Undang-Undang Hak Cipta AI
Gugatan terhadap Cohere ini bukanlah insiden yang terisolasi. Ini mengikuti gugatan hak cipta sebelumnya di AS pada Oktober 2024 yang juga berfokus pada aplikasi RAG dalam layanan AI. Meningkatnya jumlah kasus ini menyoroti meningkatnya ketegangan antara pengembang AI dan pemegang hak cipta karena arsitektur RAG menjadi lebih umum dalam layanan AI.
Pertempuran hukum seputar teknologi RAG kemungkinan akan menjadi masalah signifikan di masa depan undang-undang hak cipta AI. RAG menghadirkan tantangan unik karena melibatkan pengambilan dan penggunaan materi berhak cipta secara real-time untuk menghasilkan keluaran. Ini menimbulkan pertanyaan kompleks tentang ruang lingkup penggunaan wajar, tanggung jawab pengembang AI atas tindakan pengguna, dan perlindungan kekayaan intelektual di era kecerdasan buatan.
Hasil dari gugatan ini dapat memiliki dampak besar pada pengembangan dan penerapan teknologi AI. Jika pengadilan memutuskan mendukung pemegang hak cipta, pengembang AI mungkin terpaksa menerapkan perlindungan yang lebih ketat untuk mencegah pelanggaran hak cipta, yang dapat meningkatkan biaya dan kompleksitas pengembangan model AI. Di sisi lain, jika pengadilan memutuskan mendukung pengembang AI, pemegang hak cipta mungkin perlu menemukan cara baru untuk melindungi kekayaan intelektual mereka dalam menghadapi teknologi AI yang semakin canggih.
Benturan antara penerbit berita dan Cohere berfungsi sebagai titik kritis dalam perdebatan yang sedang berlangsung seputar AI, hak cipta, dan masa depan pembuatan konten. Hasil dari kasus ini, bersama dengan kasus lain seperti itu, tidak diragukan lagi akan membentuk lanskap hukum untuk AI generatif dan interaksinya dengan materi berhak cipta untuk tahun-tahun mendatang. Ketika AI terus berkembang dan menjadi lebih terintegrasi ke dalam berbagai aspek kehidupan kita, penting untuk mencapai keseimbangan antara mempromosikan inovasi dan melindungi hak-hak pembuat konten. Pengadilan, pembuat undang-undang, dan komunitas AI harus bekerja sama untuk menetapkan pedoman dan peraturan yang jelas yang mendorong kreativitas sambil memastikan bahwa kekayaan intelektual dihormati.
Industri berita, khususnya, menghadapi serangkaian tantangan unik di era AI. Ketika model AI menjadi semakin mampu menghasilkan konten berita, sangat penting bahwa penerbit diberi kompensasi atas penggunaan materi berhak cipta mereka dan bahwa integritas merek mereka dilindungi. Gugatan terhadap Cohere merupakan upaya penerbit berita untuk menegaskan hak-hak mereka dan memastikan bahwa pekerjaan mereka tidak dieksploitasi oleh perusahaan AI tanpa otorisasi yang tepat.