Latih AI atau Tidak; Itulah Persoalannya

Kebangkitan Pengecualian Hak Cipta untuk Latihan AI

Dalam beberapa tahun kebelakangan ini, semakin banyak negara telah mewujudkan pengecualian dalam undang-undang hak cipta mereka khusus untuk memudahkan perlombongan teks dan data oleh syarikat-syarikat AI. Pengecualian ini bertujuan untuk memupuk inovasi dalam bidang kecerdasan buatan dengan membenarkan LLM dilatih pada set data yang luas tanpa memerlukan kebenaran eksplisit daripada setiap pemegang hak cipta.

Singapura, contohnya, meminda undang-undang hak ciptanya pada tahun 2021 untuk mewujudkan pengecualian sedemikian. Langkah ini membuka jalan bagi pembangun AI di negara ini untuk mengakses dan memproses karya berhak cipta bagi tujuan melatih model mereka. Kini, bidang kuasa lain di Asia, termasuk Hong Kong dan Indonesia, sedang mempertimbangkan perubahan perundangan yang serupa.

Perspektif Cina: Kes Pelanggaran Hak Cipta yang Penting

China, pemain utama dalam landskap AI global, juga sedang bergelut dengan kerumitan hak cipta dalam era LLM. Satu kes penting, iQiyi lwn. MiniMax, telah membawa isu ini ke tumpuan yang tajam.

Dalam kes ini, iQiyi, platform penstriman video terkemuka, menyaman MiniMax, sebuah syarikat AI, kerana didakwa menggunakan bahan video berhak ciptanya untuk melatih model AI tanpa kebenaran. Tuntutan mahkamah ini menandakan perkembangan penting sebagai kes pelanggaran LLM video AI pertama di China, yang menonjolkan kebimbangan yang semakin meningkat mengenai penggunaan kandungan berhak cipta yang tidak dibenarkan dalam pembangunan teknologi AI.

Industri Penerbitan India Mencabar Amalan Latihan LLM

Perdebatan ini melangkaui Asia. Di India, beberapa syarikat penerbitan telah memulakan tindakan undang-undang terhadap pembangun LLM, mendakwa bahawa model-model ini sedang dilatih pada data yang dikikis yang merangkumi karya berhak cipta mereka. Kes-kes ini menekankan ketegangan antara keinginan untuk memajukan keupayaan AI dan keperluan untuk melindungi hak harta intelek pencipta.

Melangkaui Pengambilan Mudah: Nuansa Latihan LLM

Cabaran yang ditimbulkan oleh latihan LLM adalah jauh lebih rumit daripada sekadar tindakan pengambilan dan pemprosesan data. Kes-kes India dan peruntukan yang ditakrifkan secara sempit dalam undang-undang Singapura menyerlahkan sifat pelbagai aspek isu ini.

Ramai pemilik harta intelek secara eksplisit menyekat akses dan penggunaan karya berhak cipta mereka, manakala yang lain tidak bersetuju dengan akses dan pengeluaran semula tersebut. Sebilangan besar pencipta bergantung pada model pelesenan sebagai bahagian teras perniagaan mereka, dan penggunaan karya mereka yang tidak dibenarkan untuk latihan AI secara langsung menjejaskan model ini.

Tambahan pula, fakta bahawa banyak latihan boleh berlaku dalam awan menimbulkan persoalan bidang kuasa yang kompleks. Menentukan undang-undang mana yang terpakai apabila data diproses merentasi sempadan antarabangsa menambah satu lagi lapisan kerumitan kepada landskap undang-undang yang sudah rumit.

Akhirnya, isu teras berkisar tentang cara LLM mendapatkan data latihan mereka dan sama ada, dan bagaimana, mereka harus memberi pampasan kepada pemegang hak cipta untuk penggunaannya.

Organisasi Hak Cipta AS Membantah Pengecualian Berkanun

Perdebatan ini tidak terhad kepada negara-negara individu; ia juga telah melimpah ke arena antarabangsa. Gabungan hampir 50 persatuan perdagangan dan kumpulan industri di Amerika Syarikat, yang dikenali sebagai Digital Creators Coalition, telah menyuarakan bantahan keras terhadap pewujudan pengecualian berkanun untuk latihan LLM dalam undang-undang hak cipta tanpa peruntukan untuk kebenaran atau pampasan.

Organisasi-organisasi ini telah mengemukakan komen kepada Wakil Perdagangan Amerika Syarikat (USTR), menggesa agensi itu untuk menangani isu ini dalam semakan Khas 301 tahunannya, yang mengkaji perlindungan harta intelek dan amalan penguatkuasaan di seluruh dunia. Gabungan itu telah menyediakan senarai negara yang telah melaksanakan atau mencadangkan pengecualian sedemikian, yang menonjolkan skala global kebimbangan ini.

Perdebatan AS: Pendirian OpenAI dan Percanggahan Dalaman

Malah dalam Amerika Syarikat, perdebatan itu masih sangat hidup. OpenAI, syarikat di sebalik ChatGPT yang popular, telah menambah suaranya kepada perbincangan dengan mengemukakan surat terbuka kepada Pejabat Sains dan Teknologi Rumah Putih.

Dalam surat ini, OpenAI menyokong hak untuk mengikis data dari internet di bawah prinsip penggunaan saksama, secara berkesan berhujah untuk akses luas kepada bahan berhak cipta untuk tujuan latihan. Walau bagaimanapun, secara paradoks, OpenAI juga mencadangkan bahawa pembangun LLM asing harus dihadkan daripada melakukan perkara yang sama, berpotensi melalui penggunaan dasar eksport AS. Pendirian ini mendedahkan percanggahan dalaman, menyokong akses terbuka untuk dirinya sendiri sambil berusaha untuk mengehadkan akses orang lain.

Laluan ke Hadapan: Perdebatan Berterusan

Menjelang 2025, perdebatan mengenai hak cipta dan latihan AI pasti akan semakin sengit. Dengan kemunculan berterusan LLM baharu di seluruh dunia, keperluan untuk rangka kerja undang-undang yang jelas dan seimbang menjadi semakin mendesak.

Landskap undang-undang semasa adalah tampalan undang-undang negara, sesetengahnya dengan pengecualian eksplisit untuk latihan AI dan yang lain tidak mempunyai peruntukan sedemikian. Ketidakkonsistenan ini mewujudkan ketidakpastian bagi kedua-dua pembangun AI dan pemegang hak cipta, menghalang inovasi dan berpotensi menjejaskan hak pencipta.

Pertimbangan Utama untuk Rangka Kerja yang Seimbang:

  • Ketelusan dan Akauntabiliti: Pembangun LLM harus telus tentang sumber data yang digunakan untuk melatih model mereka dan bertanggungjawab untuk sebarang penggunaan bahan berhak cipta yang tidak dibenarkan.
  • Pampasan yang Adil: Mekanisme untuk memberi pampasan kepada pemegang hak cipta untuk penggunaan karya mereka dalam latihan AI harus diterokai. Ini boleh melibatkan perjanjian pelesenan, pengurusan hak kolektif, atau penyelesaian inovatif lain.
  • Penyelarasan Antarabangsa: Usaha untuk mengharmonikan undang-undang hak cipta yang berkaitan dengan latihan AI merentasi bidang kuasa yang berbeza akan mengurangkan ketidakpastian undang-undang dan memudahkan kerjasama rentas sempadan.
  • Mengimbangi Inovasi dan Hak Pencipta: Rangka kerja undang-undang harus mencapai keseimbangan antara memupuk inovasi dalam AI dan melindungi hak pencipta. Ini memerlukan pertimbangan yang teliti terhadap pelbagai kepentingan yang terlibat.
  • Peranan Penggunaan Saksama: Kebolehgunaan prinsip penggunaan saksama untuk latihan AI perlu dijelaskan. Ini mungkin melibatkan pentakrifan kriteria khusus untuk menentukan sama ada penggunaan bahan berhak cipta untuk tujuan latihan layak sebagai penggunaan saksama.

Perbincangan berterusan mengenai hak cipta dan latihan AI menyerlahkan cabaran menyesuaikan rangka kerja undang-undang sedia ada kepada teknologi yang berkembang pesat. Mencari penyelesaian yang mengimbangi kepentingan semua pihak berkepentingan akan memerlukan dialog berterusan, kerjasama, dan kesediaan untuk menyesuaikan diri dengan landskap era digital yang berubah-ubah. Masa depan pembangunan AI, dan perlindungan karya kreatif, mungkin bergantung pada hasil perdebatan penting ini. Persoalan tentang latihan akan bersama kita untuk masa yang lama.