Latar Belakang
Akta AI Eropah (Peraturan (EU) 2024/1689, atau ‘Akta AI’) mengenakan obligasi khusus ke atas penyedia model AI Tujuan Umum (‘GPAI’). Model-model ini, termasuk yang daripada keluarga GPT, Llama, dan Gemini, mesti mematuhi keperluan seperti dokumentasi komprehensif dan pembentukan dasar yang memastikan pematuhan undang-undang hak cipta EU.
Untuk memudahkan pematuhan terhadap ketetapan ini, Akta AI menjangkakan pembangunan Kod Amalan yang disesuaikan untuk model GPAI. Berikutan jemputan daripada Pejabat AI, pelbagai pakar dan pihak berkepentingan membentuk empat kumpulan kerja yang didedikasikan untuk merangka Kod Amalan awal. Kelulusan Kod ini oleh Suruhanjaya EU akan memberikannya ‘kesahan umum’ di seluruh EU. Penerapan Kod Amalan GPAI yang diluluskan menawarkan syarikat cara untuk menunjukkan pematuhan proaktif, yang berpotensi mengurangkan penelitian pengawalseliaan dan penalti yang berkaitan.
Pejabat AI baru-baru ini mengeluarkan draf ketiga Kod Amalan (‘Draf ke-3’) yang dihasilkan oleh kumpulan kerja ini. Draf ini merangkumi beberapa bidang utama:
- Komitmen
- Ketelusan
- Hak Cipta
- Keselamatan dan Sekuriti
Versi akhir Kod Amalan ini dijadualkan untuk dikeluarkan pada 2 Mei 2025.
Dokumen ini akan menyelidiki butiran penting dalam bahagian hak cipta Draf ke-3. Perubahan ketara daripada draf kedua (‘Draf ke-2’) ialah pendekatan Draf ke-3 yang diperkemas dan ringkas. Perubahan utama ialah Draf ke-3 secara amnya mengamanahkan bahawa usaha pematuhan harus sepadan dengan saiz dan keupayaan penyedia, tidak seperti Draf ke-2.
Untuk Siapa Ini Relevan?
Kod Amalan terutamanya menyasarkan penyedia model GPAI. Model-model ini dicirikan oleh keumuman yang ketara dan keupayaan mereka untuk melaksanakan pelbagai tugas yang berbeza dengan cekap. Ini merangkumi penyedia model bahasa besar yang terkenal seperti GPT (OpenAI), Llama (Meta), Gemini (Google), dan Mistral (Mistral AI). Walau bagaimanapun, penyedia model yang lebih kecil juga mungkin termasuk di bawah bidang kuasanya, dengan syarat model mereka boleh digunakan untuk pelbagai tugas. Tambahan pula, perniagaan yang memperhalusi model untuk aplikasi khusus mereka juga mungkin diklasifikasikan sebagai penyedia model GPAI.
‘Penyedia hiliran,’ atau perniagaan yang menyepadukan model GPAI ke dalam sistem AI mereka, juga harus membiasakan diri dengan Kod Amalan. Kod ini bersedia untuk menjadi piawaian kuasi untuk model GPAI, mentakrifkan jangkaan untuk pembangun sistem AI mengenai keupayaan model GPAI. Pemahaman ini boleh menjadi penting semasa rundingan kontrak dengan penyedia model GPAI.
Konsep Utama Kod Amalan mengenai Undang-Undang Hak Cipta
Penyedia model GPAI diwajibkan untuk mewujudkan dasar yang memastikan pematuhan undang-undang hak cipta EU (Perkara 53 (1) (c) Akta AI). Memandangkan kebaharuan keperluan ini, panduan praktikal mengenai struktur dan kandungan dasar sedemikian telah kurang. Kod Amalan bertujuan untuk menangani jurang ini.
Kod Amalan mengamanahkan bahawa penyedia melaksanakan langkah-langkah berikut:
Dasar Hak Cipta
Penyedia yang menandatangani Kod Amalan (‘Penandatangan’) dikehendaki merumus, menyelenggara dan melaksanakan dasar hak cipta yang selaras dengan undang-undang hak cipta EU. Keperluan ini diperoleh secara langsung daripada Akta AI. Penandatangan juga mesti memastikan bahawa organisasi mereka mematuhi dasar hak cipta ini.
Perbezaan yang ketara daripada Draf ke-2 ialah Draf ke-3 tidak lagi mengamanahkan penerbitan dasar hak cipta. Penandatangan hanya digalakkan untuk berbuat demikian. Keperluan yang dikurangkan ini adalah logik, kerana Akta AI itu sendiri tidak memaksa penyedia model untuk menerbitkan dasar hak cipta mereka.
Pengikisan Web Kandungan Berhak Cipta
Penandatangan secara amnya dibenarkan menggunakan perangkak web untuk tujuan perlombongan teks dan data (‘TDM’) untuk mengumpulkan data latihan untuk model GPAI mereka. Walau bagaimanapun, mereka mesti memastikan bahawa perangkak ini menghormati teknologi yang direka untuk menyekat akses kepada bahan berhak cipta, seperti paywall.
Selain itu, Penandatangan diwajibkan untuk mengecualikan ‘domain cetak rompak,’ iaitu sumber dalam talian yang terutamanya terlibat dalam pengedaran bahan yang melanggar hak cipta.
Pengikisan Web dan Mengenal Pasti serta Mematuhi Pengecualian TDM
Penandatangan mesti memastikan bahawa perangkak web mengenal pasti dan menghormati pengecualian TDM yang diisytiharkan oleh pemegang hak. Walaupun undang-undang hak cipta EU secara amnya membenarkan TDM, pemegang hak mengekalkan hak untuk menarik diri. Untuk kandungan web, pengecualian ini mestilah boleh dibaca mesin. Draf ke-3 menghuraikan keperluan untuk perangkak web, menyatakan bahawa mereka mesti mengenal pasti dan mematuhi protokol robots.txt yang diterima pakai secara meluas. Selain itu, perangkak web mesti mematuhi pengecualian TDM lain yang boleh dibaca mesin yang berkaitan, seperti metadata yang ditetapkan sebagai standard industri atau penyelesaian yang biasa digunakan oleh pemegang hak.
Penandatangan dikehendaki mengambil langkah yang munasabah untuk memaklumkan pemegang hak tentang perangkak web yang digunakan dan cara perangkak ini mengendalikan arahan robots.txt. Maklumat ini boleh disebarkan melalui pelbagai saluran, seperti suapan web. Terutama, Draf ke-3 tidak lagi termasuk kewajipan untuk menerbitkan maklumat ini.
Mengenal Pasti dan Mematuhi Pengecualian TDM untuk Kandungan Bukan Perangkak Web
Penyedia model GPAI juga boleh memperoleh set data daripada pihak ketiga dan bukannya menjalankan perangkakan web sendiri. Walaupun Draf ke-2 mengamanahkan usaha wajar hak cipta set data pihak ketiga, Draf ke-3 memerlukan usaha yang munasabah untuk mendapatkan maklumat mengenai sama ada perangkak web yang digunakan untuk mengumpulkan maklumat mematuhi protokol robots.txt.
Mengurangkan Risiko untuk Mencegah Penghasilan Output yang Melanggar Hak Cipta
Risiko ketara yang berkaitan dengan penggunaan AI ialah potensi AI untuk menjana output yang melanggar hak cipta. Ini boleh melibatkan penduaan kod atau imej yang ditemui dalam talian yang dilindungi oleh hak cipta.
Penandatangan dikehendaki membuat usaha yang munasabah untuk mengurangkan risiko ini. Ini mewakili pendekatan yang lebih longgar berbanding dengan Draf ke-2, yang menetapkan langkah-langkah untuk mengelakkan ‘overfitting.’ Draf ke-3 menggunakan pendirian yang lebih neutral dari segi teknologi, menekankan usaha yang munasabah.
Tambahan pula, Penandatangan mesti memasukkan klausa dalam terma dan syarat mereka (atau dokumen serupa) untuk penyedia sistem AI hiliran, yang melarang penggunaan model GPAI mereka dengan cara yang melanggar hak cipta.
Menetapkan Titik Hubungan
Penandatangan dikehendaki menyediakan titik hubungan untuk pemegang hak. Mereka juga mesti mewujudkan mekanisme yang membolehkan pemegang hak mengemukakan aduan mengenai pelanggaran hak cipta.
Di bawah Draf ke-3, Penandatangan mempunyai pilihan untuk menolak memproses aduan yang dianggap tidak berasas atau berlebihan.
Menyelidiki Lebih Dalam: Pemeriksaan yang Lebih Terperinci mengenai Peruntukan Hak Cipta
Draf ke-3, walaupun kelihatan diperkemas, memperkenalkan nuansa dan peralihan penekanan yang memerlukan penelitian lebih dekat. Mari kita bedah setiap bahagian dengan lebih lanjut:
Dasar Hak Cipta: Peralihan daripada Penerbitan kepada Galakan
Mandat awal untuk menerbitkan dasar hak cipta, yang terdapat dalam Draf ke-2, menimbulkan kebimbangan mengenai potensi kelemahan daya saing dan pendedahan maklumat sensitif. Langkah Draf ke-3 untuk menggalakkan penerbitan, dan bukannya memerlukannya, mengakui kebimbangan ini. Perubahan ini membolehkan penyedia mengekalkan tahap kerahsiaan tertentu mengenai strategi pematuhan dalaman mereka, sambil tetap mempromosikan ketelusan. Walau bagaimanapun, aspek ‘galakan’ masih meletakkan tekanan halus pada penyedia untuk bersikap terbuka mengenai dasar mereka, yang berpotensi membawa kepada standard penerbitan de facto dari masa ke masa.
Pengikisan Web: Mengimbangi Pemerolehan Data dengan Penghormatan Hak Cipta
Kebenaran eksplisit untuk pengikisan web, ditambah dengan keperluan untuk menghormati sekatan akses seperti paywall, mencerminkan tindakan pengimbangan yang halus. Akta AI mengiktiraf kepentingan data untuk melatih model AI, tetapi ia juga menekankan keperluan untuk menghormati hak pencipta kandungan. Pengecualian ‘domain cetak rompak’ adalah tambahan penting, secara eksplisit menyasarkan sumber yang secara aktif terlibat dalam pelanggaran hak cipta. Peruntukan ini mengukuhkan prinsip bahawa pembangunan AI tidak boleh dibina di atas asas aktiviti haram.
Pengecualian TDM: Kekhususan Teknikal Pematuhan
Penekanan Draf ke-3 pada protokol robots.txt dan mekanisme pengecualian lain yang boleh dibaca mesin menyerlahkan aspek teknikal pematuhan. Kekhususan ini memberikan kejelasan untuk kedua-dua penyedia GPAI dan pemegang hak. Bagi penyedia, ia menggariskan langkah konkrit yang mesti mereka ambil untuk memastikan perangkak mereka menghormati permintaan pengecualian. Bagi pemegang hak, ia menjelaskan cara mereka boleh memberi isyarat dengan berkesan mengenai keutamaan mereka mengenai TDM. Kemasukan metadata ‘standard industri’ dan penyelesaian ‘yang diterima pakai secara meluas’ mengakui bahawa landskap mekanisme pengecualian sedang berkembang dan fleksibiliti adalah perlu.
Kandungan Bukan Perangkak Web: Mengalihkan Tanggungjawab dan Usaha Wajar
Perubahan daripada ‘usaha wajar hak cipta’ kepada ‘usaha yang munasabah untuk mendapatkan maklumat’ mengenai set data pihak ketiga mewakili peralihan tanggungjawab yang halus tetapi ketara. Walaupun Draf ke-2 meletakkan beban yang lebih berat pada penyedia GPAI untuk menyiasat secara aktif status hak cipta set data, Draf ke-3 memberi tumpuan kepada pengesahan sama ada proses pengumpulan data (oleh pihak ketiga) menghormati robots.txt. Ini secara tersirat mengakui bahawa penyedia GPAI mungkin tidak selalu mempunyai kawalan langsung ke atas amalan pemerolehan data pihak ketiga, tetapi mereka masih mempunyai tanggungjawab untuk bertanya tentang pematuhan.
Mengurangkan Output yang Melanggar: Daripada ‘Overfitting’ kepada ‘Usaha Munasabah’
Langkah menjauhi istilah ‘overfitting’ adalah perubahan yang dialu-alukan. ‘Overfitting,’ istilah teknikal dalam pembelajaran mesin, merujuk kepada model yang berprestasi baik pada data latihan tetapi kurang baik pada data baharu. Walaupun overfitting boleh menyumbang kepada pelanggaran hak cipta (cth., dengan menghafal dan menghasilkan semula bahan berhak cipta), ia bukan satu-satunya punca. Tumpuan Draf ke-3 yang lebih luas pada ‘usaha yang munasabah untuk mengurangkan risiko’ merangkumi pelbagai senario pelanggaran yang berpotensi dan membolehkan lebih banyak fleksibiliti dalam pelaksanaan. Perubahan ini juga mengakui bahawa pencegahan sempurna pelanggaran hak cipta mungkin tidak dapat dicapai, dan pendekatan berasaskan risiko adalah lebih praktikal.
Titik Hubungan dan Mekanisme Aduan: Memperkemas Proses
Keperluan untuk titik hubungan yang ditetapkan dan mekanisme aduan menyediakan pemegang hak dengan saluran yang jelas untuk menangani potensi pelanggaran hak cipta. Keupayaan Penandatangan untuk menolak aduan ‘tidak berasas atau berlebihan’ adalah tambahan praktikal, menghalang sistem daripada dibebani oleh tuntutan remeh. Peruntukan ini membantu memastikan bahawa mekanisme aduan kekal sebagai alat yang berdaya maju dan cekap untuk menangani kebimbangan hak cipta yang sah.
Implikasi yang Lebih Luas dan Pertimbangan Masa Depan
Draf ke-3 Kod Amalan GPAI mewakili langkah penting ke arah mengoperasikan peruntukan hak cipta Akta AI. Ia menyediakan kejelasan dan panduan yang sangat diperlukan untuk penyedia GPAI, sambil juga berusaha untuk melindungi hak pencipta kandungan. Walau bagaimanapun, beberapa implikasi yang lebih luas dan pertimbangan masa depan kekal:
Standard ‘Usaha Munasabah’: Penggunaan berulang frasa ‘usaha munasabah’ memperkenalkan tahap subjektiviti. Apa yang dianggap ‘munasabah’ mungkin akan tertakluk kepada tafsiran dan mungkin berkembang dari masa ke masa melalui cabaran undang-undang dan amalan terbaik industri. Kekaburan ini boleh membawa kepada ketidakpastian bagi penyedia, tetapi ia juga membolehkan fleksibiliti dan penyesuaian kepada konteks yang berbeza.
Peranan Penyedia Hiliran: Walaupun Kod terutamanya menyasarkan penyedia GPAI, penyedia hiliran mempunyai kepentingan dalam memahami peruntukannya. Kod menetapkan jangkaan untuk kualiti dan pematuhan model GPAI, yang boleh memaklumkan rundingan kontrak dan penilaian risiko. Penyedia hiliran juga mungkin menghadapi tekanan tidak langsung untuk memastikan bahawa penggunaan model GPAI mereka selaras dengan prinsip Kod.
Evolusi Teknologi: Kepesatan pembangunan AI bermakna Kod Amalan perlu menjadi dokumen yang hidup. Teknik baharu untuk pemerolehan data, latihan model dan penjanaan output mungkin muncul, memerlukan kemas kini kepada peruntukan Kod. Rujukan kepada metadata ‘standard industri’ dan penyelesaian ‘yang diterima pakai secara meluas’ mengakui keperluan ini untuk penyesuaian berterusan.
Penyelarasan Antarabangsa: Akta AI EU ialah perundangan perintis, tetapi ia tidak beroperasi dalam vakum. Bidang kuasa lain juga bergelut dengan cabaran mengawal selia AI. Penyelarasan antarabangsa peraturan AI, termasuk peruntukan hak cipta, akan menjadi penting untuk mengelakkan pemecahan dan memastikan persaingan yang adil untuk pembangun AI.
Kesan ke atas Inovasi: Kod Amalan bertujuan untuk mencapai keseimbangan antara mempromosikan inovasi AI dan melindungi hak cipta. Walau bagaimanapun, kesan peraturan ini terhadap kepantasan dan hala tuju pembangunan AI masih belum dapat dilihat. Sesetengah pihak berpendapat bahawa peraturan yang terlalu ketat boleh menyekat inovasi, manakala yang lain berpendapat bahawa peraturan yang jelas adalah perlu untuk memupuk pembangunan AI yang bertanggungjawab.
Penguatkuasaan dan Pemantauan: Bagaimanakah pematuhan akan diperiksa? Keberkesanan kod akan bergantung sebahagian besarnya pada mekanisme yang disediakan untuk penguatkuasaan dan pemantauan.
Draf ke-3 Kod Amalan GPAI ialah dokumen yang kompleks dan berkembang dengan implikasi yang meluas. Ia mewakili usaha yang ketara untuk menangani cabaran pematuhan hak cipta dalam era AI, tetapi ia juga merupakan kerja yang sedang berjalan. Dialog berterusan antara pihak berkepentingan, termasuk penyedia GPAI, pemegang hak, penggubal dasar dan komuniti AI yang lebih luas, akan menjadi penting untuk memastikan bahawa Kod mencapai matlamat yang dimaksudkan dan kekal relevan dalam menghadapi perubahan teknologi yang pesat.