Latar Belakang
European AI Act (Regulasi (EU) 2024/1689, atau ‘AI Act’) memberlakukan kewajiban khusus pada penyedia model AI Generatif (General-Purpose AI atau ‘GPAI’). Model-model ini, termasuk yang berasal dari keluarga GPT, Llama, dan Gemini, harus mematuhi persyaratan seperti dokumentasi komprehensif dan pembentukan kebijakan yang memastikan kepatuhan terhadap undang-undang hak cipta Uni Eropa.
Untuk memfasilitasi kepatuhan terhadap ketentuan ini, AI Act mengantisipasi pengembangan Kode Praktik yang dirancang khusus untuk model GPAI. Menyusul undangan dari AI Office, berbagai ahli dan pemangku kepentingan membentuk empat kelompok kerja yang didedikasikan untuk menyusun Kode Praktik awal. Persetujuan Kode ini oleh Komisi Uni Eropa akan memberikannya ‘validitas umum’ di seluruh Uni Eropa. Adopsi Kode Praktik GPAI yang disetujui menawarkan perusahaan sarana untuk menunjukkan kepatuhan proaktif, yang berpotensi mengurangi pengawasan regulasi dan hukuman terkait.
AI Office baru-baru ini merilis draf ketiga Kode Praktik (‘Draf ke-3’) yang dihasilkan oleh kelompok kerja ini. Draf ini mencakup beberapa area utama:
- Komitmen
- Transparansi
- Hak Cipta
- Keselamatan dan Keamanan
Versi final Kode Praktik ini dijadwalkan akan dirilis pada 2 Mei 2025.
Dokumen ini akan menggali detail signifikan dalam bagian hak cipta dari Draf ke-3. Pergeseran penting dari draf kedua (‘Draf ke-2’) adalah pendekatan Draf ke-3 yang disederhanakan dan ringkas. Perubahan utama adalah bahwa Draf ke-3 umumnya mengamanatkan bahwa upaya kepatuhan harus sepadan dengan ukuran dan kemampuan penyedia, tidak seperti Draf ke-2.
Untuk Siapa Ini Relevan?
Kode Praktik terutama menargetkan penyedia model GPAI. Model-model ini dicirikan oleh generalitasnya yang signifikan dan kemampuannya untuk secara mahir melaksanakan spektrum luas tugas yang berbeda. Ini mencakup penyedia model bahasa besar yang terkenal seperti GPT (OpenAI), Llama (Meta), Gemini (Google), dan Mistral (Mistral AI). Namun, penyedia model yang lebih kecil juga dapat termasuk dalam lingkupnya, asalkan model mereka dapat digunakan untuk berbagai tugas. Selain itu, bisnis yang menyempurnakan model untuk aplikasi spesifik mereka juga dapat diklasifikasikan sebagai penyedia model GPAI.
‘Penyedia hilir,’ atau bisnis yang mengintegrasikan model GPAI ke dalam sistem AI mereka, juga harus membiasakan diri dengan Kode Praktik. Kode ini siap untuk menjadi standar kuasi untuk model GPAI, yang mendefinisikan harapan bagi pengembang sistem AI mengenai kemampuan model GPAI. Pemahaman ini dapat menjadi sangat penting selama negosiasi kontrak dengan penyedia model GPAI.
Konsep Kunci Kode Praktik tentang Hukum Hak Cipta
Penyedia model GPAI berkewajiban untuk menetapkan kebijakan yang memastikan kepatuhan terhadap hukum hak cipta Uni Eropa (Pasal 53 (1) (c) AI Act). Mengingat kebaruan persyaratan ini, panduan praktis tentang struktur dan isi kebijakan tersebut masih kurang. Kode Praktik bertujuan untuk mengatasi kesenjangan ini.
Kode Praktik mengamanatkan bahwa penyedia menerapkan langkah-langkah berikut:
Kebijakan Hak Cipta
Penyedia yang menandatangani Kode Praktik (‘Penandatangan’) diharuskan untuk merumuskan, memelihara, dan menerapkan kebijakan hak cipta yang selaras dengan hukum hak cipta Uni Eropa. Persyaratan ini secara langsung berasal dari AI Act. Penandatangan juga harus memastikan bahwa organisasi mereka mematuhi kebijakan hak cipta ini.
Perbedaan signifikan dari Draf ke-2 adalah bahwa Draf ke-3 tidak lagi mengamanatkan publikasi kebijakan hak cipta. Penandatangan hanya didorong untuk melakukannya. Persyaratan yang dikurangi ini logis, karena AI Act itu sendiri tidak memaksa penyedia model untuk mempublikasikan kebijakan hak cipta mereka.
Perayapan Web Konten yang Dilindungi Hak Cipta
Penandatangan umumnya diizinkan untuk menggunakan perayap web (web crawler) untuk tujuan penambangan teks dan data (text and data mining atau ‘TDM’) untuk mengumpulkan data pelatihan untuk model GPAI mereka. Namun, mereka harus memastikan bahwa perayap ini menghormati teknologi yang dirancang untuk membatasi akses ke materi yang dilindungi hak cipta, seperti paywall.
Selain itu, Penandatangan berkewajiban untuk mengecualikan ‘domain pembajakan,’ yang merupakan sumber online yang terutama terlibat dalam distribusi materi yang melanggar hak cipta.
Perayapan Web dan Mengidentifikasi serta Mematuhi Opt-out TDM
Penandatangan harus memastikan bahwa perayap web mengidentifikasi dan menghormati opt-out TDM yang dinyatakan oleh pemegang hak. Sementara hukum hak cipta Uni Eropa umumnya mengizinkan TDM, pemegang hak tetap memiliki hak untuk memilih keluar (opt-out). Untuk konten web, opt-out ini harus dapat dibaca mesin. Draf ke-3 menguraikan persyaratan untuk perayap web, yang menetapkan bahwa mereka harus mengidentifikasi dan mematuhi protokol robots.txt yang diadopsi secara luas. Selain itu, perayap web harus mematuhi opt-out TDM lain yang relevan dan dapat dibaca mesin, seperti metadata yang ditetapkan sebagai standar industri atau solusi yang umum digunakan oleh pemegang hak.
Penandatangan diharuskan untuk mengambil langkah-langkah yang wajar untuk memberi tahu pemegang hak tentang perayap web yang digunakan dan bagaimana perayap ini menangani arahan robots.txt. Informasi ini dapat disebarluaskan melalui berbagai saluran, seperti umpan web. Khususnya, Draf ke-3 tidak lagi menyertakan kewajiban untuk mempublikasikan informasi ini.
Mengidentifikasi dan Mematuhi Opt-out TDM untuk Konten yang Tidak Dirayapi Web
Penyedia model GPAI juga dapat memperoleh dataset dari pihak ketiga daripada melakukan perayapan web sendiri. Sementara Draf ke-2 mengamanatkan uji tuntas hak cipta dari dataset pihak ketiga, Draf ke-3 mensyaratkan upaya yang wajar untuk memperoleh informasi mengenai apakah perayap web yang digunakan untuk mengumpulkan informasi tersebut mematuhi protokol robots.txt.
Mengurangi Risiko untuk Mencegah Produksi Output yang Melanggar Hak Cipta
Risiko signifikan yang terkait dengan penggunaan AI adalah potensi AI untuk menghasilkan output yang melanggar hak cipta. Ini dapat melibatkan duplikasi kode atau gambar yang ditemukan online yang dilindungi oleh hak cipta.
Penandatangan diharuskan untuk melakukan upaya yang wajar untuk mengurangi risiko ini. Ini merupakan pendekatan yang lebih lunak dibandingkan dengan Draf ke-2, yang menetapkan langkah-langkah untuk menghindari ‘overfitting’. Draf ke-3 mengadopsi sikap yang lebih netral terhadap teknologi, menekankan upaya yang wajar.
Selain itu, Penandatangan harus memasukkan klausul dalam syarat dan ketentuan mereka (atau dokumen serupa) untuk penyedia sistem AI hilir, yang melarang penggunaan model GPAI mereka dengan cara yang melanggar hak cipta.
Menunjuk Titik Kontak
Penandatangan diharuskan untuk menyediakan titik kontak bagi pemegang hak. Mereka juga harus menetapkan mekanisme yang memungkinkan pemegang hak untuk mengajukan keluhan mengenai pelanggaran hak cipta.
Di bawah Draf ke-3, Penandatangan memiliki opsi untuk menolak memproses keluhan yang dianggap tidak berdasar atau berlebihan.
Menggali Lebih Dalam: Pemeriksaan yang Lebih Rinci tentang Ketentuan Hak Cipta
Draf ke-3, meskipun tampak disederhanakan, memperkenalkan nuansa dan pergeseran penekanan yang memerlukan pemeriksaan lebih dekat. Mari kita bedah setiap bagian lebih lanjut:
Kebijakan Hak Cipta: Pergeseran dari Publikasi ke Dorongan
Mandat awal untuk mempublikasikan kebijakan hak cipta, yang ada dalam Draf ke-2, menimbulkan kekhawatiran tentang potensi kerugian kompetitif dan pengungkapan informasi sensitif. Langkah Draf ke-3 untuk mendorong publikasi, daripada mensyaratkannya, mengakui kekhawatiran ini. Perubahan ini memungkinkan penyedia untuk mempertahankan tingkat kerahasiaan tertentu mengenai strategi kepatuhan internal mereka, sambil tetap mempromosikan transparansi. Namun, aspek ‘dorongan’ masih menempatkan tekanan halus pada penyedia untuk terbuka tentang kebijakan mereka, yang berpotensi mengarah pada standar publikasi de facto dari waktu ke waktu.
Perayapan Web: Menyeimbangkan Akuisisi Data dengan Penghormatan Hak Cipta
Izin eksplisit untuk perayapan web, ditambah dengan persyaratan untuk menghormati pembatasan akses seperti paywall, mencerminkan tindakan penyeimbangan yang rumit. AI Act mengakui pentingnya data untuk melatih model AI, tetapi juga menggarisbawahi perlunya menghormati hak-hak pencipta konten. Pengecualian ‘domain pembajakan’ adalah tambahan penting, yang secara eksplisit menargetkan sumber-sumber yang secara aktif terlibat dalam pelanggaran hak cipta. Ketentuan ini memperkuat prinsip bahwa pengembangan AI tidak boleh dibangun di atas dasar kegiatan ilegal.
Opt-out TDM: Spesifisitas Teknis Kepatuhan
Penekanan Draf ke-3 pada protokol robots.txt dan mekanisme opt-out lain yang dapat dibaca mesin menyoroti aspek teknis kepatuhan. Spesifisitas ini memberikan kejelasan bagi penyedia GPAI dan pemegang hak. Bagi penyedia, ini menguraikan langkah-langkah konkret yang harus mereka ambil untuk memastikan perayap mereka menghormati permintaan opt-out. Bagi pemegang hak, ini mengklarifikasi bagaimana mereka dapat secara efektif memberi sinyal preferensi mereka mengenai TDM. Dimasukkannya metadata ‘standar industri’ dan solusi ‘yang diadopsi secara luas’ mengakui bahwa lanskap mekanisme opt-out berkembang dan fleksibilitas diperlukan.
Konten yang Tidak Dirayapi Web: Mengalihkan Tanggung Jawab dan Uji Tuntas
Perubahan dari ‘uji tuntas hak cipta’ menjadi ‘upaya yang wajar untuk memperoleh informasi’ mengenai dataset pihak ketiga merupakan pergeseran tanggung jawab yang halus namun signifikan. Sementara Draf ke-2 menempatkan beban yang lebih berat pada penyedia GPAI untuk secara aktif menyelidiki status hak cipta dataset, Draf ke-3 berfokus pada verifikasi apakah proses pengumpulan data (oleh pihak ketiga) menghormati robots.txt. Ini secara implisit mengakui bahwa penyedia GPAI mungkin tidak selalu memiliki kendali langsung atas praktik akuisisi data pihak ketiga, tetapi mereka masih memiliki tanggung jawab untuk menanyakan tentang kepatuhan.
Mengurangi Output yang Melanggar: Dari ‘Overfitting’ ke ‘Upaya yang Wajar’
Langkah menjauh dari istilah ‘overfitting’ adalah perubahan yang disambut baik. ‘Overfitting’, istilah teknis dalam pembelajaran mesin, mengacu pada model yang berkinerja baik pada data pelatihan tetapi buruk pada data baru. Sementara overfitting dapat berkontribusi pada pelanggaran hak cipta (misalnya, dengan menghafal dan mereproduksi materi yang dilindungi hak cipta), itu bukan satu-satunya penyebab. Fokus Draf ke-3 yang lebih luas pada ‘upaya yang wajar untuk mengurangi risiko’ mencakup berbagai skenario pelanggaran potensial yang lebih luas dan memungkinkan lebih banyak fleksibilitas dalam implementasi. Perubahan ini juga mengakui bahwa pencegahan sempurna pelanggaran hak cipta mungkin tidak dapat dicapai, dan pendekatan berbasis risiko lebih praktis.
Titik Kontak dan Mekanisme Pengaduan: Menyederhanakan Proses
Persyaratan untuk titik kontak yang ditunjuk dan mekanisme pengaduan memberi pemegang hak jalan yang jelas untuk mengatasi potensi pelanggaran hak cipta. Kemampuan Penandatangan untuk menolak keluhan yang ‘tidak berdasar atau berlebihan’ adalah tambahan praktis, mencegah sistem dibanjiri oleh klaim yang tidak berdasar. Ketentuan ini membantu memastikan bahwa mekanisme pengaduan tetap menjadi alat yang layak dan efisien untuk mengatasi masalah hak cipta yang sah.
Implikasi yang Lebih Luas dan Pertimbangan Masa Depan
Draf ke-3 Kode Praktik GPAI merupakan langkah signifikan menuju operasionalisasi ketentuan hak cipta dari AI Act. Ini memberikan kejelasan dan panduan yang sangat dibutuhkan untuk penyedia GPAI, sementara juga berusaha untuk melindungi hak-hak pencipta konten. Namun, beberapa implikasi yang lebih luas dan pertimbangan masa depan tetap ada:
Standar ‘Upaya yang Wajar’: Penggunaan berulang frasa ‘upaya yang wajar’ memperkenalkan tingkat subjektivitas. Apa yang dianggap ‘wajar’ kemungkinan akan tunduk pada interpretasi dan dapat berkembang seiring waktu melalui tantangan hukum dan praktik terbaik industri. Ambiguitas ini dapat menyebabkan ketidakpastian bagi penyedia, tetapi juga memungkinkan fleksibilitas dan adaptasi terhadap konteks yang berbeda.
Peran Penyedia Hilir: Sementara Kode terutama menargetkan penyedia GPAI, penyedia hilir memiliki kepentingan dalam memahami ketentuannya. Kode menetapkan harapan untuk kualitas dan kepatuhan model GPAI, yang dapat menginformasikan negosiasi kontrak dan penilaian risiko. Penyedia hilir juga dapat menghadapi tekanan tidak langsung untuk memastikan bahwa penggunaan model GPAI mereka selaras dengan prinsip-prinsip Kode.
Evolusi Teknologi: Laju perkembangan AI yang cepat berarti bahwa Kode Praktik perlu menjadi dokumen yang hidup. Teknik baru untuk akuisisi data, pelatihan model, dan pembuatan output dapat muncul, yang memerlukan pembaruan pada ketentuan Kode. Referensi ke metadata ‘standar industri’ dan solusi ‘yang diadopsi secara luas’ mengakui kebutuhan akan adaptasi berkelanjutan ini.
Harmonisasi Internasional: EU AI Act adalah undang-undang perintis, tetapi tidak beroperasi dalam ruang hampa. Yurisdiksi lain juga bergulat dengan tantangan mengatur AI. Harmonisasi internasional peraturan AI, termasuk ketentuan hak cipta, akan sangat penting untuk menghindari fragmentasi dan memastikan lapangan permainan yang setara bagi pengembang AI.
Dampak pada Inovasi: Kode Praktik bertujuan untuk mencapai keseimbangan antara mempromosikan inovasi AI dan melindungi hak cipta. Namun, dampak dari peraturan ini pada kecepatan dan arah pengembangan AI masih harus dilihat. Beberapa orang berpendapat bahwa peraturan yang terlalu ketat dapat menghambat inovasi, sementara yang lain berpendapat bahwa aturan yang jelas diperlukan untuk mendorong pengembangan AI yang bertanggung jawab.
Penegakan dan Pemantauan: Bagaimana kepatuhan akan diperiksa? Efektivitas kode akan sangat bergantung pada mekanisme yang diterapkan untuk penegakan dan pemantauan.
Draf ke-3 Kode Praktik GPAI adalah dokumen yang kompleks dan berkembang dengan implikasi yang luas. Ini merupakan upaya signifikan untuk mengatasi tantangan kepatuhan hak cipta di era AI, tetapi ini juga merupakan pekerjaan yang sedang berlangsung. Dialog berkelanjutan antara para pemangku kepentingan, termasuk penyedia GPAI, pemegang hak, pembuat kebijakan, dan komunitas AI yang lebih luas, akan sangat penting untuk memastikan bahwa Kode mencapai tujuan yang dimaksudkan dan tetap relevan dalam menghadapi perubahan teknologi yang cepat.