Dari Jaipur ke DeepSeek: Seruan AI Terbuka | ms

Festival Sastera, Pendedahan AI

Beberapa minggu yang lalu, Festival Sastera Jaipur (JLF) yang meriah di India menjadi forum yang tidak dijangka untuk perbincangan penting tentang masa depan kecerdasan buatan (AI). Semasa panel yang kononnya memfokuskan pada warisan empayar, perbualan itu berubah secara mendadak. Penonton, yang terpikat dengan ‘From the Ruins of Empire: The Revolt Against the West and the Remaking of Asia’ karya Pankaj Mishra, mengemukakan satu siri soalan yang tajam, bukan tentang kesusasteraan, tetapi tentang DeepSeek, model AI generatif baharu dari China.

Soalan-soalan ini – Bagaimana kita sampai ke tahap ini? Bagaimana kita merangka laluan terbaik untuk masa depan AI? Mengapa sumber terbuka penting dalam pembangunan AI? – bergema jauh melangkaui kawasan festival. Ia menyentuh persaingan sejarah yang mendalam, kerinduan untuk berdikari, dan gerakan global yang semakin meningkat yang menyokong pendekatan yang lebih terbuka dan kolaboratif untuk pembangunan AI.

Akar Sejarah Penerimaan DeepSeek

Kemunculan DeepSeek di festival sastera mungkin kelihatan aneh. Walau bagaimanapun, keunggulannya sangat berkait rapat dengan peristiwa sejarah dan persaingan yang berpanjangan, terutamanya antara Asia dan Barat. Walaupun makmal AI Eropah telah mendapat pujian atas kejayaan sumber terbuka mereka, penerimaan DeepSeek di Asia membawa resonans sejarah yang jauh lebih mendalam.

Pelancaran DeepSeek disambut dengan liputan media yang meluas. Penerimaannya di JLF mendedahkan sentimen yang melangkaui perbincangan semata-mata tentang prestasi AI. Penulis dan wartawan India, yang sering mengkritik China, mendapati diri mereka disatukan oleh perjuangan bersama menentang penguasaan American AI Corporations (AICs). Semangat untuk DeepSeek di seluruh Asia ini berakar umbi dalam sejarah penjajahan dan, baru-baru ini, dalam kenyataan korporat yang provokatif.

AI: Perjuangan Moden untuk Berdikari

Bagi Stephen Platt, pengarang ‘Imperial Twilight: The Opium War and The End of China’s Last Golden Age,’ cita-cita teknologi China tidak dapat dipisahkan daripada parut sejarahnya. Perang Candu (1839–1860) berfungsi sebagai simbol kuat bagaimana keunggulan teknologi dan ketenteraan Britain memalukan China. ‘Abad Penghinaan’ ini menyemarakkan usaha China untuk berdikari, pelaburan agresifnya dalam AI, semikonduktor, dan teknologi kritikal lain. Ia adalah keazaman untuk mengelakkan pergantungan kepada teknologi Barat, satu pengajaran yang terukir dalam kesedaran negara.

Panelis India di JLF mendapati persamaan dalam naratif ini. Seperti China, India menanggung kesan gelap pengaruh Syarikat Hindia Timur. Tambahan pula, wartawan British Anita Anand menyerlahkan video kontroversi Ketua Pegawai Eksekutif OpenAI Sam Altman yang menolak potensi India untuk bersaing dengan AIC dalam melatih model asas, dengan menyatakan ia adalah ‘totally hopeless’. Kenyataan sedemikian hanya menguatkan azam untuk berdikari di rantau ini.

AI Sumber Terbuka: Simbol Penentangan

DeepSeek, dan makmal Eropah yang mendahuluinya, telah menawarkan harapan dalam perlumbaan AI. Pilihan mereka untuk menerima sumber terbuka telah menjadi simbol penentangan yang kuat terhadap penguasaan model AI proprietari.

Keluaran DeepSeek R1 mesti difahami dalam konteks persaingan yang mendalam, terutamanya dengan Amerika Syarikat. Persaingan ini sangat mendalam sehingga Eropah sering diabaikan dalam perbincangan persaingan dengan teknologi AS.

Penguasaan AIC malah telah mencetuskan perbandingan dengan kolonialisme di Barat. Dalam op-ed Ogos 2024 bertajuk ‘The Rise of Techno-Colonialism,’ Hermann Hauser, ahli Majlis Inovasi Eropah, dan Hazem Danny Nakib, Penyelidik Kanan di University College London (UCL), menulis: ‘Tidak seperti kolonialisme lama, tekno-kolonialisme bukan tentang merampas wilayah tetapi tentang mengawal teknologi yang menyokong ekonomi dunia dan kehidupan seharian kita. Untuk mencapai matlamat ini, AS dan China semakin meningkatkan segmen rantaian bekalan global yang paling inovatif dan kompleks, dengan itu mewujudkan titik sempit strategik.’

Pendekatan sumber terbuka perintis makmal AI Eropah seperti Mistral, kyutai, dan pasukan FAIR Paris Meta, dan kini DeepSeek, telah membentangkan alternatif yang menarik kepada strategi model AI proprietari AIC. Sumbangan sumber terbuka ini bergema di seluruh dunia dan telah mengukuhkan lagi penerimaan AI sumber terbuka sebagai simbol penentangan terhadap penguasaan AI Amerika.

Hujah untuk Sumber Terbuka: Sejarah Berima

Kerjasama teknologi berkembang pesat dengan tenaga dan kepantasan, sesuatu yang wujud dalam evolusi kod perisian.

Pemenang Nobel Ekonomi Perancis Jean Tirole, yang pada mulanya bingung dengan kemunculan sumber terbuka, mempersoalkan dalam kertas kerjanya pada tahun 2000 bersama Josh Lerner, ‘The Simple Economics of Open Source’: ‘Mengapa beribu-ribu pengaturcara terkemuka menyumbang secara percuma kepada penyediaan barangan awam? Sebarang penjelasan berdasarkan altruisme hanya setakat ini.’

Walaupun boleh difahami pada masa itu, sesiapa sahaja yang mengikuti kemajuan AI dalam beberapa tahun kebelakangan ini, terutamanya selepas keluaran DeepSeek R1, akan mendapati jawapannya jelas. Kesan FAIR Paris di Meta’s open-sourcing of Llama, kebangkitan pesat Mistral dan pengasasnya melalui sumber terbuka model pembelajaran bahasa (LLM) 7B, dan DeepSeek R1 menunjukkan sebab-sebab menarik di sebalik dedikasi pengaturcara dan saintis ini kepada sumber terbuka.

Ia juga menjelaskan mengapa Sam Altman dan pengasas bersamanya memilih nama ‘OpenAI’ untuk menarik bakat. Adakah mana-mana makmal sempadan ini akan mencapai publisiti yang begitu hebat dan membina jenama peribadi yang begitu kukuh dalam komuniti AI sekiranya mereka memilih pendekatan proprietari? Jawapannya adalah tidak.

Dua petikan berkuasa dari tahun 1999, oleh pengaturcara Richard Stallman dan pembangun Eric Raymond, masing-masing, yang disertakan pada permulaan kertas kerja, menerangkan penerimaan DeepSeek di JLF dan menggariskan kuasa ideologi yang lebih mendalam yang sedang dimainkan:

‘Idea bahawa sistem sosial perisian proprietari—sistem yang mengatakan anda tidak dibenarkan berkongsi atau menukar perisian—adalah tidak sosial, bahawa ia tidak beretika, bahawa ia adalah salah mungkin mengejutkan sesetengah orang. Tetapi apa lagi yang boleh kita katakan tentang sistem yang berasaskan membahagikan orang ramai dan memastikan pengguna tidak berdaya?’ - Richard Stallman
‘Fungsi utiliti penggodam Linux sedang memaksimumkan bukanlah ekonomi klasik, tetapi adalah kepuasan ego mereka sendiri dan reputasi di kalangan penggodam lain. … Budaya sukarela yang berfungsi dengan cara ini sebenarnya tidak luar biasa; satu lagi yang saya telah lama sertai ialah peminat fiksyen sains, yang tidak seperti hackerdom secara jelas mengiktiraf egoboo (peningkatan reputasi seseorang di kalangan peminat lain).’ - Eric Raymond

Trajektori Unix pada tahun 1970-an dan 1980-an menyediakan analogi yang menarik untuk keadaan AI semasa. Promosi awal AT&T dan pengedaran percuma Unix dalam akademik memupuk inovasi dan penerimaan. Walau bagaimanapun, apabila AT&T mengenakan lesen proprietari pada akhir 1970-an, ia tidak dapat dielakkan membawa Universiti Berkeley untuk melancarkan BSD Unix, alternatif terbuka, dan akhirnya Linus Torvalds untuk mencipta Linux. Pembangunan Linux oleh Torvalds di Eropah mengalihkan pusat perisian sumber terbuka dari AS.

Persamaannya adalah ketara, malah secara geografi, dengan evolusi AI. Walau bagaimanapun, kali ini, geografi baharu telah muncul: TII Abu Dhabi dengan Model Falconnya, DeepSeek China, Qwen Alibaba, dan baru-baru ini, Makmal AI Krutrim India dengan model sumber terbukanya untuk bahasa Indic.

Pasukan Meta FAIR Paris, bersama-sama dengan makmal AI Eropah terkemuka dan makmal sempadan yang lebih baharu (DeepSeek, Falcon, Qwen, Krutrim), telah mempercepatkan inovasi AI dengan ketara. Dengan berkongsi kertas penyelidikan dan kod secara terbuka, mereka telah:

Melatih generasi baharu jurutera dan penyelidik AI dalam teknik AI yang canggih.
Mencipta ekosistem kerjasama terbuka, membolehkan kemajuan pesat di luar makmal AI proprietari.
Menyediakan model AI alternatif, memastikan AI tidak dimonopoli oleh American AI Corporations.

Empat ekosistem ini (Eropah, India, Abu Dhabi, dan China) boleh membentuk pakatan AI sumber terbuka yang kuat untuk mencabar AIC dominan yang masih beroperasi di bawah pemikiran AI proprietari.

Dalam soal jawab (AMA) pada 31 Januari 2025, berikutan keluaran DeepSeek R1, Altman mengakui bahawa pendekatan model AI proprietari telah berada di pihak yang salah dalam sejarah.

Pada masanya, makmal AI di seluruh dunia mungkin memilih untuk menyertai pakatan ini untuk memajukan bidang ini secara kolektif. Ini bukan kali pertama bidang saintifik melangkaui sempadan dan ideologi politik melalui inisiatif bukan untung. Ia menawarkan mod persaingan yang mengelakkan pencetus rungutan anti-penjajah yang sering dinyatakan oleh Global South.

Preseden Sejarah: Projek Genom Manusia sebagai Model untuk AI

Sebagai ahli biologi, saya amat menyedari pencapaian Projek Genom Manusia (HGP) dan bagaimana ia akhirnya mengatasi inisiatif untuk keuntungan Celera Genomics, memberi manfaat kepada bidang dan manusia secara keseluruhan.

HGP ialah inisiatif penyelidikan antarabangsa yang memetakan dan menjujukan keseluruhan genom manusia. Selesai pada tahun 2003 selepas 13 tahun kerjasama, ia telah menjana hampir $800 bilion dalam impak ekonomi daripada pelaburan $3 bilion, menurut laporan 2011 yang dikemas kini pada 2013 (pulangan pelaburan kepada ekonomi AS sebanyak 141 kepada satu – setiap $1 pelaburan HGP persekutuan telah menyumbang kepada penjanaan $141 dalam ekonomi). Ia telah merevolusikan perubatan, bioteknologi, dan genetik, membolehkan kemajuan dalam perubatan peribadi, pencegahan penyakit, dan penyelidikan genomik. Kerja penjujukan dan penyelidikan telah dijalankan oleh 20 makmal di enam negara: AS, UK, Perancis, Jerman, Jepun, dan China.

Walaupun Celera Genomics cuba menjujukan jujukan genomik untuk keuntungan, HGP mengutamakan perkongsian data terbuka, yang termaktub dalam Prinsip Bermudanya. Ditubuhkan semasa Mesyuarat Strategi Antarabangsa mengenai Penjujukan Genom Manusia di Bermuda pada Februari 1996, prinsip-prinsip ini adalah penting dalam membentuk dasar perkongsian data untuk HGP dan mempunyai kesan yang berkekalan terhadap amalan penyelidikan genomik di seluruh dunia. Prinsip utamanya ialah:

Pelepasan Data Segera: Semua data jujukan genom manusia yang dijana oleh HGP akan dikeluarkan ke dalam pangkalan data awam, sebaik-baiknya dalam masa 24 jam selepas penjanaan. Penyebaran pantas ini bertujuan untuk mempercepatkan penemuan saintifik dan memaksimumkan faedah masyarakat.
Akses Percuma dan Tidak Terhad: Data itu akan disediakan secara percuma kepada komuniti saintifik global dan orang ramai, tanpa sekatan ke atas penggunaannya untuk tujuan penyelidikan atau pembangunan.
Pencegahan Tuntutan Harta Intelek: Peserta bersetuju bahawa tiada hak harta intelek akan dituntut ke atas data jujukan genomik utama, mempromosikan etos sains terbuka dan mencegah potensi halangan kepada penyelidikan akibat pempatenan.

Dari segi tadbir urus, HGP ialah inisiatif saintifik yang kolaboratif dan diselaraskan, bukan organisasi atau perbadanan yang berdiri sendiri. Ia adalah usaha terpencar yang dibiayai melalui geran dan kontrak kerajaan kepada pelbagai institusi penyelidikan. Sebahagian daripada bajetnya (3–5%) didedikasikan untuk mengkaji dan menangani kebimbangan etika, undang-undang dan sosial yang berkaitan dengan penjujukan genom manusia.

Merapatkan Keselamatan AI dan AI Sumber Terbuka

Satu lagi kelebihan penting AI sumber terbuka ialah peranannya dalam penyelidikan keselamatan AI.

Sidang Kemuncak AI Seoul pada tahun 2024 memfokuskan secara eksklusif pada risiko kewujudan pada masa AIC memegang kelebihan yang ketara berbanding seluruh dunia. Sehingga Mei 2024, bekas Ketua Pegawai Eksekutif Google Eric Schmidt mendakwa AS mendahului China 2–3 tahun dalam AI, manakala Eropah terlalu sibuk dengan peraturan untuk menjadi relevan. Sekiranya Sidang Kemuncak itu berjaya, ia akan menyerahkan kawalan keputusan keselamatan AI kepada syarikat-syarikat ini. Nasib baik, ia tidak.

Memandangkan AI sumber terbuka kini merapatkan jurang teknologi, perbincangan keselamatan tidak lagi akan ditentukan semata-mata oleh segelintir pemain dominan. Sebaliknya, kumpulan pemegang kepentingan yang lebih luas dan lebih pelbagai – termasuk penyelidik, penggubal dasar, dan makmal AI dari Eropah, India, China, dan Abu Dhabi – mempunyai peluang untuk membentuk perbincangan bersama AIC.

Tambahan pula, AI sumber terbuka meningkatkan keupayaan pencegahan global, memastikan tiada pelakon tunggal boleh memonopoli atau menyalahgunakan sistem AI lanjutan tanpa akauntabiliti. Pendekatan terpencar untuk keselamatan AI ini akan membantu mengurangkan potensi ancaman kewujudan dengan mengagihkan kedua-dua keupayaan dan pengawasan dengan lebih saksama merentasi ekosistem AI global.

Projek AI Manusia dengan Prinsip Paris

Apakah peranan yang boleh dimainkan oleh Sidang Kemuncak Tindakan AI di Paris minggu depan dalam membentuk masa depan AI?

Ini membentangkan peluang penting untuk menubuhkan Projek AI Manusia, yang dimodelkan selepas Projek Genom Manusia, untuk memajukan dan menyokong pembangunan AI sumber terbuka pada skala global. Sumbangan sumber terbuka semasa, daripada makmal AI Eropah perintis kepada DeepSeek, sudah mempercepatkan bidang ini dan membantu merapatkan jurang dengan AIC.

Keupayaan AI dipertingkatkan dengan ketara oleh kematangan ekosistem sumber terbuka am, dengan beribu-ribu projek matang, model tadbir urus khusus, dan penyepaduan mendalam ke dalam perusahaan, akademik dan kerajaan.

Ekosistem sumber terbuka AI juga mendapat manfaat daripada platform seperti Github dan Gitlab. Baru-baru ini, platform khusus untuk AI sumber terbuka, seperti Hugging Face – sebuah syarikat AS yang diasaskan bersama oleh tiga usahawan Perancis – telah mula memainkan peranan penting sebagai platform pengedaran untuk komuniti.

Memandangkan kematangan relatif ekosistem AI sumber terbuka berbanding dengan penjujukan genom manusia pada awal 1990-an, bagaimanakah AI sumber terbuka boleh mendapat manfaat daripada Projek AI Manusia?

Sebagai permulaan, Kesatuan Eropah sering dikritik oleh AIC dan Makmal AI sempadannya sendiri kerana peraturannya mengenai sumber terbuka. Projek AI Manusia boleh mendedikasikan usaha bersama untuk membangunkan penjajaran dan piawaian kawal selia merentasi negara dan wilayah yang mengambil bahagian. Pendekatan yang diselaraskan, dengan sumbangan awal dari Eropah, India, Abu Dhabi, dan China, boleh memudahkan penyebaran model sumber terbuka merentasi rantau kawal selia yang dikongsi ini (sejenis kawasan perdagangan bebas untuk sumber terbuka).

Walaupun tidak terbukti secara muktamad, terdapat persamaan dengan dinamik yang didorong oleh persaingan yang membentuk reaksi terhadap DeepSeek di JLF. Begitu juga, peraturan AI boleh direka dengan tumpuan untuk memupuk inovasi dan memaksimumkan faedah awam – kedua-duanya untuk perusahaan dan pengguna – dan bukannya berfungsi sebagai mekanisme yang berpotensi untuk menghalang kemajuan AIC atau menghalang juara AI tempatan yang berusaha untuk merapatkan jurang.

Projek itu juga boleh memudahkan pertukaran bakat dan membiayai infrastruktur pengiraan yang dikongsi (dipautkan kepada infrastruktur tenaga) untuk AI sumber terbuka. Jelas daripada carta di bawah bahawa graduan STEM yang berbakat di sesetengah bahagian dunia mungkin sedang bergelut untuk mengakses infrastruktur AI bertaraf dunia yang tidak dimiliki oleh negara mereka.

Satu lagi bidang kerjasama ialah mewujudkan amalan terbaik mengenai piawaian akses terbuka untuk model dan set data, merangkumi pemberat, kod dan dokumentasi.

Projek itu juga boleh memupuk kerjasama global mengenai Penyelidikan Keselamatan AI. Daripada berlumba secara rahsia untuk membetulkan isu penjajaran, penyelidik dari Paris ke Beijing ke Bangalore boleh bekerjasama untuk menilai model dan mengurangkan risiko. Semua penemuan keselamatan (cth., kaedah untuk mengurangkan output berbahaya atau alat untuk kebolehterjemahan) boleh dikongsi dengan segera dalam domain terbuka.

Prinsip ini akan mengiktiraf bahawa keselamatan AI adalah barangan awam global – kejayaan dalam satu makmal (katakan, algoritma baharu untuk menjadikan penaakulan AI telus) sepatutnya memberi manfaat kepada semua, bukan disimpan secara proprietari. Penanda aras keselamatan bersama dan acara cabaran boleh dianjurkan untuk menggalakkan budaya tanggungjawab kolektif. Dengan mengumpulkan penyelidikan keselamatan, projek itu akan bertujuan untuk kekal mendahului potensi penyalahgunaan atau kemalangan AI, meyakinkan orang ramai bahawa sistem AI yang berkuasa sedang diuruskan dengan berhati-hati.

Tumpuan pada risiko kewujudan pada Sidang Kemuncak Keselamatan AI UK 2023 di Bletchley Park, dengan terlalu menekankan analogi Percambahan Nuklear, terlepas peluang untuk mengkaji bidang lain di mana keselamatan dianggap sebagai barangan awam: keselamatan siber, antibiotik dan imunologi (dengan beberapa inisiatif menarik selepas Covid-19), dan keselamatan penerbangan.

Projek itu juga boleh bekerjasama dengan dan meneruskan kerja yang sedang dijalankan oleh Yayasan Hadiah ARC swasta untuk memupuk pembangunan sistem AI yang selamat dan maju. Hadiah ARC, yang diasaskan bersama oleh François Chollet, pencipta perpustakaan sumber terbuka Keras, dan Mike Knoop, pengasas bersama syarikat perisian Zapier, ialah organisasi bukan untung yang menganjurkan pertandingan awam untuk memajukan penyelidikan kecerdasan am buatan (AGI). Acara utama mereka, pertandingan Hadiah ARC, menawarkan lebih $1 juta kepada peserta yang boleh membangunkan dan penyelesaian sumber terbuka kepada penanda aras ARC-AGI – ujian yang direka untuk menilai keupayaan sistem AI untuk menjana dan memperoleh kemahiran baharu dengan cekap.

Penekanan Yayasan Hadiah ARC pada penyelesaian sumber terbuka dan pertandingan awam sejajar dengan matlamat Projek AI Manusia untuk memupuk kerjasama dan ketelusan antarabangsa dalam pembangunan AI, seperti yang dinyatakan di laman web Yayasan Hadiah ARC di bawah ‘AGI’:

‘LLM dilatih pada jumlah data yang tidak dapat dibayangkan, namun masih tidak dapat menyesuaikan diri dengan masalah mudah yang belum dilatih, atau membuat ciptaan baharu, tidak kira betapa asasnya. Insentif pasaran yang kukuh telah mendorong penyelidikan AI sempadan untuk menjadi sumber tertutup. Perhatian dan sumber penyelidikan sedang ditarik ke arah jalan buntu. Hadiah ARC direka untuk memberi inspirasi kepada penyelidik untuk menemui pendekatan teknikal baharu yang mendorong kemajuan AGI terbuka ke hadapan.’

Seperti HGP, Projek AI Manusia akan mendedikasikan sebahagian daripada pembiayaannya kepada tadbir urus dan pengawasan etika. Ini termasuk perbincangan tentang hak cipta. Projek ini boleh membantu masyarakat mempertimbangkan etika mengakses sumber maklumat terbaik dalam latihan secara percuma sambil membangunkan model proprietari di atasnya. Dalam ruang biologi, diketahui bahawa Bank Data Protein, yang penting untuk model AlphaFold Google DeepMind untuk meramalkan struktur protein, mungkin memerlukan pembiayaan yang setara dengan $10 bilion dalam tempoh 50 tahun. Projek ini boleh membantu dalam memikirkan cara kita terus membiayai pembangunan AI atau cara AIC proprietari harus berkongsi hasil dengan pencipta karya asal.

Bersama-sama, Prinsip Paris ini dan Projek AI Manusia akan membantu memajukan AI di peringkat global dengan cara yang lebih terbuka, kolaboratif dan beretika. Mereka akan membina pencapaian penyumbang sumber terbuka terkemuka dari Eropah ke Timur Tengah, India, dan kini China, dalam rangka kerja dan platform perisian sumber terbuka dan khusus AI sedia ada.

Sejarah Berima dengan AI

Peluang di hadapan kita adalah sangat besar. Mistral AI, kyutai, BFL, Stability, dan baru-baru ini DeepSeek telah memberi harapan kepada orang ramai bahawa masa depan di mana kerjasama menyaingi atau bahkan mengatasi AIC proprietari adalah mungkin.

Kita masih di peringkat awal kejayaan teknologi ini. Kita harus berterima kasih atas sumbangan yang telah diberikan oleh AIC kepada bidang ini. Sidang Kemuncak Tindakan AI sepatutnya menjadi peluang untuk memupuk inovasi koperasi pada skala yang belum pernah terjadi sebelumnya dan membawa seramai mungkin pemain ke pihak yang betul dalam sejarah.

Ia adalah 1789 sekali lagi. Kita sedang menyaksikan perjuangan untuk kedaulatan teknologi, desentralisasi kuasa, dan seruan untuk AI sebagai barangan awam. Dan sama seperti pada tahun 1789, revolusi ini tidak akan dapat dibendung.

dikemaskinikan pada 2025-03-03

# LLM # AGI # DeepSeek