Peluang Malaysia: Revolusi AI Sumber Terbuka China | ms

Era model bahasa besar (LLM) DeepSeek R1 pada awal tahun ini menandakan satu titik perubahan transformatif bagi kecerdasan buatan generatif (Gen AI). Peristiwa ini merupakan lonjakan yang ketara, bukan sahaja dari sudut teknologi, tetapi juga dari sudut komersial dan strategik. DeepSeek menunjukkan bahawa LLM yang canggih boleh dibangunkan pada kos yang jauh lebih rendah daripada yang dipercayai sebelum ini, dan yang paling penting, inovasi ini tidak terhad kepada Silicon Valley.

Kemunculan DeepSeek memberikan implikasi yang mendalam untuk ekosistem AI Malaysia, melangkaui persaingan teknologi yang berterusan antara AS dan China, serta penyejukan sementara semangat pusat data pasaran saham Malaysia.

Kepentingan Sumber Terbuka

Aspek utama LLM DeepSeek ialah asasnya dalam teknologi sumber terbuka. Model seperti DeepSeek R1 tersedia di bawah lesen sumber terbuka atau berat terbuka, yang bermaksud ia boleh dimuat turun, diubah suai dan digunakan secara percuma. Sifat sumber terbuka ini mempunyai implikasi yang besar untuk evolusi dan pengkomersialan LLM.

Selama bertahun-tahun, gergasi teknologi China seperti Baidu, Alibaba, dan Tencent telah secara aktif membangunkan model AI sumber terbuka. Strategi ini, yang disokong oleh universiti dan inisiatif kerajaan China, menggunakan pendekatan “inovasi terbuka”, yang bertujuan untuk mempercepatkan penyelidikan dan pembangunan, dan berpotensi mengatasi Amerika Syarikat dalam keupayaan AI.

Walau bagaimanapun, komitmen kepada AI sumber terbuka melangkaui China. Meta dan Google juga telah mengeluarkan LLM berat terbuka, didorong oleh faktor persaingan. Rasional di sebalik ini berakar umbi dalam strategi perniagaan "mengkomoditikan pelengkap". Jika sesebuah syarikat sangat bergantung pada Gen AI, ia mungkin lebih bermanfaat untuk melabur dalam alternatif sumber terbuka daripada hanya bergantung pada model proprietari seperti ChatGPT. Walaupun LLM proprietari masih digunakan, ketersediaan model sumber terbuka yang baik melemahkan kuasa penetapan harga vendor utama seperti OpenAI.

Strategi ini mencerminkan tindakan yang diambil oleh Oracle, pengeluar pelayan dan peralatan rangkaian. Oracle menyokong sistem pengendalian Linux sumber terbuka untuk membendung penguasaan harga OS Windows Microsoft.

Tanpa mengira motivasi, ketersediaan LLM berat terbuka berkualiti tinggi mengurangkan kos dengan ketara untuk negara seperti Malaysia, membuka pintu baharu untuk inovasi.

Manfaat untuk Kerajaan dan Perniagaan

Bagi kerajaan Malaysia, LLM sumber terbuka menawarkan peluang untuk mengendalikan model AI mereka sendiri tanpa perlu memindahkan data sensitif kepada pihak ketiga komersial atau negara asing. Ini mengukuhkan autonomi dan kedaulatan data.

Bagi syarikat Malaysia, terutamanya syarikat permulaan, LLM berat terbuka mewujudkan persaingan yang adil. Mereka boleh mengakses LLM asas yang sama dengan rakan sejawatan mereka di China dan AS, memupuk inovasi dan persaingan.

Menangani Bias Budaya dan Politik

Kebangkitan AI China juga menyoroti cabaran yang ketara: bias budaya dan politik. LLM Cina sering dilatih untuk mencerminkan naratif sejarah dan perspektif politik Parti Komunis China (PKC), mematuhi norma penapisan di tanah besar China.

Walaupun tanpa penapisan yang jelas, model AI secara semula jadi membawa bias yang terdapat dalam data latihan mereka. Jika dilatih terutamanya pada teks Inggeris, model akan mencerminkan sudut pandangan dan bias budaya Barat.

Berita baiknya ialah LLM boleh dilatih semula dengan agak mudah. Sama seperti LLM Cina menerima rel panduan untuk menggalakkan kesetiaan PKC, projek sumber terbuka yang lain telah menunjukkan bahawa DeepSeek R1 boleh dilatih selepas itu untuk mengurangkan bias yang dirasakan.

Penyetempatan dan Kepekaan Budaya

Pengalaman ini menekankan keperluan bagi negara seperti Malaysia untuk membangunkan keupayaan mereka sendiri untuk menyetempatkan, melatih, dan melatih semula LLM untuk disesuaikan dengan keadaan tempatan. Model yang tidak mengambil kira sensitiviti kaum dan agama Malaysia, hierarki sosial, atau bahasa slanga tempatan boleh kurang berprestasi atau menghasilkan kandungan yang berbahaya.

Malaysia sudah pun mempunyai beberapa keupayaan pembangunan LLM. Sebagai contoh, syarikat permulaan tempatan Mesolitica mengeluarkan LLM MaLLaM sumber terbuka pada bulan Januari, menunjukkan pemahaman Bahasa Malaysia yang lebih bernuansa daripada LLM arus perdana seperti ChatGPT.

Walau bagaimanapun, kesedaran di kalangan pembuat dasar Malaysia mengenai potensi AI sumber terbuka, dan kepentingan pembangunan LLM tempatan, masih tidak jelas.

Strategi AI Nasional

Pelan Hala Tuju AI Nasional, yang dirangka pada tahun 2021, hanya sedikit menyebut tentang sumber terbuka. Begitu juga, dokumen baru-baru ini dari Pejabat AI Nasional (NAIO) yang baharu juga tidak menekankan AI sumber terbuka.

Walaupun meramalkan masa depan pembangunan AI kekal mencabar, sifat sumber terbuka generasi LLM semasa memberikan Malaysia peluang yang luar biasa untuk mengejar pemimpin teknologi.

Merebut Peluang

Untuk memanfaatkannya, Malaysia perlu mengemas kini dasarnya untuk menampung kemunculan LLM yang lebih kecil dan lebih berpatutan. Ini termasuk memudahkan penggunaan model ini, menjadikan Gen AI lebih mudah diakses oleh perusahaan kecil dan sederhana, dan membolehkan penggunaan tempatan, terutamanya di kawasan luar bandar dengan akses internet yang terhad.

Meluaskan kapasiti Malaysia untuk membangunkan LLM, menjadikannya lebih relevan dengan bahasa tempatan dan mengambil kira budaya tempatan, adalah penting. Melabur dalam latihan LLM, yang berpotensi berlabuh di universiti tempatan, boleh dianggap sebagai kebaikan awam, memupuk bakat tempatan dan memacu penyelidikan dan pembangunan tempatan.

Autonomi Data dan Keselamatan Negara

Mengehoskan LLM sendiri adalah penting untuk memastikan autonomi data negara. Data yang dikumpul oleh LLM boleh menjadi berharga, dan bukannya dieksploitasi oleh entiti asing, maklumat ini harus disimpan dan digunakan oleh organisasi tempatan.

Berikut ialah pecahan yang lebih terperinci tentang bagaimana Malaysia secara khusus boleh memanfaatkan pergerakan AI sumber terbuka:

Kemas Kini Dasar: Dasar sedia ada harus disemak dan dikemas kini untuk mencerminkan landskap AI semasa, dengan tumpuan khusus pada peluang dan faedah LLM sumber terbuka. Ini termasuk menyelaraskan peraturan untuk penggunaan data (sambil mengekalkan perlindungan privasi yang sesuai), menyediakan pembiayaan dan insentif untuk penyelidikan dan pembangunan AI sumber terbuka, dan menggalakkan penggunaan penyelesaian AI sumber terbuka di seluruh sektor kerajaan.
Pelaburan dalam Pembangunan Bakat: Membina tenaga kerja mahir adalah penting. Malaysia perlu melabur dalam program pendidikan dan inisiatif latihan yang memfokuskan pada AI, pembelajaran mesin, dan pemprosesan bahasa semula jadi. Program ini harus menekankan alat dan teknologi sumber terbuka, memastikan graduan dilengkapi dengan baik untuk menyumbang kepada ekosistem AI tempatan. Biasiswa, geran penyelidikan, dan perkongsian industri boleh terus menggalakkan pelajar untuk meneruskan kerjaya dalam AI.
Penyelidikan Dipimpin Universiti: Universiti tempatan harus berada di barisan hadapan dalam penyelidikan dan pembangunan AI. Kerajaan boleh menyediakan pembiayaan untuk menubuhkan pusat penyelidikan AI di universiti, memfokuskan pada bidang seperti penyesuaian LLM, penyesuaian budaya, dan pembangunan alat AI sumber terbuka baharu yang disesuaikan dengan keperluan khusus Malaysia. Penciptaan platform kerjasama antara universiti dan industri boleh mempercepatkan pemindahan pengetahuan dan teknologi.
Sokongan untuk Syarikat Permulaan dan PKS: AI sumber terbuka menawarkan peluang yang ketara untuk syarikat permulaan dan PKS untuk berinovasi dan bersaing. Malaysia harus menyediakan sokongan yang disasarkan kepada perniagaan ini, termasuk akses kepada pembiayaan, bimbingan, dan kepakaran teknikal. Sokongan ini boleh termasuk geran untuk membangunkan produk dan perkhidmatan berkuasa AI, inkubator dan pemecut yang memfokuskan pada AI, dan program yang menghubungkan syarikat permulaan dengan bakal pelanggan dan pelabur.
Rangka Kerja Tadbir Urus Data: Mewujudkan rangka kerja tadbir urus data yang teguh adalah penting untuk memastikan penggunaan AI yang bertanggungjawab dan beretika. Rangka kerja ini harus menangani isu seperti privasi data, keselamatan, dan bias, dan harus selaras dengan amalan terbaik antarabangsa. Ia juga harus menggalakkan perkongsian data dalam ekosistem AI, sambil melindungi maklumat sensitif. Ini boleh dicapai melalui penciptaan repositori data negara dan penubuhan garis panduan yang jelas untuk akses dan penggunaan data.
Perkongsian Awam-Swasta: Kerjasama antara sektor awam dan swasta adalah kritikal untuk memacu inovasi AI. Kerajaan boleh bekerjasama dengan syarikat swasta untuk membangunkan dan menggunakan penyelesaian AI dalam bidang seperti penjagaan kesihatan, pendidikan, dan pengangkutan. Perkongsian ini boleh memanfaatkan kepakaran dan sumber kedua-dua sektor, yang membawa kepada hasil yang lebih berkesan dan berimpak.
Infrastruktur AI Nasional: Melabur dalam infrastruktur AI nasional, termasuk sumber pengkomputeran berprestasi tinggi dan kemudahan penyimpanan data, adalah penting untuk menyokong penyelidikan dan pembangunan AI. Infrastruktur ini harus boleh diakses oleh penyelidik, syarikat permulaan, dan perniagaan di seluruh negara, menyediakan mereka dengan alat yang mereka perlukan untuk berinovasi dan bersaing.
Penyesuaian Budaya LLM: Malaysia harus melabur dalam projek yang memfokuskan pada menyesuaikan LLM sumber terbuka untuk mencerminkan landskap budaya dan linguistik unik negara. Ini termasuk membangunkan model yang fasih dalam Bahasa Malaysia dan bahasa tempatan yang lain, dan yang sensitif terhadap budaya dan tradisi Malaysia yang pelbagai. Ini memerlukan pendekatan pelbagai disiplin yang melibatkan ahli bahasa, pakar budaya, dan jurutera AI.
Pertimbangan Keselamatan Siber: Apabila AI menjadi lebih bersepadu ke dalam infrastruktur kritikal, keselamatan siber mesti menjadi keutamaan utama. Malaysia perlu melabur dalam penyelidikan dan pembangunan penyelesaian keselamatan siber khusus AI, dan untuk mewujudkan garis panduan yang jelas untuk mendapatkan sistem AI. Ini termasuk membangunkan mekanisme yang teguh untuk mengesan dan mengurangkan ancaman berkaitan AI.
Mempromosikan AI Beretika: Memastikan AI dibangunkan dan digunakan secara beretika dan bertanggungjawab adalah penting. Malaysia harus mewujudkan rangka kerja etika AI negara, yang menggariskan prinsip dan nilai yang harus membimbing pembangunan dan penggunaan AI. Rangka kerja ini harus menangani isu seperti keadilan, ketelusan, dan akauntabiliti.

Dengan mengambil langkah proaktif ini, Malaysia boleh memanfaatkan kuasa AI sumber terbuka untuk memacu pertumbuhan ekonomi, meningkatkan perkhidmatan awam, dan menangani beberapa cabaran yang paling mendesak di negara ini. Jendela peluang terbuka, dan Malaysia mesti bertindak secara tegas untuk merebutnya. Komitmen untuk memupuk ekosistem AI yang kukuh, inklusif, dan beretika akan menjadi kritikal untuk merealisasikan potensi penuh teknologi transformatif ini. Tumpuan harus sentiasa pada pemerkasaan, inovasi, dan pembangunan mampan jangka panjang.

dikemaskinikan pada 2025-05-13

# AI # LLM # Fine-Tuning