Kedaulatan Digital: Mengapa India Perlu Bina Model AI Sendiri | ms

Ketika dunia bergelut dengan kemajuan pesat dalam kecerdasan buatan (AI), satu persoalan penting menyelubungi India: Bolehkah negara demokrasi paling ramai penduduk di dunia ini benar-benar mampu menyerahkan masa depan digitalnya kepada sistem AI asing? Dengan kemunculan model transformatif seperti ChatGPT, Google’s Gemini, dan model ekonomi terkini DeepSeek, yang membentuk semula sektor daripada penjagaan kesihatan kepada tadbir urus, ketiadaan India yang ketara daripada barisan hadapan pembangunan Model Bahasa Besar (LLM) adalah lebih daripada jurang teknologi—ia adalah kelemahan strategik.

Keperluan Keselamatan Negara

India, sebuah negara yang menjana lebih 20% daripada data digital dunia—angka yang diunjurkan meningkat kepada 25% menjelang 2026—mendapati dirinya dalam kedudukan yang tidak menentu. Sebahagian besar data ini, apabila melibatkan Model Bahasa Besar (LLM), diproses oleh sistem AI asing. Ini mewujudkan risiko kedaulatan yang ketara yang memerlukan perhatian segera.

Pertimbangkan implikasinya: komunikasi kerajaan yang sensitif, rekod penjagaan kesihatan peribadi, dan transaksi kewangan kritikal semuanya disalurkan melalui model AI asing. Ini mendedahkan India kepada risiko bidang kuasa yang besar. Di bawah undang-undang seperti U.S. CLOUD Act, data yang diproses oleh LLM Amerika boleh tertakluk kepada permintaan undang-undang A.S.

Laporan Strategi Keselamatan Siber Negara pada Februari 2024 secara jelas menggariskan kelemahan ini, menonjolkan bagaimana pergantungan AI mewujudkan “titik pengaruh ketara yang boleh dieksploitasi semasa ketegangan geopolitik.” Ini bukan sekadar kebimbangan teori.

Bezakan ini dengan China, yang secara proaktif menggunakan lebih 50 LLM asli dalam operasi kerajaan. Langkah strategik ini telah menghapuskan pergantungan AI asing dalam sektor sensitif dengan berkesan. Pendekatan China adalah, sebahagiannya, tindak balas kepada sekatan eksport A.S. ke atas cip AI termaju—satu kesukaran yang boleh dihadapi oleh India.

Jurang Linguistik: Penghalang kepada Kemajuan

Keperluan untuk AI tempatan di India mungkin paling dirasai dalam bidang pemprosesan bahasa. Landskap linguistik India ialah permaidani 22 bahasa yang diiktiraf secara rasmi dan lebih 120 dialek utama. Kepelbagaian ini, walaupun merupakan aset budaya, memberikan cabaran unik kepada pembangunan AI.

Ujian penanda aras terkini yang dijalankan oleh AI4Bharat telah mendedahkan realiti yang ketara: LLM global terkemuka mempamerkan penurunan prestasi 30-40% apabila memproses bahasa India berbanding English. Untuk bahasa seperti Assam, Maithili, dan Dogri, prestasinya menjunam di bawah ambang boleh guna.

Isu terasnya ialah model AI asing sering kekurangan pemahaman mendalam tentang konteks budaya dan nuansa linguistik yang wujud dalam bahasa India. Ini mewujudkan jurang digital, yang secara berkesan menurunkan penutur bukan English—sebahagian besar penduduk India—kepada status kelas kedua dalam era AI yang semakin berkembang.

Penemuan Perpustakaan Digital Negara menggambarkan lagi perbezaan ini. Alat pembelajaran bantuan AI menunjukkan kadar penggunaan 78% lebih rendah di wilayah yang tidak berbahasa English disebabkan oleh halangan bahasa ini.

Kedaulatan Ekonomi: Ancaman yang Menjelang

Kesan ekonomi daripada pergantungan AI adalah sama mendalam. Ekonomi digital India, bernilai $200 bilion pada 2023, diunjurkan melonjak kepada $800 bilion menjelang 2030. Walau bagaimanapun, sebahagian besar nilai ekonomi yang dijana daripada aplikasi AI kini mengalir kepada penyedia teknologi asing.

Pada tahun 2023 sahaja, perniagaan India membelanjakan kira-kira ₹3,700 crore untuk perkhidmatan API AI asing. Unjuran NASSCOM menganggarkan angka ini akan melonjak kepada ₹17,500 crore menjelang 2026. Syarikat AI asing kini menguasai 94% daripada pasaran AI perusahaan India.

Pengalaman negara lain menawarkan titik balas yang menarik. Negara yang mempunyai model AI tempatan telah menyaksikan kadar pembentukan syarikat permulaan AI 3-4 kali lebih tinggi. Ekosistem syarikat permulaan AI India, bernilai $3.5 bilion pada 2023, berpotensi mencecah $16 bilion menjelang 2027 dengan pembangunan model asas asli.

Usaha dan Halangan Semasa

Walaupun beberapa inisiatif yang menjanjikan sedang dijalankan di India, ia sering ketinggalan di belakang pemimpin global:

Indic-LLMs AI4Bharat: Model ini menunjukkan prestasi yang kukuh dalam bahasa India tetapi masih ketinggalan dalam keupayaan penaakulan.
Projek Sajag C-DAC: Projek bercita-cita tinggi ini bertujuan untuk membangunkan model 100 bilion parameter menjelang 2026.
Inisiatif Korporat: Syarikat seperti Reliance Jio (dengan BharatGPT) dan Tata (dengan Projek Indus) sedang mencapai kemajuan, tetapi usaha ini masih di peringkat awal.

Cabaran dan Hala Tuju Kerajaan

Walaupun mendapat sokongan kerajaan yang kuat, pembangunan LLM asli di India menghadapi halangan yang ketara. Kapasiti pengkomputeran berprestasi tinggi negara kini berada pada kira-kira 6.4 petaflops. Ini mewakili kurang daripada 2% daripada apa yang diperlukan untuk melatih model AI yang kompetitif.

Peruntukan kerajaan sebanyak ₹7,500 crore untuk AI dalam belanjawan 2024-25, walaupun merupakan langkah positif, tidak setanding dengan $10-25 bilion yang dilaburkan oleh firma AI global setiap tahun dalam pembangunan model.

Satu lagi cabaran penting terletak pada ketersediaan set data berkualiti tinggi dan beranotasi, terutamanya dalam bahasa serantau. Set data ini adalah penting untuk melatih model AI yang kompetitif. Tambahan pula, India menghadapi jurang bakat dalam penyelidikan AI asas dan latihan model berskala besar.

Untuk menangani cabaran pelbagai aspek ini, kerajaan telah melancarkan beberapa inisiatif:

AI Kosha: Inisiatif ini bertujuan untuk menyokong penyelidikan LLM.
18,000 GPU Dikongsi: Ini menyediakan infrastruktur pengkomputeran yang penting.
Bhashini: Projek ini memberi tumpuan kepada pembangunan model bahasa berkuasa AI.
Semicon India dan Misi Supercomputing: Program ini direka untuk meningkatkan keupayaan perkakasan AI.

Syarikat korporat utama India, termasuk Reliance Jio, TCS, dan Infosys, juga melabur secara besar-besaran dalam penyelidikan AI untuk mempercepatkan kemajuan negara dalam pembangunan LLM.

Harga Ketidakaktifan: Amaran Keras

Akibat daripada kegagalan untuk memupuk keupayaan LLM asli melangkaui pergantungan teknologi semata-mata.

Menjelang 2030, AI diunjurkan menjana nilai ekonomi yang mengejutkan $450-500 bilion di India. Tanpa model asli, sebahagian besar nilai ini akan mengalir kepada penyedia teknologi asing.

Walau bagaimanapun, kebimbangan yang lebih mendesak ialah fenomena yang disebut oleh penyelidik sebagai “penjajahan algoritma.” Ini merujuk kepada pengaruh sistem AI asing yang semakin meningkat ke atas ekosistem maklumat, naratif budaya dan proses membuat keputusan India.

Ketika negara lain secara agresif meneruskan pembangunan AI, India mendapati dirinya berada di persimpangan kritikal. Pembangunan LLM asli bukan sekadar aspirasi teknologi; ia adalah satu keperluan strategik untuk melindungi kedaulatan India dan menjamin masa depannya dalam era digital. Ia adalah mengenai memastikan kepelbagaian linguistik dan budaya unik India bukan sahaja dipelihara tetapi juga diperkasakan oleh AI. Ia adalah mengenai memupuk pertumbuhan ekonomi yang memberi manfaat kepada perniagaan dan rakyat India. Dan, akhirnya, ia adalah mengenai mengekalkan kawalan ke atas takdir digital India. Laluan ke hadapan memerlukan pelaburan yang berterusan, kerjasama antara kerajaan, industri dan akademia, dan tumpuan yang tidak henti-henti terhadap inovasi. Taruhannya terlalu tinggi untuk diabaikan.

Pembangunan LLM asli adalah penting untuk:

Melindungi Keselamatan Negara: Mengurangkan pergantungan pada sistem AI asing mengurangkan risiko yang berkaitan dengan bidang kuasa data dan potensi eksploitasi semasa ketegangan geopolitik.
Merapatkan Jurang Bahasa: Mencipta model AI yang memahami dan memproses bahasa India memastikan keterangkuman dan akses saksama kepada teknologi berkuasa AI untuk semua rakyat.
Menjamin Pertumbuhan Ekonomi: Membangunkan industri AI domestik memupuk inovasi, mewujudkan pekerjaan, dan menghalang aliran keluar nilai ekonomi kepada penyedia teknologi asing.
Menentang Penjajahan Algoritma: Mengekalkan kawalan ke atas sistem AI memastikan ekosistem maklumat, naratif budaya dan proses membuat keputusan India tidak dipengaruhi secara tidak wajar oleh entiti asing.
Memupuk Inovasi: Model AI tempatan boleh disesuaikan dengan keperluan dan konteks khusus India, yang membawa kepada penyelesaian yang lebih berkesan dan relevan.
Privasi Data: Memastikan data sensitif rakyat dan perniagaan India kekal di dalam negara dan dikawal oleh undang-undang India.
Mengukuhkan Autonomi Strategik: Dengan mengurangkan pergantungan pada teknologi asing, India boleh menegaskan kedudukannya sebagai peneraju global dalam era digital.
Meningkatkan Daya Saing: Syarikat India yang mempunyai akses kepada model AI asli boleh bersaing dengan lebih berkesan dalam pasaran global.
Menggalakkan Penyelidikan dan Pembangunan: Melabur dalam pembangunan LLM merangsang penyelidikan dan inovasi dalam bidang berkaitan, seperti sains komputer, linguistik dan analitik data.
Memperkasakan Digital India: LLM asli ialah asas inisiatif Digital India, memacu transformasi digital merentasi pelbagai sektor.

Keperluan masa kini ialah usaha nasional yang bersepadu dan kolaboratif, yang menghimpunkan minda terbaik daripada akademia, industri dan kerajaan. Ini bukan sekadar kemajuan teknologi; ia adalah mengenai penentuan nasib sendiri negara pada abad ke-21. Masa depan India dalam era digital bergantung pada keupayaannya untuk memanfaatkan kuasa AI mengikut syaratnya sendiri. Masanya untuk bertindak adalah sekarang. Pilihannya jelas: terima pembangunan AI asli atau berisiko menjadi jajahan digital dalam susunan dunia baharu. India mesti memilih yang pertama, mencatatkan laluan ke arah masa depan di mana kedaulatan digitalnya terjamin, kepelbagaian linguistiknya diraikan, dan kemakmuran ekonominya ditentukan sendiri.

dikemaskinikan pada 2025-03-15

# AI # LLM # AIGC