India telah memulakan perjalanan transformatif untuk mewujudkan keupayaan kecerdasan buatan (AI) sendiri yang bebas, mempercayakan Sarvam AI, sebuah syarikat permulaan yang sedang berkembang pesat yang berpangkalan di Bengaluru, dengan peranan penting untuk menerajui pembangunan model bahasa besar (LLM) berdaulat sulung negara di bawah naungan Misi IndiaAI. Usaha bercita-cita tinggi ini menggariskan komitmen India untuk memupuk kebergantungan teknologi dan memanfaatkan kuasa AI untuk manfaat rakyatnya.
Visi untuk AI Peribumi
Inti pati inisiatif ini terletak visi yang mendalam: untuk mencipta model AI yang bukan sahaja peribumi tetapi juga memiliki kebolehan penaakulan lanjutan, keupayaan pemprosesan pertuturan yang canggih, dan kefasihan yang lancar dalam pelbagai bahasa India. Model ini akan berakar umbi dalam landskap linguistik dan budaya India, mencerminkan identiti dan warisan unik negara.
Untuk memudahkan realisasi visi ini, Sarvam AI akan diberikan akses kepada senjata sumber pengkomputeran yang hebat, yang terdiri daripada 4,086 GPU NVIDIA H100, dalam tempoh lebih enam bulan. Akses ini akan memperkasakan syarikat permulaan itu untuk membina LLM dari bawah, menyesuaikannya dengan keperluan dan aspirasi khusus konteks India.
Tiga Varian Berbeza
Pembangunan LLM berdaulat ini akan merangkumi tiga varian berbeza, setiap satunya direka untuk memenuhi set aplikasi dan keperluan tertentu:
Sarvam-Large: Varian ini akan direka untuk cemerlang dalam tugas penaakulan dan penjanaan yang kompleks, membolehkannya menangani masalah yang rumit dan menjana kandungan yang canggih.
Sarvam-Small: Varian ini akan dioptimumkan untuk aplikasi interaktif masa nyata, memastikan interaksi yang pantas dan responsif dengan pengguna dalam pelbagai senario.
Sarvam-Edge: Varian ini akan disesuaikan untuk operasi pada peranti, membolehkannya berfungsi dengan lancar pada peranti yang kekurangan sumber tanpa memerlukan sambungan berterusan ke awan.
Dalam usaha kolaboratif, Sarvam AI akan bekerjasama dengan AI4Bharat, sebuah inisiatif IIT Madras, untuk memastikan model tersebut tertanam secara mendalam dalam konteks linguistik dan budaya India. Kerjasama ini akan memanfaatkan kepakaran AI4Bharat dalam pemprosesan bahasa semula jadi dan repositori sumber bahasa India yang kaya.
Rekod Prestasi Sarvam AI yang Terbukti
Sarvam AI telah membezakan dirinya sebagai pelopor dalam landskap AI India, terutamanya dalam bidang AI berbilang bahasa. Rekod inovasi syarikat dan komitmennya untuk menangani cabaran unik konteks India telah meletakkannya sebagai pilihan semula jadi untuk menerajui projek bercita-cita tinggi ini.
Pada Oktober 2024, Sarvam AI melancarkan Sarvam-1, LLM 2 bilion parameter yang direka dan dioptimumkan khusus untuk bahasa India. Model ini menawarkan sokongan untuk sepuluh bahasa utama India, termasuk Bengali, Gujarati, Hindi, Kannada, Malayalam, Marathi, Odia, Punjabi, Tamil, dan Telugu, sebagai tambahan kepada bahasa Inggeris.
Tidak seperti banyak model sedia ada yang bergelut dengan ketidakcekapan token apabila memproses skrip Indic, Sarvam-1 mencapai kadar kesuburan 1.4 hingga 2.1 token setiap perkataan. Pencapaian yang luar biasa ini meningkatkan kecekapan pemprosesan dengan ketara, membolehkan model mengendalikan bahasa India dengan kelajuan dan ketepatan yang lebih tinggi.
Latihan dan Infrastruktur Domestik
Sarvam-1 dilatih sepenuhnya di India, memanfaatkan infrastruktur AI domestik yang dikuasakan oleh GPU Teras Tensor NVIDIA H100, pusat data Yotta, dan sumber bahasa AI4Bharat. Pendekatan domestik hujung ke hujung ini menggariskan keupayaan India yang semakin meningkat dalam pembangunan AI dan komitmennya untuk membina ekosistem AI yang berdikari.
Penanda aras prestasi telah mendedahkan bahawa Sarvam-1 bukan sahaja sepadan tetapi, dalam beberapa kes, mengatasi model yang lebih besar seperti Llama 3.1 8B Meta dan Gemma-2-9B Google, terutamanya dalam tugas yang melibatkan bahasa Indic. Prestasi yang mengagumkan ini menyoroti keberkesanan pendekatan Sarvam AI dan keupayaannya untuk bersaing dengan pemimpin AI global.
Pada penanda aras TriviaQA merentasi bahasa Indic, Sarvam-1 mencapai ketepatan 86.11, mengatasi skor Llama-3.1 8B sebanyak 61.47. Margin yang ketara ini menunjukkan keupayaan unggul Sarvam-1 dalam memahami dan memproses maklumat dalam bahasa India.
Cabaran Mendepan
Walaupun Sarvam AI telah menunjukkan keupayaannya dengan Sarvam-1, tugas membina model asas peribumi pertama bukanlah tanpa cabarannya. Mengatasi cabaran ini memerlukan kepintaran, ketabahan, dan semangat kolaboratif.
Penskalaan Infrastruktur
Salah satu halangan yang paling ketara ialah meningkatkan infrastruktur untuk memenuhi permintaan latihan model yang besar. Melatih model ini memerlukan akses kepada kuasa pengkomputeran yang besar dalam tempoh yang panjang. Walaupun peruntukan kerajaan beribu-ribu GPU NVIDIA H100 adalah langkah penting ke hadapan, mengurus, mengoptimumkan, dan mengekalkan sumber mewah sedemikian adalah usaha yang kompleks.
Pengurusan sumber yang berkesan adalah penting untuk memastikan proses latihan cekap dan kos efektif. Ini akan melibatkan mengoptimumkan penggunaan GPU, mengurus peruntukan memori, dan melaksanakan strategi untuk mengurangkan potensi kesesakan.
Kurasi Data
Satu lagi cabaran kritikal terletak pada kurasi set data berkualiti tinggi dan pelbagai. Landskap linguistik India sangat kompleks, dengan variasi bukan sahaja antara bahasa tetapi juga dalam dialek, budaya, dan gaya penulisan. Mewujudkan set data yang seimbang yang benar-benar menangkap kepelbagaian ini tanpa memperkenalkan berat sebelah adalah penting tetapi sangat mencabar.
Set data mestilah mewakili pelbagai wilayah, komuniti, dan kumpulan sosial di India. Ia juga mestilah bebas daripada berat sebelah yang boleh membawa kepada hasil yang tidak adil atau diskriminasi. Perhatian yang teliti mesti diberikan kepada pemilihan dan anotasi data untuk memastikan ia memenuhi kriteria ini.
Nuansa Linguistik
Tambahan pula, model mesti dapat menangkap nuansa halus bahasa India, termasuk simpulan bahasa, metafora, dan rujukan budaya. Ini memerlukan pemahaman yang mendalam tentang konteks budaya di mana bahasa ini digunakan.
Kerjasama Sarvam AI dengan AI4Bharat akan memainkan peranan penting dalam menangani cabaran ini. Kepakaran AI4Bharat dalam bahasa India dan aksesnya kepada repositori sumber linguistik yang luas akan memberikan sokongan berharga dalam pembangunan LLM berdaulat.
Implikasi untuk India
Pembangunan LLM berdaulat memegang implikasi yang mendalam untuk landskap teknologi India dan peranannya dalam arena AI global. Inisiatif ini berpotensi untuk mengubah pelbagai sektor, termasuk pendidikan, penjagaan kesihatan, kewangan, dan tadbir urus.
Pertumbuhan Ekonomi
Dengan memupuk inovasi dan memacu pertumbuhan ekonomi, LLM berdaulat boleh mewujudkan peluang baharu untuk perniagaan dan usahawan India. Ia juga boleh membantu merapatkan jurang digital dengan menyediakan akses kepada maklumat dan perkhidmatan dalam bahasa tempatan.
Pemerkasaan
Selain itu, LLM boleh memperkasakan rakyat dengan menyediakan mereka akses kepada pendidikan, penjagaan kesihatan, dan perkhidmatan penting lain yang diperibadikan. Ia juga boleh membantu mempromosikan kemasukan sosial dengan memecahkan halangan bahasa dan memupuk komunikasi antara komuniti yang berbeza.
Kemerdekaan Strategik
Akhirnya, pembangunan LLM berdaulat adalah keutamaan strategik untuk India. Ia akan membolehkan negara membangunkan keupayaan AI sendiri, mengurangkan pergantungannya kepada teknologi asing dan memastikan kedaulatan digitalnya.
Ekosistem Kolaboratif
Kejayaan usaha bercita-cita tinggi ini bergantung pada penciptaan ekosistem kolaboratif yang menghimpunkan kerajaan, industri, ahli akademik, dan komuniti permulaan. Dengan bekerjasama, pihak berkepentingan ini boleh memanfaatkan kepakaran dan sumber kolektif mereka untuk memacu inovasi dan mempercepatkan pembangunan AI di India.
Sokongan kerajaan untuk Sarvam AI dan komitmennya untuk menyediakan akses kepada sumber pengkomputeran adalah pemboleh utama ekosistem ini. Perkongsian industri boleh menyediakan akses kepada data dan kepakaran dunia sebenar, manakala institusi akademik boleh menyumbang penyelidikan dan bakat yang canggih.
Masa Depan yang Dikuasakan oleh AI
Apabila India memulakan perjalanan transformatif ini, negara itu bersedia untuk membuka potensi besar AI dan mencipta masa depan yang dikuasakan oleh inovasi, inklusiviti, dan kebergantungan. Pembangunan LLM berdaulat adalah bukti cita-cita India dan komitmennya yang tidak berbelah bahagi untuk membentuk takdirnya sendiri dalam era kecerdasan buatan.