भारताने कृत्रिम बुद्धिमत्तेच्या क्षेत्रात (Artificial Intelligence) आत्मनिर्भर होण्याच्या दिशेने एक महत्त्वाकांक्षी पाऊल उचलले आहे. बंगळूरुस्थित ‘सार्वम एआय’ (Sarvam AI) या स्टार्टअपला देशाच्या पहिल्या स्वदेशी लार्ज लँग्वेज मॉडेल (Large Language Model - LLM) विकसित करण्याची जबाबदारी देण्यात आली आहे. ‘इंडियाएआय मिशन’ (IndiaAI Mission) अंतर्गत हे कार्य होणार असून, यातून भारताची तंत्रज्ञान क्षेत्रातील आत्मनिर्भरता आणि नागरिकांसाठी एआयचा उपयोग सुनिश्चित केला जाईल.
स्वदेशी एआयची दृष्टी
या उपक्रमाचा मूळ उद्देश असा आहे की, एक स्वदेशी एआय मॉडेल तयार करणे, ज्यात प्रगत विचार क्षमता, उत्कृष्ट संभाषण प्रक्रिया क्षमता आणि भारतीय भाषांमध्ये अस्खलित संवाद साधण्याची क्षमता असेल. हे मॉडेल भारतीय भाषिक आणि सांस्कृतिक वातावरणाशी जोडलेले असेल, जे भारताची ओळख आणि वारसा दर्शवेल.
हे ध्येय साध्य करण्यासाठी सार्वम एआयला 4,086 NVIDIA H100 GPUs सह शक्तिशाली संगणकीय संसाधने सहा महिन्यांसाठी उपलब्ध करून दिली जातील. यामुळे स्टार्टअपला एलएलएमची (LLM) निर्मिती सुरवातीपासून करता येईल, जे भारतीय गरजा आणि आकांक्षा पूर्ण करेल.
तीन विविध प्रकार
या सार्वभौम एलएलएमचे (LLM) तीन मुख्य प्रकार असतील, जे विशिष्ट अनुप्रयोग आणि आवश्यकतांसाठी तयार केले जातील:
सार्वम-लार्ज (Sarvam-Large): हा प्रकार जटिल विचार आणि निर्मिती कार्यांमध्ये उत्कृष्ट असेल, ज्यामुळे गुंतागुंतीच्या समस्या सोडवण्यास आणि प्रभावी सामग्री तयार करण्यास मदत होईल.
सार्वम-स्मॉल (Sarvam-Small): हा प्रकार रिअल-टाइम संवादासाठी (Real-time interactive applications) अनुकूल असेल, ज्यामुळे वापरकर्त्यांना जलद आणि प्रभावी प्रतिसाद मिळेल.
सार्वम-एज (Sarvam-Edge): हा प्रकार डिव्हाइसवर काम करण्यासाठी तयार केला जाईल, ज्यामुळे क्लाउडवर सतत अवलंबून न राहता कमी संसाधनांमध्येही तो सुरळीतपणे कार्य करू शकेल.
सार्वम एआय, आयआयटी मद्रासच्या (IIT Madras) एआय4भारत (AI4Bharat) या उपक्रमासोबत भागीदारी करेल, जेणेकरून मॉडेल भारतीय भाषिक आणि सांस्कृतिक संदर्भांमध्ये रुजलेले असेल. या सहकार्यामुळे एआय4भारतच्या नैसर्गिक भाषा प्रक्रिया (Natural Language Processing) क्षेत्रातील तज्ञांचा आणि भारतीय भाषांच्या समृद्ध डेटाचा उपयोग केला जाईल.
सार्वम एआयचा (Sarvam AI) अनुभव
सार्वम एआयने यापूर्वीच भारतीय एआय क्षेत्रात, विशेषत: बहुभाषिक एआयमध्ये (Multilingual AI) स्वतःची ओळख निर्माण केली आहे. कंपनीच्या नविनतापूर्ण दृष्टिकोन आणि भारतीय संदर्भातील अद्वितीय आव्हानांना सामोरे जाण्याच्या क्षमतेमुळे या महत्त्वाकांक्षी प्रकल्पाचे नेतृत्व करण्यासाठी त्यांची निवड झाली आहे.
ऑक्टोबर 2024 मध्ये, सार्वम एआयने सार्वम-1 (Sarvam-1) लाँच केले, जे 2 अब्ज पॅरामीटर्सचे एलएलएम (LLM) आहे आणि भारतीय भाषांसाठी विशेषतः डिझाइन केलेले आहे. हे मॉडेल बंगाली, गुजराती, हिंदी, कन्नड, मल्याळम, मराठी, ओडिया, पंजाबी, तामिळ आणि तेलगू यांसारख्या दहा प्रमुख भारतीय भाषांना आणि इंग्रजीला सपोर्ट करते.
इतर मॉडेल्सच्या तुलनेत, सार्वम-1 (Sarvam-1) भारतीय लिपींमध्ये (Indic scripts) प्रक्रिया करताना 1.4 ते 2.1 टोकन प्रति शब्द (Token per word) fertility rates साध्य करते. यामुळे प्रक्रिया कार्यक्षमतेत लक्षणीय वाढ होते आणि भारतीय भाषा अधिक जलद आणि अचूकपणे हाताळण्यास मदत होते.
देशांतर्गत प्रशिक्षण आणि पायाभूत सुविधा
सार्वम-1 (Sarvam-1) चे प्रशिक्षण पूर्णपणे भारतात झाले आहे. त्यासाठी NVIDIA H100 Tensor Core GPUs, Yotta data centers आणि AI4Bharat च्या भाषिक संसाधनांचा वापर करण्यात आला. या संपूर्णपणे देशांतर्गत दृष्टिकोनमुळे एआय विकासातील भारताची क्षमता आणि आत्मनिर्भर एआय इकोसिस्टम (AI ecosystem) तयार करण्याची बांधिलकी दिसून येते.
कार्यक्षमतेच्या मानकांमध्ये (Performance benchmarks) असे दिसून आले आहे की सार्वम-1 (Sarvam-1) केवळ मेटाच्या (Meta) Llama 3.1 8B आणि गुगलच्या (Google) Gemma-2-9B यांसारख्या मोठ्या मॉडेल्सशी जुळतेच नाही, तर काही बाबतीत, विशेषतः भारतीय भाषांशी संबंधित कार्यांमध्ये, त्यांना मागे टाकते. हे प्रभावी प्रदर्शन सार्वम एआयच्या (Sarvam AI) दृष्टिकोनाची प्रभावीता आणि जागतिक एआय लीडर्सशी स्पर्धा करण्याची क्षमता दर्शवते.
भारतीय भाषांमधील TriviaQA बेंचमार्कवर (Benchmark), सार्वम-1 (Sarvam-1) ने 86.11 ची अचूकता (Accuracy) गाठली, तर Llama-3.1 8B चा स्कोअर 61.47 होता. या मोठ्या फरकामुळे भारतीय भाषांमधील माहिती समजून घेण्याची आणि त्यावर प्रक्रिया करण्याची सार्वम-1 (Sarvam-1) ची उत्कृष्ट क्षमता दिसून येते.
पुढील आव्हाने
सार्वम एआयने (Sarvam AI) सार्वम-1 (Sarvam-1) द्वारे आपली क्षमता सिद्ध केली असली तरी, पहिले स्वदेशी फाउंडेशन मॉडेल (Indigenous foundation model) तयार करण्याचे कार्य आव्हानांनी भरलेले आहे. या आव्हानांवर मात करण्यासाठी कल्पकता, चिकाटी आणि सहकार्याची भावना आवश्यक आहे.
पायाभूत सुविधा वाढवणे
सर्वात महत्त्वाच्या अडचणींपैकी एक म्हणजे मोठ्या मॉडेल्सना प्रशिक्षण देण्यासाठी पायाभूत सुविधा वाढवणे. या मॉडेल्सना प्रशिक्षण देण्यासाठी मोठ्या प्रमाणात संगणकीय शक्तीची (Computational power) आवश्यकता असते. सरकारने हजारो NVIDIA H100 GPUs उपलब्ध करून देणे हे एक महत्त्वाचे पाऊल आहे, परंतु अशा उच्च-तंत्रज्ञानाच्या संसाधनांचे व्यवस्थापन, अनुकूलन आणि देखभाल करणे हे एक गुंतागुंतीचे काम आहे.
प्रशिक्षण प्रक्रिया कार्यक्षम आणि खर्च-प्रभावी (Cost-effective) आहे याची खात्री करण्यासाठी प्रभावी संसाधन व्यवस्थापन आवश्यक आहे. यात GPUs चा वापर ऑप्टिमाइझ (Optimize) करणे, मेमरी वाटप (Memory allocation) व्यवस्थापित करणे आणि संभाव्य अडचणी कमी करण्यासाठी धोरणे अंमलात आणणे यांचा समावेश असेल.
डेटा क्युरेशन (Data Curation)
आणखी एक महत्त्वपूर्ण आव्हान म्हणजे उच्च-गुणवत्तेचे (High-quality), विविध डेटासेट तयार करणे. भारताची भाषिक विविधता (Linguistic diversity) खूपच गुंतागुंतीची आहे, जिथे केवळ भाषांमध्येच नव्हे, तर बोलीभाषा, संस्कृती आणि लेखनशैलींमध्येही फरक आहेत. ही विविधता संतुलितपणे (Balanced) दर्शवणारा डेटासेट तयार करणे आवश्यक आहे, जो कोणताही bias न ठेवता तयार करणे अत्यंत आवश्यक आहे.
डेटासेट भारतातील विविध प्रदेश, समुदाय आणि सामाजिक गटांचे प्रतिनिधित्व करणारा असावा. तसेच, तो bias पासून मुक्त असावा, ज्यामुळे अन्यायकारक किंवा भेदभावपूर्ण परिणाम टाळता येतील. डेटा निवडताना आणि ऍनोटेट (Annotate) करताना काळजी घेणे आवश्यक आहे, जेणेकरून तो या मानकांची पूर्तता करेल.
भाषिक बारकावे (Linguistic Nuances)
याव्यतिरिक्त, मॉडेल्समध्ये भारतीय भाषांमधील सूक्ष्म बारकावे, जसे की वाक्यप्रचार (Idioms), रूपक (Metaphors) आणि सांस्कृतिक संदर्भ (Cultural references) समजून घेण्याची क्षमता असावी. यासाठी भाषा ज्या सांस्कृतिक संदर्भात वापरली जाते, त्याची सखोल माहिती असणे आवश्यक आहे.
सार्वम एआयचे (Sarvam AI) एआय4भारतसोबतचे (AI4Bharat) सहकार्य ही आव्हाने सोडवण्यासाठी महत्त्वाचे ठरेल. भारतीय भाषांमधील एआय4भारतचे (AI4Bharat) कौशल्य आणि भाषिक संसाधनांचा मोठा साठा सार्वभौम एलएलएमच्या (Sovereign LLM) विकासात मोलाची मदत करेल.
भारतासाठी परिणाम
सार्वभौम एलएलएमचा (Sovereign LLM) विकास भारताच्या तंत्रज्ञान क्षेत्रासाठी आणि जागतिक एआयमध्ये (Global AI) त्याच्या भूमिकेसाठी महत्त्वपूर्ण आहे. या उपक्रमात शिक्षण, आरोग्य, वित्त आणि प्रशासन यांसारख्या विविध क्षेत्रांमध्ये बदल घडवण्याची क्षमता आहे.
आर्थिक विकास (Economic Growth)
नविनतेला प्रोत्साहन देऊन आणि आर्थिक विकासाला चालना देऊन, सार्वभौम एलएलएम (Sovereign LLM) भारतीय व्यवसाय आणि उद्योजकांसाठी नवीन संधी निर्माण करू शकते. स्थानिक भाषांमध्ये माहिती आणि सेवा उपलब्ध करून देऊन डिजिटल दरी (Digital divide) कमी करण्यास मदत करू शकते.
सक्षमीकरण (Empowerment)
एलएलएम (LLM) नागरिकांना वैयक्तिकृत शिक्षण (Personalized education), आरोग्य सेवा आणि इतर आवश्यक सेवांमध्ये प्रवेश देऊन सक्षम बनवू शकते. भाषिक अडथळे दूर करून आणि विविध समुदायांमध्ये संवाद वाढवून सामाजिक समावेशनाला प्रोत्साहन देऊ शकते.
धोरणात्मक स्वातंत्र्य (Strategic Independence)
अखेरीस, सार्वभौम एलएलएमचा (Sovereign LLM) विकास भारतासाठी एक धोरणात्मक गरज आहे. हे राष्ट्राला स्वतःची एआय क्षमता विकसित करण्यास, परदेशी तंत्रज्ञानावरील अवलंबित्व कमी करण्यास आणि त्याचे डिजिटल सार्वभौमत्व (Digital sovereignty) सुनिश्चित करण्यास सक्षम करेल.
सहयोगी इकोसिस्टम (Collaborative Ecosystem)
या महत्त्वाकांक्षी प्रयत्नाचे यश सरकार, उद्योग, शिक्षण आणि स्टार्टअप समुदाय यांना एकत्र आणणाऱ्या सहयोगी इकोसिस्टमवर (Collaborative ecosystem) अवलंबून आहे. एकत्रितपणे कार्य करून, हे भागधारक आपले एकत्रित कौशल्य आणि संसाधने वापरून भारतात नविनता आणू शकतात आणि एआयचा विकास गतिमान करू शकतात.
सार्वम एआयला (Sarvam AI) सरकारचा पाठिंबा आणि संगणकीय संसाधनांमध्ये प्रवेश देण्याची बांधिलकी या इकोसिस्टमला (Ecosystem) सक्षम करणारे महत्त्वाचे घटक आहेत. उद्योगातील भागीदारी वास्तविक जगातील डेटा आणि कौशल्ये प्रदान करू शकतात, तर शैक्षणिक संस्था अत्याधुनिक संशोधन आणि प्रतिभांचे योगदान देऊ शकतात.
एआयद्वारे समर्थित भविष्य (A Future Powered by AI)
भारत याtransformative प्रवासाला सुरुवात करत असताना, राष्ट्र एआयची (AI) प्रचंड क्षमता अनलॉक (Unlock) करण्यासाठी आणि नविनता, सर्वसमावेशकता आणि आत्मनिर्भरतेद्वारे समर्थित भविष्य निर्माण करण्यासाठी सज्ज आहे. सार्वभौम एलएलएमचा (Sovereign LLM) विकास हे भारताच्या महत्त्वाकांक्षेचा आणि कृत्रिम बुद्धिमत्तेच्या युगात आपले भविष्य घडवण्याच्या अटळ बांधिलकीचा पुरावा आहे.