सर्वम AI का उन्नत LLM, मेटा और गूगल को टक्कर | hi

Sarvam AI, बेंगलुरु स्थित एक नवोन्मेषी स्टार्टअप, भारत सरकार के प्रतिष्ठित IndiaAI Mission के तहत अपने चयन से प्रेरित होकर AI परिदृश्य में एक अग्रणी के रूप में उभरा है। कंपनी ने हाल ही में अपने फ्लैगशिप Large Language Model (LLM) को लॉन्च किया है, जिसका नाम Sarvam-M है, जो भारतीय संदर्भ में AI क्षमताओं में एक महत्वपूर्ण छलांग है।

यह 24-अरब-पैरामीटर बहुभाषी LLM, Sarvam AI की AI प्रौद्योगिकी की सीमाओं को आगे बढ़ाने की प्रतिबद्धता का प्रमाण है। फ्रांसीसी AI पावरहाउस Mistral AI द्वारा विकसित एक ओपन-वेट AI मॉडल, Mistral Small की नींव पर निर्मित, Sarvam-M एक हाइब्रिड-तर्क दृष्टिकोण को शामिल करता है, जो इसे पाठ-आधारित कार्यों की एक विस्तृत श्रृंखला में उत्कृष्टता प्राप्त करने में सक्षम बनाता है।

Sarvam-M का डिज़ाइन विभिन्न प्रकार के उपयोग के मामलों को पूरा करने के लिए सावधानीपूर्वक तैयार किया गया है, जो विभिन्न उद्योगों में एक मूल्यवान उपकरण के रूप में अपनी बहुमुखी प्रतिभा स्थापित करता है। परिष्कृत संवादी एजेंटों को शक्ति प्रदान करने से जो प्राकृतिक और संदर्भ-जागरूक संवादों में संलग्न हो सकते हैं, सहज अनुवाद सेवाओं प्रदान करने के लिए जो भाषाई विभाजनों को पाटते हैं, Sarvam-M संचार और सूचना पहुंच में क्रांति लाने के लिए तैयार है।

इसके अलावा, मॉडल की क्षमता शिक्षा के क्षेत्र तक फैली हुई है, जहां यह एक गतिशील शैक्षिक उपकरण के रूप में काम कर सकता है, व्यक्तिगत शिक्षण अनुभव प्रदान कर सकता है और जटिल विषयों की गहरी समझ को बढ़ावा दे सकता है। यह अनुकूलन क्षमता Sarvam-M को AI की परिवर्तनकारी शक्ति का दोहन करने के इच्छुक व्यक्तियों और संगठनों दोनों के लिए एक शक्तिशाली संपत्ति बनाती है।

प्रदर्शन

Sarvam-M ने कई प्रमुख क्षेत्रों में असाधारण कौशल का प्रदर्शन किया है, जिससे भारतीय भाषाओं, गणितीय तर्क और प्रोग्रामिंग कार्यों में नए प्रदर्शन बेंचमार्क स्थापित किए गए हैं। ये उपलब्धियां भारतीय बाजार की विशिष्ट आवश्यकताओं और चुनौतियों को पूरा करने की मॉडल की क्षमता को रेखांकित करती हैं।

भारतीय भाषाओं, गणित और प्रोग्रामिंग में उत्कृष्टता

AI मॉडल भारतीय भाषा बेंचमार्क पर अपने बेस मॉडल पर 20% औसत सुधार को प्रदर्शित करता है, जो इन भाषाओं में इसकी उन्नत समझ और प्रवाह को उजागर करता है। यह वृद्धि विविध भाषाई संदर्भों में अधिक सटीक और सूक्ष्म संचार सुनिश्चित करती है।

गणितीय समस्या-समाधान के क्षेत्र में, Sarvam-M गणित से संबंधित कार्यों पर 21.6% की पर्याप्त वृद्धि प्रदर्शित करता है, जिससे यह बढ़ी हुई सटीकता और दक्षता के साथ जटिल समीकरणों और तार्किक तर्क चुनौतियों का सामना करने में सक्षम होता है। यह सुविधा Sarvam-M को विभिन्न वैज्ञानिक और इंजीनियरिंग अनुप्रयोगों के लिए एक मूल्यवान उपकरण बनाती है।

इसके अलावा, मॉडल कोडिंग बेंचमार्क में 17.6% का उल्लेखनीय सुधार दिखाता है, जो स्वच्छ, कुशल और त्रुटि-रहित कोड उत्पन्न करने की अपनी क्षमता का प्रदर्शन करता है। यह क्षमता Sarvam-M को सॉफ्टवेयर डेवलपर्स और प्रोग्रामर के लिए एक मूल्यवान संसाधन के रूप में स्थान देती है जो अपने वर्कफ़्लो को स्वचालित और सुव्यवस्थित करना चाहते हैं।

भारतीय भाषाओं और गणित के चौराहे पर, Sarvam-M रोमानाइज्ड इंडियन भाषा GSM-8K बेंचमार्क में +86% का प्रभावशाली सुधार प्राप्त करता है। यह उपलब्धि विभिन्न भाषाई और गणितीय डोमेन के बीच के अंतर को पाटने की मॉडल की क्षमता को उजागर करती है, जो समस्या-समाधान के लिए एक व्यापक और एकीकृत दृष्टिकोण प्रदान करती है।

Sarvam-M की रिलीज, Sarvam AI के नए भाषण मॉडल Bulbul के लॉन्च के बाद हुई है, जिसमें प्रामाणिक भारतीय लहजे हैं। यह आगे भारतीय बाजार की बारीकियों के प्रति सांस्कृतिक रूप से प्रासंगिक और अनुकूलित AI समाधान बनाने के लिए कंपनी के समर्पण को दर्शाता है।

तुलना

Sarvam AI ने विश्वासपूर्वक दावा किया है कि Sarvam-M अधिकांश बेंचमार्क पर Meta के LLaMA-4 Scout से बेहतर प्रदर्शन करता है। कंपनी का यह भी दावा है कि मॉडल का प्रदर्शन LLaMA-3 70B और Google के Gemma 3 27B जैसे काफी हद तक बड़े सघन मॉडलों के बराबर है। यह ध्यान देने योग्य है क्योंकि इन मॉडलों को काफी अधिक टोकन पर प्री-ट्रेन किया गया है।

सर्वम-एम: LLaMA-4 स्काउट को चुनौती और बड़े मॉडलों के बराबर

Sarvam-M की कम पैरामीटर के साथ इन बड़े मॉडलों के समान प्रदर्शन स्तर प्राप्त करने की क्षमता इसकी कुशल वास्तुकला और अनुकूलित प्रशिक्षण विधियों का प्रमाण है। यह छोटे, अधिक चुस्त मॉडलों की बड़ी, अधिक संसाधन-गहन समकक्षों के साथ प्रभावी ढंग से प्रतिस्पर्धा करने की क्षमता को रेखांकित करता है।

हालाँकि, कंपनी स्वीकार करती है कि "अंग्रेजी में ज्ञान-संबंधित बेंचमार्क" में सुधार की गुंजाइश है, जहां Sarvam-M बेसलाइन मॉडल MMLU से लगभग 1% अंक गिर जाता है। यह एक ऐसा क्षेत्र है जिसे Sarvam AI सक्रिय रूप से संबोधित करने के लिए काम कर रहा है, मॉडल के समग्र प्रदर्शन और बहुमुखी प्रतिभा को और बढ़ा रहा है।

Sarvam-M ओपन सोर्स है और AI समुदाय प्लेटफॉर्म Hugging Face पर मुफ्त में उपलब्ध है। डेवलपर्स जो इसे अपने उत्पादों में एकीकृत करना चाहते हैं, उनके लिए APIs उपलब्ध हैं। यह पहुंच डेवलपर्स के लिए मॉडल का उपयोग करना और नवीन अनुप्रयोगों का पता लगाना आसान बनाती है।

विशेषताएं

Sarvam-M एक बहुमुखी मॉडल है जिसे उन्नत इंडिक कौशल के साथ डिज़ाइन किया गया है। मॉडल आसानी से "थिंक" और "नॉन-थिंक" दोनों मोड का समर्थन करता है, जो विभिन्न कार्य आवश्यकताओं के अनुकूल है।

सर्वम-एम: उन्नत इंडिक कौशल वाला एक बहुमुखी AI मॉडल

"थिंक" मोड जटिल तार्किक तर्क, गणितीय समस्याओं और कोडिंग कार्यों के लिए है। यह मॉडल को जटिल समस्याओं का विश्लेषण करने और हल करने में सक्षम बनाता है जिनके लिए गहन संज्ञानात्मक प्रसंस्करण की आवश्यकता होती है।

"नॉन-थिंक" मोड कुशल सामान्य-उद्देश्यीय बातचीत के लिए है। यह मॉडल को अधिक आराम से और सहज संवादों में संलग्न होने की अनुमति देता है जिसके लिए विश्लेषणात्मक कठोरता के समान स्तर की आवश्यकता नहीं होती है।

मॉडल को विशेष रूप से अंग्रेजी के साथ भारतीय भाषाओं पर पोस्ट-ट्रेन किया गया है, जो प्रामाणिक रूप से भारतीय सांस्कृतिक मूल्यों को दर्शाता है। यह सुनिश्चित करता है कि मॉडल विविध सांस्कृतिक संदर्भों में प्रभावी ढंग से और सम्मानपूर्वक संवाद कर सकता है।

यह इंडिक लिपियों के साथ-साथ भारतीय भाषाओं के रोमानाइज्ड संस्करणों के लिए पूर्ण समर्थन भी प्रदान करता है। यह सुविधा भारतीय बाजार की विशिष्ट आवश्यकताओं को पूरा करने के लिए मॉडल की क्षमता को और बढ़ाती है।

पर अपडेट किया गया २०२५-०५-२७

# LLM # Fine-Tuning # Sarvam AI