अलीबाबा के Qwen3 से AI ऐप्स की नई लहर

AI का परिदृश्य लगातार विकसित हो रहा है, नई मॉडलों और प्रगति के साथ तेजी से उभर रहा है। हाल के विकासों में, अलीबाबा की अगली पीढ़ी के Tongyi Qianwen मॉडल, Qwen3 की ओपन-सोर्स रिलीज ने महत्वपूर्ण ध्यान आकर्षित किया है। एक छोटे पैरामीटर आकार, कम लागत और अन्य प्रमुख मॉडलों की तुलना में बेहतर प्रदर्शन के साथ, Qwen3 ने खुद को वैश्विक AI क्षेत्र में एक मजबूत दावेदार के रूप में स्थापित किया है।

Qwen3 चीन में एक अग्रणी हाइब्रिड रीजनिंग मॉडल के रूप में खड़ा है, जो बेहतर प्रदर्शन और कम लागत का एक आकर्षक संयोजन प्रदान करता है। कुल 235 बिलियन पैरामीटर के साथ, इसे समान क्षमताओं वाले अन्य मॉडलों की तुलना में तैनात करने के लिए काफी कम संसाधनों की आवश्यकता होती है। यह लागत-प्रभावशीलता Qwen3 को उन संगठनों के लिए एक आकर्षक विकल्प बनाती है जो बड़े भाषा मॉडलों की शक्ति का लाभ उठाना चाहते हैं बिना बैंक को तोड़े।

AI एजेंटों और अनुप्रयोगों को सशक्त बनाना

Qwen3 की प्रमुख विशेषताओं में से एक AI एजेंटों और बड़े भाषा मॉडल अनुप्रयोगों के विकास और तैनाती को तेज करने की इसकी क्षमता है। मॉडल एजेंट क्षमताओं के मूल्यांकन में, Qwen3 ने अन्य शीर्ष-स्तरीय मॉडलों को पार करते हुए प्रभावशाली स्कोर प्राप्त किए हैं। इससे पता चलता है कि Qwen3 AI एजेंटों को विकसित और तैनात करने के लिए प्रवेश की बाधा को कम कर सकता है, जिससे संभावित रूप से नवीन अनुप्रयोगों में वृद्धि हो सकती है।

AI एजेंटों में उपकरण-कॉलिंग क्षमताओं की बढ़ती मांग

AI एजेंटों का उपयोग तेजी से जटिल कार्यों को स्वचालित करने और वास्तविक दुनिया के साथ बातचीत करने के लिए किया जा रहा है। एक AI एजेंट के लिए आवश्यक क्षमताएं उन कार्यों की जटिलता और स्वायत्तता पर निर्भर करती हैं जिन्हें वह करने के लिए डिज़ाइन किया गया है।

एक मजबूत AI एजेंट सिस्टम को आमतौर पर अंतर्निहित मॉडल से निम्नलिखित क्षमताओं की आवश्यकता होती है:

  • बुनियादी भाषा समझ और पीढ़ी: निर्देशों की सटीक व्याख्या करने, संदर्भ को समझने और प्राकृतिक भाषा प्रतिक्रियाएं उत्पन्न करने की क्षमता।

  • उपकरण का उपयोग और कॉलिंग: विशिष्ट कार्यों को पूरा करने के लिए API सहित बाहरी उपकरणों को समझने और उपयोग करने की क्षमता।

  • तर्क और योजना: जटिल लक्ष्यों को छोटे उप-कार्यों में तोड़ने और उन्हें तार्किक क्रम में निष्पादित करने की क्षमता।

Qwen3 AI एजेंटों में बेहतर उपकरण-कॉलिंग क्षमताओं की महत्वपूर्ण आवश्यकता को संबोधित करता है। यह सोच और गैर-सोच दोनों मोड में सटीकता के साथ बाहरी उपकरणों को एकीकृत कर सकता है, जिससे यह जटिल एजेंट-आधारित कार्यों के लिए एक अग्रणी ओपन-सोर्स मॉडल बन जाता है।

मॉडल एजेंट क्षमताओं के मूल्यांकन में, Qwen3 ने उच्च स्कोर प्राप्त किया है, जो अन्य शीर्ष-स्तरीय मॉडलों को पार करता है। यह AI एजेंटों को विकसित और तैनात करने के लिए प्रवेश में महत्वपूर्ण कमी का प्रतीक है।

Qwen3 मूल रूप से MCP प्रोटोकॉल का समर्थन करता है और इसमें मजबूत उपकरण-कॉलिंग क्षमताएं हैं। Qwen-Agent ढांचे के साथ संयुक्त, जो उपकरण-कॉलिंग टेम्पलेट्स और पार्सर को समाहित करता है, यह विकास प्रक्रिया को सरल करता है और मोबाइल और कंप्यूटर उपकरणों पर कुशल एजेंट संचालन को सक्षम बनाता है। डेवलपर्स MCP कॉन्फ़िगरेशन फ़ाइलों के आधार पर उपलब्ध उपकरण को परिभाषित कर सकते हैं और उन्हें Qwen-Agent ढांचे या अन्य कस्टम उपकरणों का उपयोग करके एकीकृत कर सकते हैं। यह ज्ञान आधार और उपकरण-उपयोग क्षमताओं के साथ बुद्धिमान एजेंटों के तेजी से विकास की अनुमति देता है।

इसके अलावा, Qwen3 बुनियादी भाषा समझ और पीढ़ी के साथ-साथ तर्क क्षमताओं में भी मजबूत प्रदर्शन प्रदर्शित करता है।

इसका मतलब है कि, समकक्ष मॉडल क्षमताओं के साथ, एजेंटों और AI अनुप्रयोग उद्योग के लिए मॉडल को कॉल करने की लागत कम है, और कॉलिंग अधिक सुविधाजनक है, जो अनिवार्य रूप से अधिक नए एजेंटों और AI अनुप्रयोगों के उदय को बढ़ावा देगा।

ओपन सोर्स के लिए प्रतिबद्धता

अलीबाबा ने Qwen3 मॉडल की एक विविध श्रृंखला की पेशकश करके ओपन-सोर्स समुदाय के प्रति अपनी प्रतिबद्धता की पुष्टि की है। इसमें 30 बिलियन और 235 बिलियन पैरामीटर वाले दो मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल, साथ ही विभिन्न आकारों वाले छह सघन मॉडल शामिल हैं।

30 बिलियन पैरामीटर MoE मॉडल एक महत्वपूर्ण प्रदर्शन को बढ़ावा देता है, जो पिछली पीढ़ी के Qwen2.5-32B मॉडल के समान प्रदर्शन प्रदान करता है। सघन मॉडल भी बेहतर प्रदर्शन प्रदर्शित करते हैं, यहां तक कि छोटे मॉडल भी प्रभावशाली परिणाम प्राप्त करते हैं।

क्योंकि सभी Qwen3 मॉडल हाइब्रिड रीजनिंग मॉडल हैं, API को आवश्यकतानुसार ‘सोच बजट’ (यानी, गहन सोच के लिए अपेक्षित टोकन की अधिकतम संख्या) सेट करने के लिए स्थापित किया जा सकता है ताकि विभिन्न डिग्री की सोच प्रदर्शन की जा सके और AI अनुप्रयोगों की विविध आवश्यकताओं और प्रदर्शन और लागत के लिए विभिन्न परिदृश्यों को लचीला रूप से पूरा किया जा सके। छोटे और मध्यम आकार के उद्यम और AI डेवलपर अपनी आवश्यकताओं के अनुसार लचीले ढंग से मॉडल चुन सकते हैं, जो अनिवार्य रूप से बड़े मॉडलों का उपयोग करने की सीमा और लागत को कम कर देगा। बहुत सीमित धन और कर्मियों वाली ये टीमें बाजार और उपयोगकर्ता की जरूरतों और दर्द बिंदुओं की खुदाई में अधिक संसाधन और ऊर्जा लगा सकती हैं ताकि वे अधिक नवीन एप्लिकेशन विकसित कर सकें।

अलीबाबा की तकनीकी नींव

16 वर्षों के विकास के बाद, अलीबाबा ने अंतर्निहित हार्डवेयर से लेकर कंप्यूटिंग, स्टोरेज, नेटवर्क, डेटा प्रोसेसिंग, मॉडल प्रशिक्षण और तर्क प्लेटफॉर्म तक एक पूर्ण-स्टैक प्रौद्योगिकी आर्किटेक्चर सिस्टम का व्यापक रूप से पुनर्निर्माण किया है, जिससे यह एशिया-प्रशांत क्षेत्र में अग्रणी क्लाउड कंप्यूटिंग प्लेटफॉर्म बन गया है। अलीबाबा दुनिया की पहली प्रौद्योगिकी कंपनियों में से एक है जिसने बड़े मॉडल अनुसंधान में निवेश किया है।

पहले, झोउ जिंग्रेन ने मीडिया के साथ एक साक्षात्कार में कहा था कि बड़े मॉडलों का विकास क्लाउड सिस्टम के समर्थन से अविभाज्य है। चाहे वह प्रशिक्षण हो या तर्क, बड़े मॉडलों में हर सफलता, सतह पर, मॉडल क्षमताओं का विकास है, लेकिन इसके पीछे पूरे क्लाउड कंप्यूटिंग और डेटा और इंजीनियरिंग प्लेटफॉर्म का व्यापक सहयोग और उन्नयन है। मल्टीमोडलिटी भी AGI का एक महत्वपूर्ण तरीका है।

अंतर्राष्ट्रीय मान्यता

Qwen3 की रिलीज ने वैश्विक स्तर पर ध्यान आकर्षित किया है। अलीबाबा के Qwen 3 की रिलीज के बाद, एलोन मस्क ने सोशल मीडिया प्लेटफॉर्म X पर कहा कि Grok 3.5 का एक प्रारंभिक बीटा संस्करण अगले सप्ताह SuperGrok ग्राहकों के लिए जारी किया जाएगा, जिसमें दावा किया गया है कि यह पहला AI है जो रॉकेट इंजन या इलेक्ट्रोकेमिकल तकनीक के बारे में सवालों के सटीक उत्तर दे सकता है।

नवाचार और पहुंच को बढ़ावा देना

त्सिंघुआ विश्वविद्यालय के आर्टिफिशियल इंटेलिजेंस संस्थान के कार्यकारी उपाध्यक्ष और यूरोपीय एकेडमी ऑफ ह्यूमैनिटीज एंड नेचुरल साइंसेज के एक विदेशी शिक्षाविद सन माओसॉन्ग ने कहा कि हाल के वर्षों में, चीन कृत्रिम बुद्धिमत्ता के विकास में, विशेष रूप से बड़े मॉडलों के क्षेत्र में मजबूत योगदान दे रहा है। DeepSeek का उदय और Tongyi Qianwen के ओपन-सोर्स उत्पादों की श्रृंखला ने घरेलू बड़े मॉडलों के ओपन-सोर्स मार्ग को बहुत बढ़ावा दिया है, जो निस्संदेह तकनीकी एकाधिकार को कम करने, तकनीकी इक्विटी को बढ़ावा देने और कृत्रिम बुद्धिमत्ता की समावेशिता को बढ़ाने के लिए बहुत महत्वपूर्ण है।

वर्तमान में, देश और विदेश में ओपन-सोर्स समुदायों में Qwen-व्युत्पन्न मॉडलों की संख्या 100,000 से अधिक हो गई है, जो व्युत्पन्न मॉडलों की Llama श्रृंखला को पार कर गई है, और Tongyi Qianwen Qwen दुनिया के सबसे बड़े जनरेटिव भाषा मॉडल समूह के रूप में स्थान पर है। 10 फरवरी, 2025 को Huggingface की नवीनतम वैश्विक ओपन-सोर्स बड़ी मॉडल सूची के अनुसार, शीर्ष दस ओपन-सोर्स बड़े मॉडल सभी Tongyi Qianwen Qwen ओपन-सोर्स मॉडल पर आधारित व्युत्पन्न मॉडल हैं।

सन माओसॉन्ग का मानना है कि इसका मतलब है कि चीन की बड़ी मॉडल संस्कृति को अंतरराष्ट्रीय स्तर पर मान्यता मिली है, जो एक सांस्कृतिक बदलाव है। यह बहुत मूल्यवान है और चीन के बड़े मॉडलों के विकास और प्रौद्योगिकी की मान्यता का प्रतिनिधित्व करता है। चीन अब इस दिशा में विश्व स्तर पर अग्रणी है और इसके साथ ही पूरी दुनिया एक साथ और अधिक तेजी से आगे बढ़ सकती है।