अलीबाबा का क्वेन मॉडल: चीन की AI महत्वाकांक्षाएं

चीन की AI महत्वाकांक्षाओं को प्रज्वलित करता अलीबाबा का क्वेन मॉडल

5 मार्च को, चीनी प्रौद्योगिकी दिग्गज अलीबाबा ने अपने नवीनतम आर्टिफिशियल इंटेलिजेंस रीजनिंग मॉडल का अनावरण किया, एक ऐसा विकास जिसने कंपनी के हांगकांग-सूचीबद्ध शेयरों को 8% तक बढ़ा दिया। जबकि यह नया मॉडल, जिसे QwQ-32B करार दिया गया है, अभी तक संयुक्त राज्य अमेरिका में अग्रणी AI सिस्टम की क्षमताओं को टक्कर नहीं दे सकता है, यह कथित तौर पर अपने घरेलू प्रतिद्वंद्वी, डीपसीक के R1 मॉडल के प्रदर्शन से मेल खाता है। QwQ-32B को जो चीज अलग करती है, वह है कंप्यूटिंग शक्ति की इसकी काफी कम मांग, इसके विकास और चल रहे संचालन दोनों में। QwQ-32B के पीछे के दिमाग का दावा है कि यह एक ‘प्राचीन दार्शनिक भावना’ का प्रतीक है, जो समस्याओं को ‘वास्तविक आश्चर्य और संदेह’ की भावना के साथ देखता है।

चीन का विस्तारित AI पारिस्थितिकी तंत्र

कार्नेगी एंडोमेंट फॉर इंटरनेशनल पीस में टेक्नोलॉजी एंड इंटरनेशनल अफेयर्स प्रोग्राम में विजिटिंग स्कॉलर स्कॉट सिंगर कहते हैं, “यह रिलीज चीन के फ्रंटियर AI इकोसिस्टम की व्यापक प्रतिस्पर्धात्मकता को रेखांकित करती है।” यह पारिस्थितिकी तंत्र एक जीवंत परिदृश्य है जो डीपसीक जैसे खिलाड़ियों द्वारा अपने R1 मॉडल और टेनसेंट के साथ अपने हुनयुआन मॉडल के साथ आबाद है। विशेष रूप से, एंथ्रोपिक के सह-संस्थापक जैक क्लार्क ने हुनयुआन को कुछ पहलुओं में ‘विश्व स्तरीय’ के रूप में स्वीकार किया है। हालांकि, यह ध्यान रखना महत्वपूर्ण है कि अलीबाबा के नवीनतम मॉडल के आकलन अभी भी अपने शुरुआती चरण में हैं। मॉडल क्षमताओं को मापने में अंतर्निहित कठिनाई, इस तथ्य के साथ कि QwQ-32B का मूल्यांकन केवल अलीबाबा द्वारा आंतरिक रूप से किया गया है, इसका मतलब है कि ‘सूचना वातावरण अभी बहुत समृद्ध नहीं है,’ जैसा कि सिंगर बताते हैं।

जनवरी में डीपसीक के R1 मॉडल की शुरुआत ने पहले ही वैश्विक शेयर बाजार में हलचल मचा दी थी, जिससे चीन का तकनीकी पारिस्थितिकी तंत्र अंतरराष्ट्रीय सुर्खियों में आ गया था। यह ध्यान संयुक्त राज्य अमेरिका में कृत्रिम सामान्य बुद्धि (AGI) प्राप्त करने के लिए चीन के खिलाफ दौड़ की बढ़ती धारणा से और बढ़ जाता है। AGI, AI परिष्कार के एक काल्पनिक स्तर का प्रतिनिधित्व करता है जहां सिस्टम ग्राफिक डिजाइन से लेकर मशीन-लर्निंग अनुसंधान तक, मानव क्षमताओं के बराबर या उससे अधिक स्तर पर संज्ञानात्मक कार्यों की एक विस्तृत श्रृंखला करने की क्षमता रखते हैं।

AGI के सामरिक निहितार्थ

AGI के विकास को व्यापक रूप से उस इकाई पर एक महत्वपूर्ण सैन्य और रणनीतिक लाभ प्रदान करने की उम्मीद है - चाहे वह कंपनी हो या सरकार - जो इसे पहले प्राप्त करती है। इस तरह की प्रणाली के संभावित अनुप्रयोग विशाल और परिवर्तनकारी हैं, उन्नत साइबर युद्ध क्षमताओं से लेकर सामूहिक विनाश के नए हथियारों के निर्माण तक।

अलीबाबा के नवीनतम मॉडल के लिए जिम्मेदार टीम ने घोषणा की, “हमें विश्वास है कि मजबूत नींव मॉडल को स्केल किए गए कम्प्यूटेशनल संसाधनों द्वारा संचालित सुदृढीकरण सीखने के साथ जोड़ना हमें AGI प्राप्त करने के करीब ले जाएगा।” AGI की यह खोज अधिकांश प्रमुख AI प्रयोगशालाओं में चलने वाला एक सामान्य सूत्र है। डीपसीक का घोषित उद्देश्य ‘जिज्ञासा के साथ AGI के रहस्य को उजागर करना’ है। इसी तरह, OpenAI का मिशन ‘यह सुनिश्चित करना है कि कृत्रिम सामान्य बुद्धि- AI सिस्टम जो आम तौर पर मनुष्यों से अधिक स्मार्ट होते हैं- सभी मानवता को लाभान्वित करते हैं।’ प्रमुख AI सीईओ ने उम्मीदें व्यक्त की हैं कि AGI जैसी प्रणाली राष्ट्रपति ट्रम्प के वर्तमान कार्यकाल के भीतर उभर सकती है।

जैक मा का पुन: उभरना और चीन का तकनीकी परिदृश्य

अलीबाबा की हालिया AI सफलता कंपनी के सह-संस्थापक जैक मा द्वारा एक उल्लेखनीय सार्वजनिक उपस्थिति के बाद आई है। उन्हें राष्ट्रपति शी जिनपिंग और चीन के प्रमुख व्यापारिक नेताओं के बीच एक बैठक के दौरान अग्रिम पंक्ति में प्रमुखता से बैठाया गया था। इसने मा के लिए एक महत्वपूर्ण बदलाव को चिह्नित किया, जो 2020 से काफी हद तक लोगों की नज़रों से दूर हो गए थे। राज्य नियामकों और राज्य के स्वामित्व वाले बैंकों की उनकी पिछली आलोचनाओं ने नवाचार में बाधा डालने और ‘प्यादा दुकान मानसिकता’ के साथ काम करने के लिए उन्हें कम दृश्यता की अवधि के लिए प्रेरित किया था।

सुर्खियों से मा की अनुपस्थिति के दौरान, चीनी सरकार ने तकनीकी उद्योग को लक्षित करने वाले उपायों की एक श्रृंखला लागू की। कंपनियां डेटा का उपयोग कैसे कर सकती हैं और बाजार प्रतिस्पर्धा में संलग्न हो सकती हैं, इस पर सख्त नियम लगाए गए थे। साथ ही, सरकार ने प्रमुख डिजिटल प्लेटफार्मों पर अधिक नियंत्रण रखा।

बदलती प्राथमिकताएं: तकनीकी क्रैकडाउन से आर्थिक पुनरुद्धार तक

2022 तक, सरकार के फोकस में एक स्पष्ट बदलाव आया। तकनीकी उद्योग द्वारा उत्पन्न कथित खतरा आर्थिक ठहराव की आसन्न चुनौती की तुलना में कम होता दिखाई दिया। सिंगर बताते हैं, “उस आर्थिक ठहराव की कहानी, और इसे उलटने का प्रयास, ने वास्तव में पिछले 18 महीनों में नीति को बहुत आकार दिया है।” चीन अब सक्रिय रूप से अत्याधुनिक तकनीक को अपनाने का प्रयास कर रहा है। रिपोर्टों से संकेत मिलता है कि कम से कम 13 शहर सरकारों और 10 राज्य के स्वामित्व वाली ऊर्जा कंपनियों ने पहले ही डीपसीक मॉडल को अपने परिचालन प्रणालियों में एकीकृत कर लिया है।

AI दक्षता बढ़ाने की प्रवृत्ति

अलीबाबा का मॉडल AI क्षेत्र में एक सतत प्रवृत्ति का उदाहरण है: परिचालन लागत में कमी के साथ-साथ सिस्टम के प्रदर्शन में लगातार वृद्धि। एपोच AI, एक गैर-लाभकारी अनुसंधान संगठन, का अनुमान है कि AI सिस्टम को प्रशिक्षित करने के लिए आवश्यक कम्प्यूटेशनल शक्ति सालाना 4 गुना से अधिक की दर से बढ़ रही है। हालांकि, एल्गोरिथ्म डिजाइन में समवर्ती प्रगति के कारण हर साल उस कंप्यूटिंग शक्ति की दक्षता में तीन गुना वृद्धि हुई है। व्यावहारिक शब्दों में, इसका मतलब है कि एक AI प्रणाली जिसे पिछले साल प्रशिक्षण के लिए 10,000 उन्नत कंप्यूटर चिप्स की आवश्यकता हो सकती है, उसे इस साल उस संख्या के केवल एक तिहाई के साथ प्रशिक्षित किया जा सकता है।

उच्च-अंत कंप्यूटिंग चिप्स की महत्वपूर्ण भूमिका

इन प्रभावशाली दक्षता लाभों के बावजूद, सिंगर ने आगाह किया कि उच्च-अंत कंप्यूटिंग चिप्स उन्नत AI विकास के लिए अपरिहार्य हैं। यह वास्तविकता अलीबाबा और डीपसीक जैसी चीनी AI कंपनियों के लिए इन चिप्स पर अमेरिकी निर्यात नियंत्रण द्वारा उत्पन्न चल रही चुनौती को रेखांकित करती है। डीपसीक के सीईओ ने विशेष रूप से वित्तीय संसाधनों या प्रतिभा के बजाय चिप्स तक पहुंच को अपनी प्राथमिक बाधा के रूप में पहचाना है।

एक नया प्रतिमान: ‘रीजनिंग मॉडल’

QwQ ‘रीजनिंग मॉडल’ के रूप में वर्गीकृत AI सिस्टम की एक उभरती हुई पीढ़ी के लिए नवीनतम जोड़ का प्रतिनिधित्व करता है। कुछ विशेषज्ञ इसे AI के क्षेत्र में एक प्रतिमान बदलाव के रूप में देखते हैं। पहले, AI सिस्टम प्रशिक्षण के लिए उपयोग की जाने वाली कम्प्यूटेशनल शक्ति को बढ़ाने और प्रशिक्षण डेटा की मात्रा और गुणवत्ता को बढ़ाने के संयोजन के माध्यम से सुधार करते थे।

यह नया प्रतिमान एक अलग दृष्टिकोण पर जोर देता है। इसमें एक मॉडल लेना शामिल है जो पहले से ही प्रारंभिक प्रशिक्षण से गुजर चुका है - इस मामले में, Qwen 2.5-32B - और फिर किसी विशिष्ट क्वेरी का जवाब देते समय सिस्टम को आवंटित कम्प्यूटेशनल संसाधनों में काफी वृद्धि करना। जैसा कि क्वेन टीम इसे स्पष्ट रूप से कहती है, ‘जब सोचने, सवाल करने और प्रतिबिंबित करने का समय दिया जाता है, तो गणित और प्रोग्रामिंग की मॉडल की समझ एक फूल की तरह खिलती है जो सूरज के सामने खुलती है।’ यह अवलोकन पश्चिमी मॉडलों में देखे गए रुझानों के साथ संरेखित होता है, जहां विस्तारित ‘सोचने’ के समय की अनुमति देने वाली तकनीकों के परिणामस्वरूप जटिल विश्लेषणात्मक कार्यों पर पर्याप्त प्रदर्शन सुधार हुआ है।

ओपन-वेट रिलीज और मार्केट डायनेमिक्स

अलीबाबा के QwQ को ‘ओपन वेट’ मॉडल के तहत जारी किया गया है। इसका मतलब है कि वज़न, जो अनिवार्य रूप से मॉडल का गठन करते हैं और एक कंप्यूटर फ़ाइल के रूप में सुलभ हैं, को डाउनलोड किया जा सकता है और स्थानीय रूप से चलाया जा सकता है, यहां तक कि एक उच्च-अंत लैपटॉप पर भी। दिलचस्प बात यह है कि पिछले साल नवंबर में जारी किए गए मॉडल के एक पूर्वावलोकन ने काफी कम ध्यान आकर्षित किया। सिंगर ने कहा कि ‘शेयर बाजार आम तौर पर मॉडल रिलीज के लिए प्रतिक्रियाशील होता है न कि प्रौद्योगिकी के प्रक्षेपवक्र के लिए,’ जिसके प्रशांत के दोनों किनारों पर तेजी से आगे बढ़ने की उम्मीद है। उन्होंने आगे जोर देकर कहा, ‘चीनी पारिस्थितिकी तंत्र में इसमें कई खिलाड़ी हैं, जिनमें से सभी ऐसे मॉडल पेश कर रहे हैं जो बहुत शक्तिशाली और सम्मोहक हैं, और यह स्पष्ट नहीं है कि कौन उभरेगा, जब यह सब कहा और किया जाता है, तो सबसे अच्छा मॉडल होगा।’

QwQ-32B की वास्तुकला की विस्तृत परीक्षा

QwQ-32B मॉडल, जबकि Qwen 2.5-32B की नींव पर बनाया गया है, इसमें कई प्रमुख वास्तुशिल्प संशोधन और प्रशिक्षण संवर्द्धन शामिल हैं जो इसकी बेहतर तर्क क्षमताओं में योगदान करते हैं। इन संवर्द्धन को मोटे तौर पर वर्गीकृत किया जा सकता है:

  • संदर्भ विंडो विस्तार: संदर्भ विंडो, जो उस पाठ की मात्रा निर्धारित करती है जिस पर मॉडल एक बार में विचार कर सकता है, की संभावना काफी बढ़ गई है। यह QwQ-32B को पाठ के लंबे, अधिक जटिल अंशों को संसाधित करने और समझने की अनुमति देता है, जिससे बेहतर समझ और अधिक सूक्ष्म प्रतिक्रियाएं मिलती हैं।

  • बढ़ी हुई ध्यान तंत्र: ध्यान तंत्र, QwQ-32B जैसे ट्रांसफार्मर-आधारित मॉडल का एक मुख्य घटक, को संभवतः परिष्कृत किया गया है। इसमें मल्टी-हेडेड अटेंशन या विरल ध्यान जैसी तकनीकें शामिल हो सकती हैं, जिससे मॉडल इनपुट टेक्स्ट के भीतर प्रासंगिक जानकारी पर अधिक प्रभावी ढंग से ध्यान केंद्रित कर सकता है और शोर को फ़िल्टर कर सकता है।

  • मानव प्रतिक्रिया से सुदृढीकरण सीखना (RLHF): जबकि स्पष्ट रूप से कहा नहीं गया है, यह अत्यधिक संभावना है कि QwQ-32B को RLHF का उपयोग करके ठीक-ठीक किया गया है। इस तकनीक में मॉडल को ऐसे आउटपुट उत्पन्न करने के लिए प्रशिक्षित करना शामिल है जो मानव मूल्यांकनकर्ताओं द्वारा पसंद किए जाते हैं, जिससे सुसंगतता, सहायकता और हानिरहितता जैसे क्षेत्रों में सुधार होता है।

  • निर्देश ट्यूनिंग: QwQ-32B व्यापक निर्देश ट्यूनिंग से गुजरा हो सकता है, एक ऐसी प्रक्रिया जहां मॉडल को निर्देशों और संबंधित आउटपुट के विविध सेट पर प्रशिक्षित किया जाता है। यह मॉडल को नए कार्यों के लिए बेहतर ढंग से सामान्य बनाने और निर्देशों का अधिक सटीक रूप से पालन करने में मदद करता है।

  • चेन-ऑफ-थॉट प्रॉम्प्टिंग: मॉडल को स्पष्ट रूप से चेन-ऑफ-थॉट प्रॉम्प्टिंग का लाभ उठाने के लिए डिज़ाइन किया गया है, एक ऐसी तकनीक जहां मॉडल को अंतिम उत्तर पर पहुंचने से पहले मध्यवर्ती तर्क चरणों की एक श्रृंखला उत्पन्न करने के लिए प्रोत्साहित किया जाता है। यह अधिक जानबूझकर और तार्किक तर्क को बढ़ावा देता है।

विशिष्ट उद्योगों के लिए निहितार्थ

QwQ-32B और अन्य चीनी AI मॉडल द्वारा सन्निहित प्रगति का चीन और विश्व स्तर पर विभिन्न उद्योगों के लिए महत्वपूर्ण प्रभाव है। कुछ प्रमुख क्षेत्र जो प्रभावित होने की संभावना है, उनमें शामिल हैं:

  • ई-कॉमर्स: अलीबाबा का मुख्य व्यवसाय, ई-कॉमर्स, बेहतर AI क्षमताओं से काफी लाभान्वित होने के लिए खड़ा है। इसमें व्यक्तिगत सिफारिशें, ग्राहक सेवा चैटबॉट, धोखाधड़ी का पता लगाने और आपूर्ति श्रृंखला अनुकूलन जैसे क्षेत्र शामिल हैं।

  • वित्त: AI मॉडल का उपयोग जोखिम मूल्यांकन, धोखाधड़ी का पता लगाने, एल्गोरिथम ट्रेडिंग और ग्राहक संबंध प्रबंधन जैसे कार्यों के लिए किया जा सकता है। QwQ-32B जैसे मॉडलों की बढ़ी हुई तर्क क्षमताएं अधिक सटीक वित्तीय भविष्यवाणियों और बेहतर निर्णय लेने की ओर ले जा सकती हैं।

  • स्वास्थ्य सेवा: AI दवा की खोज, रोग निदान, व्यक्तिगत दवा और रोगी की निगरानी में सहायता कर सकता है। अधिक शक्तिशाली तर्क मॉडल जटिल चिकित्सा डेटा का विश्लेषण कर सकते हैं और ऐसी अंतर्दृष्टि प्रदान कर सकते हैं जो पहले दुर्गम थीं।

  • विनिर्माण: AI-संचालित स्वचालन, गुणवत्ता नियंत्रण और भविष्य कहनेवाला रखरखाव विनिर्माण प्रक्रियाओं में दक्षता बढ़ा सकते हैं और लागत कम कर सकते हैं।

  • परिवहन: सेल्फ-ड्राइविंग वाहन, यातायात प्रबंधन प्रणाली और रसद अनुकूलन AI पर बहुत अधिक निर्भर करते हैं। AI तर्क में प्रगति सुरक्षित और अधिक कुशल परिवहन नेटवर्क में योगदान कर सकती है।

  • शिक्षा: छात्रों को बेहतर समर्थन और यहां तक कि व्यक्तिगत ट्यूशन प्रदान करने के लिए AI मॉडल को तेजी से अपनाया जा रहा है।

AI प्रतिस्पर्धा और सहयोग का भविष्य

QwQ-32B जैसे चीनी AI मॉडल की तीव्र प्रगति वैश्विक स्तर पर AI प्रतिस्पर्धा और सहयोग के भविष्य के बारे में महत्वपूर्ण प्रश्न उठाती है। जबकि एक प्रतिस्पर्धी गतिशील निस्संदेह मौजूद है, विशेष रूप से अमेरिका और चीन के बीच, सहयोग और ज्ञान साझा करने के संभावित लाभ भी हैं।

  • ओपन सोर्स बनाम क्लोज्ड सोर्स: QwQ-32B को ओपन-वेट मॉडल के रूप में जारी करने का अलीबाबा का निर्णय महत्वपूर्ण है। यह कुछ पश्चिमी AI कंपनियों द्वारा अपनाए गए दृष्टिकोण के विपरीत है जो अपने मॉडल को मालिकाना, बंद-स्रोत प्रणालियों के रूप में बनाए रखते हैं। ओपन-सोर्स मॉडल दुनिया भर के शोधकर्ताओं और डेवलपर्स को मौजूदा काम पर निर्माण करने की अनुमति देकर अधिक सहयोग और त्वरित नवाचार को बढ़ावा दे सकते हैं।

  • डेटा साझाकरण और मानकीकरण: मजबूत और विश्वसनीय AI सिस्टम के विकास के लिए बड़ी मात्रा में डेटा की आवश्यकता होती है। डेटा साझाकरण पर अंतर्राष्ट्रीय सहयोग और सामान्य मानकों की स्थापना से पूरे AI समुदाय को लाभ हो सकता है।

  • नैतिक विचार: जैसे-जैसे AI सिस्टम अधिक शक्तिशाली होते जाते हैं, नैतिक विचार तेजी से महत्वपूर्ण होते जाते हैं। यह सुनिश्चित करने के लिए वैश्विक संवाद और सहयोग आवश्यक है कि AI को जिम्मेदारी से विकसित और तैनात किया जाए, संभावित जोखिमों को कम करने के लिए उचित सुरक्षा उपायों के साथ।

  • प्रतिभा विनिमय: AI क्षेत्र एक विविध और विश्व स्तर पर वितरित प्रतिभा पूल से लाभान्वित होता है। देशों के बीच शोधकर्ताओं और इंजीनियरों के आदान-प्रदान की सुविधा ज्ञान हस्तांतरण को बढ़ावा दे सकती है और प्रगति में तेजी ला सकती है।

QwQ-32B और अन्य उन्नत चीनी AI मॉडल का उद्भव कृत्रिम बुद्धिमत्ता के चल रहे विकास में एक महत्वपूर्ण मील का पत्थर का प्रतिनिधित्व करता है। यह चीन के तकनीकी पारिस्थितिकी तंत्र की बढ़ती क्षमताओं पर प्रकाश डालता है और AI प्रगति के वैश्विक प्रभावों को रेखांकित करता है। आने वाले वर्षों में निरंतर तेजी से प्रगति, तीव्र प्रतिस्पर्धा और यह सुनिश्चित करने के लिए अंतर्राष्ट्रीय सहयोग के लिए बढ़ती कॉल देखने की संभावना है कि AI समग्र रूप से मानवता को लाभान्वित करे।