मैनस: क्षणिक चमक या चीन का AI भविष्य?

प्रचार की संरचना: मैनस को समझना

मैनस का उदय शून्य में नहीं हुआ है। रिपोर्टों से संकेत मिलता है कि प्लेटफ़ॉर्म एक मौलिक रचना नहीं है, बल्कि मौजूदा और फाइन-ट्यून किए गए AI मॉडल से बुना हुआ एक जटिल ताना-बाना है। यह कथित तौर पर एंथ्रोपिक के क्लॉड और अलीबाबा के Qwen जैसे मॉडलों की क्षमताओं का लाभ उठाता है, उन्हें अनुसंधान रिपोर्ट निर्माण से लेकर वित्तीय दस्तावेजों के जटिल विश्लेषण तक के कार्यों के लिए नियोजित करता है।

हालांकि, द बटरफ्लाई इफेक्ट, मैनस के पीछे की चीनी कंपनी, अपनी वेबसाइट पर कहीं अधिक महत्वाकांक्षी तस्वीर पेश करती है। प्लेटफ़ॉर्म को रियल एस्टेट अधिग्रहण और वीडियो गेम प्रोग्रामिंग जैसे विविध कार्यों में सक्षम बताया गया है - ऐसे दावे जो पहली नज़र में काल्पनिक लगते हैं।

साहसिक दावे और वायरल वीडियो: धारणा की शक्ति

यिचैओ ‘पीक’ जी, मैनस के एक अनुसंधान प्रमुख, ने X (पूर्व में ट्विटर) पर एक वायरल वीडियो में प्रचार को और हवा दी। उन्होंने मैनस को मौजूदा एजेंटिक टूल, जिसमें OpenAI के डीप रिसर्च और ऑपरेटर शामिल हैं, के लिए एक बेहतर विकल्प के रूप में प्रस्तुत किया। जी ने दावा किया कि मैनस GAIA पर डीप रिसर्च से बेहतर प्रदर्शन करता है, जो सामान्य AI सहायकों के मूल्यांकन के लिए व्यापक रूप से उपयोग किया जाने वाला बेंचमार्क है। यह बेंचमार्क वेब पर नेविगेट करने, सॉफ़्टवेयर के साथ बातचीत करने और अन्य कार्यों को करके वास्तविक दुनिया के कार्यों को करने की AI की क्षमता की जांच करता है।

जी ने वीडियो में कहा, ‘[मैनस] सिर्फ एक और चैटबॉट या वर्कफ़्लो नहीं है।’ ‘यह एक पूरी तरह से स्वायत्त एजेंट है जो अवधारणा और निष्पादन के बीच की खाई को पाटता है […]। हम इसे मानव-मशीन सहयोग के अगले प्रतिमान के रूप में देखते हैं।’ ये वास्तव में साहसिक दावे हैं, और उन्होंने प्लेटफ़ॉर्म के तेजी से वायरल प्रसिद्धि तक पहुंचने में महत्वपूर्ण योगदान दिया है।

वास्तविकता की जाँच: उपयोगकर्ता अनुभव एक अलग तस्वीर पेश करते हैं

जबकि मैनस के आर्किटेक्ट्स और कुछ प्रभावशाली आवाजों ने इसकी प्रशंसा की है, शुरुआती उपयोगकर्ता अनुभव एक कम चापलूसी वाली कहानी बताते हैं। ग्लिच, सीमाओं और पूरी तरह से विफलताओं की रिपोर्टें सामने आने लगी हैं, जो प्लेटफ़ॉर्म की कथित क्षमताओं पर संदेह की छाया डालती हैं।

AI स्टार्टअप प्लीअस के सह-संस्थापक, अलेक्जेंडर डोरिया ने X पर मैनस के साथ अपने कम-से-कम शानदार अनुभव को साझा किया। उन्होंने अपने परीक्षण के दौरान त्रुटि संदेशों और अंतहीन लूप की एक निराशाजनक बौछार का सामना किया। अन्य उपयोगकर्ताओं ने इन चिंताओं को दोहराया है, मैनस की तथ्यात्मक त्रुटियों की प्रवृत्ति, इसकी असंगत उद्धरण प्रथाओं और ऑनलाइन आसानी से उपलब्ध जानकारी को अनदेखा करने की इसकी प्रवृत्ति को इंगित करते हुए।

व्यक्तिगत मुठभेड़: निराशा का प्रत्यक्ष विवरण

मैनस को उसकी गति से गुजारने के मेरे अपने प्रयासों ने भी इसी तरह के निराशाजनक परिणाम दिए। मैंने एक सीधी-सादी अनुरोध के साथ शुरुआत की: मेरे डिलीवरी दायरे में एक उच्च-रेटेड फास्ट फूड रेस्तरां से एक फ्राइड चिकन सैंडविच ऑर्डर करना। दस मिनट के इंतजार के बाद, प्लेटफ़ॉर्म क्रैश हो गया। एक दूसरे प्रयास में एक मेनू आइटम मिला जो मेरे मानदंडों से मेल खाता था, लेकिन मैनस ऑर्डर पूरा करने या चेकआउट लिंक प्रदान करने में भी असमर्थ साबित हुआ।

इससे विचलित न होकर, मैंने मैनस को पास के एक रेस्तरां में एक के लिए एक टेबल आरक्षित करने का काम सौंपा। फिर से, कुछ मिनटों के बाद विफलता हुई। अंत में, मैंने प्लेटफ़ॉर्म को नारुतो-प्रेरित फाइटिंग गेम बनाने की चुनौती दी। आधे घंटे के प्रसंस्करण के बाद, इसने एक त्रुटि फेंकी, प्रभावी रूप से मेरे प्रयोग को समाप्त कर दिया।

कंपनी की प्रतिक्रिया: बढ़ती पीड़ा को स्वीकार करना

मैनस के एक प्रवक्ता ने टेकक्रंच को दिए एक बयान में प्लेटफ़ॉर्म की वर्तमान सीमाओं को स्वीकार किया:

‘एक छोटी टीम के रूप में, हमारा ध्यान मैनस को बेहतर बनाने और AI एजेंट बनाने पर है जो वास्तव में उपयोगकर्ताओं को समस्याओं को हल करने में मदद करते हैं […]। वर्तमान बंद बीटा का प्राथमिक लक्ष्य सिस्टम के विभिन्न हिस्सों का तनाव-परीक्षण करना और मुद्दों की पहचान करना है। हम सभी द्वारा साझा की गई बहुमूल्य अंतर्दृष्टि की गहराई से सराहना करते हैं।’

यह बयान, मुद्दों को स्वीकार करते हुए, प्लेटफ़ॉर्म की प्रारंभिक-पहुंच प्रकृति पर भी प्रकाश डालता है। यह सुझाव देता है कि वर्तमान संस्करण व्यापक रूप से अपनाने के लिए तैयार एक पॉलिश उत्पाद की तुलना में अधिक तनाव परीक्षण है।

प्रचार चक्र: विशिष्टता, गलत सूचना और राष्ट्रीय गौरव

यदि मैनस, अपनी वर्तमान स्थिति में, स्पष्ट रूप से त्रुटिपूर्ण है, तो इसने इतना तीव्र ध्यान क्यों आकर्षित किया है? कई कारकों ने इस घटना में योगदान दिया है:

  • विशिष्टता: आमंत्रणों की सीमित उपलब्धता ने विशिष्टता का माहौल बनाया है, जिससे मांग और जिज्ञासा बढ़ रही है।
  • मीडिया बज़: चीनी मीडिया आउटलेट मैनस को एक महत्वपूर्ण AI सफलता के रूप में पेश करने में तेज रहे हैं, QQ News जैसे प्रकाशनों ने इसे ‘घरेलू उत्पादों का गौरव’ बताया है।
  • सोशल मीडिया प्रवर्धन: सोशल मीडिया पर AI इन्फ्लुएंसरों ने मैनस की क्षमताओं के बारे में, कभी-कभी, गलत जानकारी फैलाने में महत्वपूर्ण भूमिका निभाई है। एक व्यापक रूप से प्रसारित वीडियो, कथित तौर पर मैनस को कई स्मार्टफोन ऐप में निर्बाध रूप से बातचीत करते हुए दिखाता है, बाद में जी द्वारा गलत बयानी के रूप में पुष्टि की गई थी।
  • डीपसीक से तुलना: X पर कुछ प्रभावशाली AI खातों ने मैनस और डीपसीक, एक अन्य चीनी AI कंपनी के बीच तुलना की है। हालाँकि, ये तुलनाएँ पूरी तरह से सटीक नहीं हैं। डीपसीक के विपरीत, द बटरफ्लाई इफेक्ट ने कोई मालिकाना मॉडल विकसित नहीं किया है। इसके अलावा, जबकि डीपसीक ने अपनी कई तकनीकों को ओपन-सोर्स किया है, मैनस अभी के लिए एक बंद प्रणाली बनी हुई है।

एक चुटकी नमक: प्रारंभिक पहुंच और भविष्य की क्षमता

यह दोहराना महत्वपूर्ण है कि मैनस वर्तमान में विकास के बहुत प्रारंभिक चरण में है। द बटरफ्लाई इफेक्ट का कहना है कि यह कंप्यूटिंग क्षमता को बढ़ाने और रिपोर्ट की गई समस्याओं को दूर करने के लिए सक्रिय रूप से काम कर रहा है। हालाँकि, जैसा कि यह खड़ा है, मैनस तकनीकी वास्तविकता से आगे निकलने वाले प्रचार का एक शक्तिशाली उदाहरण है। यह देखा जाना बाकी है कि क्या प्लेटफ़ॉर्म अपने द्वारा निर्धारित की गई ऊंची उम्मीदों को पूरा करने के लिए विकसित हो सकता है। क्षमता निस्संदेह है, लेकिन उस क्षमता को साकार करने का मार्ग चुनौतियों से भरा हुआ प्रतीत होता है। वर्तमान पुनरावृत्ति वायरल वीडियो और प्रचार सामग्री में दर्शाए गए निर्बाध, स्वायत्त एजेंट से बहुत दूर है। आकांक्षा और निष्पादन के बीच का अंतर काफी बड़ा है।