एंट का AI मॉडल प्रशिक्षण के लिए नवीन दृष्टिकोण
एंट ग्रुप, जैक मा द्वारा समर्थित फिनटेक दिग्गज, ने चीनी-निर्मित सेमीकंडक्टर्स का लाभ उठाकर आर्टिफिशियल इंटेलिजेंस में एक महत्वपूर्ण सफलता हासिल की है। इस नवीन दृष्टिकोण ने कंपनी को AI मॉडल को प्रशिक्षित करने के लिए तकनीकों को विकसित करने में सक्षम बनाया है, जिसके परिणामस्वरूप लागत में 20% की उल्लेखनीय कमी आई है। इस मामले से परिचित सूत्रों ने खुलासा किया है कि एंट ने घरेलू चिप्स का उपयोग किया, जिसमें इसके सहयोगी अलीबाबा ग्रुप होल्डिंग लिमिटेड और हुआवेई टेक्नोलॉजीज कंपनी के चिप्स शामिल हैं, जो मिक्सचर ऑफ एक्सपर्ट्स (MoE) मशीन लर्निंग दृष्टिकोण का उपयोग करके मॉडल को प्रशिक्षित करते हैं।
एंट द्वारा प्राप्त परिणाम Nvidia Corp. के चिप्स, जैसे कि H800, का उपयोग करके प्राप्त किए गए परिणामों के बराबर थे, जो एक शक्तिशाली प्रोसेसर है जिसे अमेरिका द्वारा चीन को निर्यात करने से प्रतिबंधित किया गया है। जबकि एंट AI विकास के लिए Nvidia का उपयोग करना जारी रखता है, यह अपने नवीनतम मॉडलों के लिए Advanced Micro Devices Inc. (AMD) और चीनी चिप्स सहित विकल्पों पर तेजी से निर्भर है।
AI दौड़ में प्रवेश: चीन बनाम अमेरिका
AI मॉडल विकास में एंट का प्रवेश इसे चीनी और अमेरिकी कंपनियों के बीच एक गर्म प्रतिस्पर्धा के बीच में रखता है। यह दौड़ तब से तेज हो गई है जब से डीपसीक ने उद्योग के दिग्गजों जैसे OpenAI और अल्फाबेट इंक. के गूगल, जिन्होंने अरबों का निवेश किया है, की तुलना में कम लागत पर अत्यधिक सक्षम मॉडल को प्रशिक्षित करने की क्षमता का प्रदर्शन किया। एंट की उपलब्धि चीनी कंपनियों के सबसे उन्नत Nvidia सेमीकंडक्टर्स के लिए स्थानीय रूप से प्राप्त विकल्पों का उपयोग करने के दृढ़ संकल्प को रेखांकित करती है।
लागत प्रभावी AI इंफरेंसिंग का वादा
इस महीने एंट द्वारा प्रकाशित शोध पत्र इसके मॉडलों की क्षमता पर प्रकाश डालता है, जिसमें मेटा प्लेटफॉर्म इंक. की तुलना में कुछ बेंचमार्क में बेहतर प्रदर्शन का दावा किया गया है, हालांकि इन दावों को ब्लूमबर्ग न्यूज द्वारा स्वतंत्र रूप से सत्यापित नहीं किया गया है। फिर भी, यदि एंट के प्लेटफॉर्म विज्ञापित के अनुसार प्रदर्शन करते हैं, तो वे चीनी आर्टिफिशियल इंटेलिजेंस विकास में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व कर सकते हैं। यह मुख्य रूप से उनकी इंफरेंसिंग की लागत को काफी कम करने की क्षमता के कारण है, जो AI सेवाओं का समर्थन करने की प्रक्रिया है।
मिक्सचर ऑफ एक्सपर्ट्स: AI में एक गेम-चेंजर
जैसे-जैसे कंपनियां AI में पर्याप्त संसाधन लगा रही हैं, MoE मॉडल एक लोकप्रिय और कुशल दृष्टिकोण के रूप में प्रमुखता से उभरे हैं। यह तकनीक, गूगल और हांग्जो स्थित स्टार्टअप डीपसीक जैसी कंपनियों द्वारा नियोजित, कार्यों को डेटा के छोटे सेट में विभाजित करती है। यह विशेषज्ञों की एक टीम रखने के समान है, प्रत्येक एक विशिष्ट कार्य खंड पर ध्यान केंद्रित करता है, जिससे समग्र प्रक्रिया का अनुकूलन होता है।
GPU बाधा को दूर करना
परंपरागत रूप से, MoE मॉडल का प्रशिक्षण उच्च-प्रदर्शन चिप्स पर बहुत अधिक निर्भर करता है, जैसे कि Nvidia द्वारा निर्मित ग्राफिक्स प्रोसेसिंग यूनिट (GPU)। इन चिप्स की निषेधात्मक लागत कई छोटी फर्मों के लिए एक बड़ी बाधा रही है, जिससे MoE मॉडल को व्यापक रूप से अपनाने में बाधा आ रही है। एंट, हालांकि, बड़े भाषा मॉडल (LLM) को अधिक कुशलता से प्रशिक्षित करने के तरीकों पर लगन से काम कर रहा है, प्रभावी रूप से इस बाधा को दूर कर रहा है। उनके शोध पत्र का शीर्षक, जो “प्रीमियम GPU के बिना” एक मॉडल को स्केल करने का लक्ष्य निर्धारित करता है, स्पष्ट रूप से इस उद्देश्य को दर्शाता है।
Nvidia के प्रभुत्व को चुनौती
एंट का दृष्टिकोण सीधे Nvidia के सीईओ, जेन्सेन हुआंग द्वारा वकालत की गई प्रचलित रणनीति को चुनौती देता है। हुआंग ने लगातार तर्क दिया है कि कम्प्यूटेशनल मांग बढ़ती रहेगी, यहां तक कि डीपसीक के R1 जैसे अधिक कुशल मॉडल के उद्भव के साथ भी। उनका मानना है कि कंपनियों को लागत कम करने के लिए सस्ते चिप्स के बजाय उच्च राजस्व उत्पन्न करने के लिए बेहतर चिप्स की आवश्यकता होगी। नतीजतन, Nvidia ने उन्नत प्रोसेसिंग कोर, ट्रांजिस्टर और बढ़ी हुई मेमोरी क्षमता के साथ बड़े GPU बनाने पर अपना ध्यान केंद्रित रखा है।
लागत बचत का परिमाण
एंट ने अपने अनुकूलित दृष्टिकोण की लागत-प्रभावशीलता को प्रदर्शित करने के लिए ठोस आंकड़े प्रदान किए हैं। कंपनी ने कहा कि उच्च-प्रदर्शन हार्डवेयर का उपयोग करके 1 ट्रिलियन टोकन को प्रशिक्षित करने में लगभग 6.35 मिलियन युआन ($880,000) का खर्च आएगा। हालांकि, कम-विशिष्ट हार्डवेयर और अपनी अनुकूलित तकनीकों का उपयोग करके, एंट इस लागत को 5.1 मिलियन युआन तक कम कर सकता है। टोकन सूचना की उन इकाइयों का प्रतिनिधित्व करते हैं जिन्हें एक मॉडल दुनिया के बारे में जानने और उपयोगकर्ता के प्रश्नों के प्रासंगिक उत्तर प्रदान करने के लिए संसाधित करता है।
औद्योगिक समाधानों के लिए AI सफलताओं का लाभ उठाना
एंट अपनी हालिया प्रगति का लाभ उठाने की योजना बना रहा है, विशेष रूप से लिंग-प्लस और लिंग-लाइट, बड़े भाषा मॉडल में, स्वास्थ्य सेवा और वित्त जैसे क्षेत्रों के लिए औद्योगिक AI समाधान विकसित करने के लिए। ये मॉडल विशिष्ट उद्योग की जरूरतों को पूरा करने और अनुरूप समाधान प्रदान करने के लिए डिज़ाइन किए गए हैं।
स्वास्थ्य सेवा में AI अनुप्रयोगों का विस्तार
स्वास्थ्य सेवा के प्रति एंट की प्रतिबद्धता चीनी ऑनलाइन प्लेटफॉर्म Haodf.com को अपनी आर्टिफिशियल इंटेलिजेंस सेवाओं में एकीकृत करने से स्पष्ट है। AI डॉक्टर असिस्टेंट के निर्माण के माध्यम से, एंट का लक्ष्य Haodf के 290,000 डॉक्टरों के व्यापक नेटवर्क को मेडिकल रिकॉर्ड प्रबंधन जैसे कार्यों में सहायता करके समर्थन करना है। AI का यह अनुप्रयोग स्वास्थ्य सेवा वितरण में दक्षता और सटीकता में काफी सुधार करने की क्षमता रखता है।
रोजमर्रा की जिंदगी के लिए AI-संचालित सहायता
स्वास्थ्य सेवा से परे, एंट ने Zhixiaobao नामक एक AI ‘लाइफ असिस्टेंट’ ऐप और Maxiaocai नामक एक वित्तीय सलाहकार AI सेवा भी विकसित की है। ये एप्लिकेशन दैनिक जीवन के विभिन्न पहलुओं में AI को एकीकृत करने की एंट की महत्वाकांक्षा को प्रदर्शित करते हैं, जो उपयोगकर्ताओं को व्यक्तिगत और बुद्धिमान सहायता प्रदान करते हैं।
बेंचमार्किंग प्रदर्शन: लिंग मॉडल बनाम प्रतियोगी
अपने शोध पत्र में, एंट का दावा है कि लिंग-लाइट मॉडल ने अंग्रेजी भाषा की समझ के लिए एक प्रमुख बेंचमार्क में मेटा के लामा मॉडल में से एक को पीछे छोड़ दिया। इसके अलावा, लिंग-लाइट और लिंग-प्लस दोनों मॉडलों ने चीनी भाषा के बेंचमार्क पर डीपसीक के समकक्षों की तुलना में बेहतर प्रदर्शन का प्रदर्शन किया। यह AI परिदृश्य में एंट की प्रतिस्पर्धी स्थिति को उजागर करता है।
जैसा कि बीजिंग स्थित AI समाधान प्रदाता शेंगशांग टेक कंपनी के मुख्य प्रौद्योगिकी अधिकारी रॉबिन यू ने उपयुक्त रूप से कहा, “यदि आपको दुनिया के सर्वश्रेष्ठ कुंग फू मास्टर को हराने के लिए एक बिंदु मिलता है, तो आप अभी भी कह सकते हैं कि आपने उन्हें हराया है, यही कारण है कि वास्तविक दुनिया का अनुप्रयोग महत्वपूर्ण है।”
सहयोग और नवाचार के लिए ओपन-सोर्सिंग
एंट ने लिंग मॉडल को ओपन सोर्स बनाया है, जिससे AI समुदाय के भीतर सहयोग और नवाचार को बढ़ावा मिला है। लिंग-लाइट में 16.8 बिलियन पैरामीटर शामिल हैं, जो समायोज्य सेटिंग्स हैं जो मॉडल के प्रदर्शन को नियंत्रित करते हैं। दूसरी ओर, लिंग-प्लस, 290 बिलियन पैरामीटर का दावा करता है, जो इसे बड़े भाषा मॉडल में रखता है। संदर्भ प्रदान करने के लिए, विशेषज्ञों का अनुमान है कि ChatGPT के GPT-4.5 में लगभग 1.8 ट्रिलियन पैरामीटर हैं, जबकि डीपसीक-R1 में 671 बिलियन हैं।
मॉडल प्रशिक्षण में चुनौतियों का समाधान
इन मॉडलों को विकसित करने में एंट की यात्रा चुनौतियों के बिना नहीं रही है। कंपनी को प्रशिक्षण के कुछ क्षेत्रों में कठिनाइयों का सामना करना पड़ा, खासकर स्थिरता के संबंध में। हार्डवेयर या मॉडल की संरचना में मामूली बदलाव भी मुद्दों को जन्म दे सकते हैं, जिसमें मॉडल की त्रुटि दर में उतार-चढ़ाव शामिल है। यह उन्नत AI मॉडल को प्रशिक्षित करने में शामिल जटिलता और संवेदनशीलता को रेखांकित करता है।
स्वास्थ्य सेवा में वास्तविक दुनिया की तैनाती
व्यावहारिक अनुप्रयोगों के प्रति एंट की प्रतिबद्धता स्वास्थ्य सेवा-केंद्रित बड़े मॉडल मशीनों की तैनाती से और प्रदर्शित होती है। इन मशीनों का उपयोग वर्तमान में बीजिंग और शंघाई जैसे प्रमुख शहरों में सात अस्पतालों और स्वास्थ्य सेवा प्रदाताओं द्वारा किया जा रहा है। बड़ा मॉडल मेडिकल कंसल्टेंसी सेवाएं प्रदान करने के लिए डीपसीक R1, अलीबाबा के Qwen और एंट के अपने LLM का लाभ उठाता है।
उन्नत स्वास्थ्य सेवा सेवाओं के लिए AI एजेंट
बड़े मॉडल मशीनों के अलावा, एंट ने दो मेडिकल AI एजेंट पेश किए हैं: एंजेल और यिबाओर। एंजेल ने पहले ही 1,000 से अधिक चिकित्सा सुविधाओं की सेवा की है, जबकि यिबाओर चिकित्सा बीमा सेवाओं के लिए समर्थन प्रदान करता है। इसके अलावा, पिछले वर्ष सितंबर में, एंट ने अपने Alipay भुगतान ऐप के भीतर AI हेल्थकेयर मैनेजर सेवा शुरू की, जिससे स्वास्थ्य सेवा क्षेत्र में इसकी पहुंच और बढ़ गई। ये पहल स्वास्थ्य सेवा वितरण को बदलने और बेहतर बनाने के लिए AI का लाभ उठाने के लिए एंट के समर्पण को प्रदर्शित करती हैं।