अँटचा AI मॉडेल प्रशिक्षणासाठी नाविन्यपूर्ण दृष्टीकोन
जॅक मा (Jack Ma) यांच्या पाठिंब्यावर चालणारी फिनटेक क्षेत्रातील दिग्गज कंपनी अँट ग्रुपने (Ant Group) आर्टिफिशिअल इंटेलिजन्स (AI) मध्ये एक महत्त्वपूर्ण यश मिळवले आहे. कंपनीने चिनी-निर्मित सेमीकंडक्टर्सचा (Chinese-made semiconductors) वापर करून AI मॉडेल्सना प्रशिक्षित करण्याची एक अभिनव पद्धत विकसित केली आहे. यामुळे कंपनीला AI मॉडेल प्रशिक्षणाचा खर्च 20% नी कमी करण्यात यश आले आहे. या प्रकरणाशी संबंधित सूत्रांनी दिलेल्या माहितीनुसार, अँटने अलिबाबा ग्रुप होल्डिंग लिमिटेड (Alibaba GroupHolding Ltd.) आणि हुवावे टेक्नॉलॉजीज कंपनी (Huawei Technologies Co.) यांसारख्या कंपन्यांच्या चिप्सचा वापर केला. तसेच, ‘Mixture of Experts’ (MoE) मशीन लर्निंग दृष्टीकोन वापरून मॉडेल्सना प्रशिक्षित केले.
अँटने मिळवलेले परिणाम हे Nvidia Corp. च्या H800 सारख्या चिप्स वापरून मिळवलेल्या परिणामांशी तुलना करण्यायोग्य होते. H800 हे एक शक्तिशाली प्रोसेसर आहे, ज्याच्या चीनमधील निर्यातीवर अमेरिकेने निर्बंध घातले आहेत. अँट अजूनही AI विकासासाठी Nvidia चा वापर करत असली, तरी नवीन मॉडेल्ससाठी ते Advanced Micro Devices Inc. (AMD) आणि चिनी चिप्ससह इतर पर्यायांवर अधिकाधिक अवलंबून आहे.
AI शर्यतीत प्रवेश: चीन विरुद्ध अमेरिका
AI मॉडेल डेव्हलपमेंटमध्ये अँटच्या प्रवेशामुळे ते चिनी आणि अमेरिकन कंपन्यांमधील तीव्र स्पर्धेच्या केंद्रस्थानी आले आहे. डीपसीकने (DeepSeek) अत्यंत कमी खर्चात उच्च-क्षमतेची मॉडेल्स प्रशिक्षित करण्याची क्षमता दर्शविल्यामुळे ही स्पर्धा अधिक तीव्र झाली आहे. OpenAI आणि अल्फाबेट इंक. (Alphabet Inc.) ची गुगल (Google) यांसारख्या कंपन्यांनी अब्जावधी डॉलर्सची गुंतवणूक केली आहे, त्यांच्या तुलनेत डीपसीकने कमी खर्चात मॉडेल तयार केले. अँटचे यश हे दर्शवते की, चिनी कंपन्या सर्वात प्रगत Nvidia सेमीकंडक्टर्ससाठी स्थानिक पातळीवर उपलब्ध असलेल्या पर्यायांचा वापर करण्याचा निर्धार करत आहेत.
किफायतशीर AI इन्फरन्सिंगचे (Inferencing) आश्वासन
अँटने या महिन्यात प्रकाशित केलेल्या संशोधन पेपरमध्ये त्यांच्या मॉडेल्सची क्षमता दर्शविण्यात आली आहे. त्यांनी मेटा प्लॅटफॉर्म इंक. (Meta Platforms Inc.) च्या तुलनेत विशिष्ट बेंचमार्कमध्ये चांगली कामगिरी केल्याचा दावा केला आहे. ब्लूमबर्ग न्यूजने (Bloomberg News) या दाव्यांची स्वतंत्रपणे पडताळणी केलेली नाही. तथापि, जर अँटचे प्लॅटफॉर्म अपेक्षेप्रमाणे कार्य करत असतील, तर ते चिनी आर्टिफिशिअल इंटेलिजन्सच्या विकासात एक महत्त्वपूर्ण प्रगती दर्शवतात. याचे मुख्य कारण म्हणजे, ते AI सेवांना समर्थन देण्याची प्रक्रिया, म्हणजेच इन्फरन्सिंगचा खर्च मोठ्या प्रमाणात कमी करू शकतात.
Mixture of Experts: AI मधील गेम-चेंजर
कंपन्या AI मध्ये मोठ्या प्रमाणात गुंतवणूक करत असताना, MoE मॉडेल्स एक लोकप्रिय आणि कार्यक्षम दृष्टीकोन म्हणून उदयास आले आहेत. गुगल आणि हांगझोऊ (Hangzhou) स्थित स्टार्टअप डीपसीक यांसारख्या कंपन्यांनी ही पद्धत वापरली आहे. यामध्ये कामांना डेटाच्या लहान संचांमध्ये विभागले जाते. हे एका तज्ञांच्या टीमप्रमाणे आहे, ज्यात प्रत्येकजण कामाच्या विशिष्ट भागावर लक्ष केंद्रित करतो, ज्यामुळे संपूर्ण प्रक्रिया ऑप्टिमाइझ होते.
GPU ची कमतरता दूर करणे
पारंपारिकपणे, MoE मॉडेल्सचे प्रशिक्षण हे Nvidia द्वारे उत्पादित केलेल्या ग्राफिक्स प्रोसेसिंग युनिट्स (GPUs) सारख्या उच्च-कार्यक्षमतेच्या चिप्सवर अवलंबून असते. या चिप्सची जास्त किंमत ही अनेक लहान कंपन्यांसाठी एक मोठा अडथळा ठरली आहे, ज्यामुळे MoE मॉडेल्सचा व्यापक वापर मर्यादित झाला आहे. तथापि, अँट मोठ्या भाषेच्या मॉडेल्सना (LLMs) अधिक कार्यक्षमतेने प्रशिक्षित करण्याच्या पद्धतींवर परिश्रमपूर्वक काम करत आहे, ज्यामुळे हा अडथळा दूर होत आहे. त्यांच्या संशोधन पेपरचे शीर्षक “प्रीमियम GPU शिवाय मॉडेल स्केल करणे” हेच ध्येय स्पष्टपणे दर्शवते.
Nvidia च्या वर्चस्वाला आव्हान
अँटचा दृष्टीकोन Nvidia चे CEO, जेन्सेन हुआंग (Jensen Huang) यांनी मांडलेल्या धोरणाला थेट आव्हान देतो. हुआंग यांनी सातत्याने सांगितले आहे की, डीपसीकच्या R1 सारख्या अधिक कार्यक्षम मॉडेल्सच्या उदयामुळे कम्प्युटेशनल मागणी वाढतच राहील. त्यांचा असा विश्वास आहे की कंपन्यांना खर्च कमी करण्यासाठी स्वस्त चिप्सऐवजी जास्त महसूल मिळवण्यासाठी चांगल्या चिप्सची आवश्यकता असेल. यामुळे, Nvidia ने वर्धित प्रोसेसिंग कोअर्स, ट्रान्झिस्टर आणि वाढीव मेमरी क्षमतेसह मोठे GPU तयार करण्यावर लक्ष केंद्रित केले आहे.
खर्चातील बचतीचे प्रमाण
अँटने आपल्या ऑप्टिमाइझ केलेल्या दृष्टीकोनाची किफायतशीरता दर्शविण्यासाठी ठोस आकडेवारी दिली आहे. कंपनीने सांगितले की उच्च-कार्यक्षमतेचे हार्डवेअर वापरून 1 ट्रिलियन टोकन्सचे प्रशिक्षण घेण्यासाठी अंदाजे 6.35 दशलक्ष युआन ($880,000) खर्च येईल. तथापि, कमी-विशिष्टतेचे हार्डवेअर आणि ऑप्टिमाइझ केलेल्या तंत्रांचा वापर करून, अँट हा खर्च 5.1 दशलक्ष युआनपर्यंत कमी करू शकते. टोकन्स हे माहितीचे युनिट्स दर्शवतात, ज्यावर मॉडेल प्रक्रिया करून जगाबद्दल शिकतात आणि वापरकर्त्यांच्या प्रश्नांना संबंधित प्रतिसाद देतात.
औद्योगिक उपायांसाठी AI प्रगतीचा लाभ घेणे
अँट आपल्या मोठ्या भाषेच्या मॉडेल्स, विशेषतः लिंग-प्लस (Ling-Plus) आणि लिंग-लाइट (Ling-Lite) मधील प्रगतीचा उपयोग आरोग्यसेवा आणि वित्त यांसारख्या क्षेत्रांसाठी औद्योगिक AI सोल्युशन्स विकसित करण्यासाठी करणार आहे. ही मॉडेल्स विशिष्ट उद्योगांच्या गरजा पूर्ण करण्यासाठी आणि अनुकूल उपाय प्रदान करण्यासाठी डिझाइन केलेली आहेत.
आरोग्य सेवेमध्ये AI ॲप्लिकेशन्सचा विस्तार
अँटची आरोग्यसेवेसाठीची बांधिलकी चिनी ऑनलाइन प्लॅटफॉर्म Haodf.com ला त्याच्या आर्टिफिशिअल इंटेलिजन्स सेवांमध्ये एकत्रित करण्यावरून दिसून येते. AI डॉक्टर असिस्टंट (AI Doctor Assistant) तयार करून, अँट Haodf च्या 290,000 डॉक्टरांच्या विस्तृत नेटवर्कला वैद्यकीय नोंदी व्यवस्थापनासारख्या कामांमध्ये मदत करण्याचा उद्देश ठेवते. AI चा हा वापर आरोग्य सेवा वितरणामध्ये कार्यक्षमता आणि अचूकता सुधारण्याची क्षमता ठेवतो.
दैनंदिन जीवनासाठी AI-चालित सहाय्य
आरोग्यसेवेव्यतिरिक्त, अँटने झिक्सियाओबाओ (Zhixiaobao) नावाचे AI ‘लाइफ असिस्टंट’ ॲप आणि मॅक्सियाओकाई (Maxiaocai) नावाची आर्थिक सल्लागार AI सेवा विकसित केली आहे. ही ॲप्लिकेशन्स दैनंदिन जीवनातील विविध पैलूंमध्ये AI समाकलित करण्याची अँटची महत्त्वाकांक्षा दर्शवतात, ज्यामुळे वापरकर्त्यांना वैयक्तिकृत आणि बुद्धिमान सहाय्य मिळते.
बेंचमार्किंग कामगिरी: लिंग मॉडेल्स विरुद्ध प्रतिस्पर्धी
आपल्या संशोधन पेपरमध्ये, अँटने दावा केला आहे की लिंग-लाइट मॉडेलने इंग्रजी-भाषेच्या आकलनासाठीच्या एका महत्त्वाच्या बेंचमार्कमध्ये मेटाच्या लामा (Llama) मॉडेलपेक्षा चांगली कामगिरी केली. याव्यतिरिक्त, लिंग-लाइट आणि लिंग-प्लस दोन्ही मॉडेल्सनी चिनी-भाषेच्या बेंचमार्कवर डीपसीकच्या समतुल्य मॉडेल्सपेक्षा चांगली कामगिरी दर्शविली. हे AI लँडस्केपमध्ये अँटची स्पर्धात्मक स्थिती दर्शवते.
बीजिंग (Beijing) स्थित AI सोल्युशन प्रदाता शेंगशांग टेक कंपनीचे (Shengshang Tech Co.) मुख्य तंत्रज्ञान अधिकारी रॉबिन यू (Robin Yu) यांनी म्हटल्याप्रमाणे, “जर तुम्हाला जगातील सर्वोत्तम कुंग फू मास्टरला हरवण्यासाठी एक मुद्दा सापडला, तरीही तुम्ही त्यांना हरवले असे म्हणू शकता, म्हणूनच वास्तविक-जगातील ॲप्लिकेशन महत्त्वाचे आहे.”
सहयोग आणि नवकल्पनांसाठी ओपन-सोर्सिंग
अँटने लिंग मॉडेल्स ओपन सोर्स केले आहेत, ज्यामुळे AI समुदायामध्ये सहयोग आणि नवकल्पना वाढण्यास मदत होईल. लिंग-लाइटमध्ये 16.8 अब्ज पॅरामीटर्स आहेत, जे मॉडेलची कार्यक्षमता नियंत्रित करणारे ॲडजस्टेबल सेटिंग्ज आहेत. दुसरीकडे, लिंग-प्लसमध्ये 290 अब्ज पॅरामीटर्स आहेत, ज्यामुळे ते मोठ्या भाषेच्या मॉडेल्समध्ये गणले जाते. संदर्भासाठी, तज्ञांचा अंदाज आहे की ChatGPT च्या GPT-4.5 मध्ये अंदाजे 1.8 ट्रिलियन पॅरामीटर्स आहेत, तर DeepSeek-R1 मध्ये 671 अब्ज पॅरामीटर्स आहेत.
मॉडेल प्रशिक्षणातील आव्हानांना सामोरे जाणे
या मॉडेल्सच्या विकासाच्या प्रवासात अँटला अनेक आव्हानांचा सामना करावा लागला. कंपनीला प्रशिक्षणाच्या काही क्षेत्रांमध्ये, विशेषतः स्थिरतेशी संबंधित अडचणी आल्या. हार्डवेअर किंवा मॉडेलच्या संरचनेत किरकोळ बदल केल्यास समस्या निर्माण होऊ शकतात, ज्यात मॉडेल्सच्या त्रुटी दरातील चढ-उतारांचा समावेश आहे. हे प्रगत AI मॉडेल्सच्या प्रशिक्षणात गुंतलेली जटिलता आणि संवेदनशीलता दर्शवते.
आरोग्य सेवेमध्ये वास्तविक-जगातील उपयोजन
अँटची व्यावहारिक उपयोजनांसाठीची बांधिलकी आरोग्य-केंद्रित मोठ्या मॉडेल मशिन्सच्या उपयोजनावरून दिसून येते. ही मशीन्स सध्या बीजिंग आणि शांघाय (Shanghai) सारख्या प्रमुख शहरांमधील सात रुग्णालये आणि आरोग्य सेवा प्रदात्यांद्वारे वापरली जात आहेत. मोठे मॉडेल वैद्यकीय सल्ला सेवा प्रदान करण्यासाठी DeepSeek R1, अलिबाबाचे Qwen आणि अँटचे स्वतःचे LLM वापरते.
वर्धित आरोग्य सेवांसाठी AI एजंट
मोठ्या मॉडेल मशिन्सव्यतिरिक्त, अँटने एंजेल (Angel) आणि यिबाओर (Yibaoer) नावाचे दोन वैद्यकीय AI एजंट सादर केले आहेत. एंजेलने आधीच 1,000 हून अधिक वैद्यकीय सुविधांना सेवा दिली आहे, तर यिबाओर वैद्यकीय विमा सेवांसाठी समर्थन प्रदान करते. याव्यतिरिक्त, मागील वर्षी सप्टेंबरमध्ये, अँटने आपल्या Alipay पेमेंट ॲपमध्ये AI हेल्थकेअर मॅनेजर (AI Healthcare Manager) सेवा सुरू केली, ज्यामुळे आरोग्य सेवा क्षेत्रात त्याची पोहोच आणखी वाढली. या उपक्रमांमुळे आरोग्य सेवा वितरणामध्ये बदल घडवण्यासाठी आणि सुधारणा करण्यासाठी AI चा लाभ घेण्याची अँटची समर्पण दर्शवते.