शंघाई गोकू टेक्नोलॉजीज द्वारा प्रस्तुत SASR प्रशिक्षण ढांचे का गहन विश्लेषण, यह दर्शाता है कि यह पारंपरिक तरीकों, अमेरिकी नीतियों और चीन के AI क्षेत्र में इसकी भूमिका को कैसे चुनौती दे सकता है।
गोकू के SASR प्रशिक्षण ढांचे को डिकोड करना
शंघाई गोकू टेक्नोलॉजीज, जिसकी स्थापना 2015 में हुई थी, ने एक नया AI प्रशिक्षण ढांचा पेश किया है जिसे SASR, या स्टेप-वाइज एडेप्टिव हाइब्रिड ट्रेनिंग कहा जाता है। इस दृष्टिकोण का उद्देश्य पर्यवेक्षित फ़ाइन-ट्यूनिंग (SFT) और सुदृढीकरण सीखने (RL) जैसी प्रचलित विधियों की कथित सीमाओं को दूर करना है। गोकू का तर्क है कि SASR, जिस तरह से मनुष्य तर्क कौशल विकसित करते हैं, उससे प्रेरित होकर, उन्नत AI मॉडल बनाने के लिए अधिक अनुकूली और कुशल मार्ग प्रदान करता है।
SFT और RL को AI प्रशिक्षण प्रक्रिया में आधारशिला माना जाता है, जिसका उपयोग OpenAI और DeepSeek जैसे उद्योग के दिग्गजों द्वारा किया जाता है। DeepSeek ने स्पष्ट रूप से अपने V3 मॉडल के प्रदर्शन को अनुकूलित करने में इन तकनीकों की महत्वपूर्ण भूमिका पर जोर दिया है, जिसे दिसंबर में जारी किया गया था और जिसने प्रौद्योगिकी क्षेत्र में महत्वपूर्ण रुचि जगाई थी।
शंघाई जिओ टोंग विश्वविद्यालय के शोधकर्ताओं और इसकी नवगठित AI सहायक कंपनी, शंघाई ऑलमाइंड आर्टिफिशियल इंटेलिजेंस टेक्नोलॉजी के साथ सह-लेखक गोकू के शोध पत्र के अनुसार, SASR, SFT, RL और स्थिर हाइब्रिड प्रशिक्षण पद्धतियों की तुलना में बेहतर प्रदर्शन प्रदर्शित करता है। "प्रयोगात्मक परिणाम बताते हैं कि SASR, SFT, RL और स्थिर हाइब्रिड प्रशिक्षण विधियों से बेहतर प्रदर्शन करता है," गोकू टीम ने अपने शोध पत्र में दावा किया।
गोकू की उन्नति के निहितार्थ
गोकू की AI प्रशिक्षण में सफलता कथित तौर पर AI क्षेत्र में चीन की निरंतर प्रगति को रेखांकित करती है। यह संभावित रूप से अमेरिकी सरकार द्वारा लागू की गई वर्तमान नीतियों की सीमाओं को उजागर करता है, जिसका उद्देश्य हार्डवेयर प्रतिबंधों के माध्यम से चीन की AI उन्नति को बाधित करना है। Nvidia के CEO जेन्सन हुआंग ने हाल ही में इन प्रतिबंधों की कथित अप्रभावीता पर टिप्पणी करते हुए कहा कि "चीन में दुनिया के 50 प्रतिशत AI डेवलपर हैं।"
DeepSeek, एक चीनी AI स्टार्टअप जो हाई-फ्लायर हेज फंड से उभरा है, ने उन्नत एल्गोरिदम और हार्डवेयर और सॉफ्टवेयर के एकीकरण के माध्यम से AI नेतृत्व के लिए चीन की क्षमता को प्रदर्शित करने के लिए व्यापक मान्यता प्राप्त की है।
गोकू की AI रणनीति में ऑलमाइंड की भूमिका
गोकू के शोध के प्रकाशन के साथ ही ऑलमाइंड की स्थापना, AI अनुसंधान और विकास के लिए संसाधनों को समर्पित करने के लिए एक रणनीतिक कदम का संकेत देती है। चीनी व्यवसाय रजिस्ट्री रिकॉर्ड बताते हैं कि ऑलमाइंड आधिकारिक तौर पर उसी दिन पंजीकृत किया गया था जब गोकू ने अपना शोध जारी किया था।
गोकू के संस्थापक और ऑलमाइंड के कानूनी प्रतिनिधि वांग जिओ ने कहा है कि नई इकाई को नई AI सीमाओं का पता लगाने के लिए बनाया गया था। यह हाई-फ्लायर द्वारा अपनाए गए दृष्टिकोण को दर्शाता है, जिसने 2023 में DeepSeek को एक अलग इकाई के रूप में स्थापित किया था।
पिछले साल के अंत तक, गोकू ने अपनी आधिकारिक वेबसाइट पर उपलब्ध जानकारी के अनुसार, AI-संचालित रणनीतियों का उपयोग करके घरेलू और अंतरराष्ट्रीय दोनों तरह की संपत्तियों में 15 बिलियन युआन (लगभग 2.1 बिलियन अमेरिकी डॉलर) से अधिक का प्रबंधन किया।
SASR में गहराई से उतरना: एक स्टेप-वाइज एडेप्टिव हाइब्रिड प्रशिक्षण ढांचा
गोकू का SASR ढांचा AI मॉडल प्रशिक्षण के परिदृश्य में एक दिलचस्प विकल्प प्रस्तुत करता है। इसकीसंभावित क्षमता की वास्तव में सराहना करने के लिए, इसके घटकों और कामकाज की अधिक विस्तृत समझ आवश्यक है।
SASR का "स्टेप-वाइज" पहलू एक बहु-स्तरीय प्रशिक्षण प्रक्रिया को दर्शाता है जहां AI मॉडल पुनरावृत्त परिष्करण से गुजरता है। प्रत्येक चरण में संभवतः विशिष्ट उद्देश्य होते हैं और मॉडल के भीतर विशेष क्षमताओं को विकसित करने के लिए विशिष्ट प्रशिक्षण डेटा का उपयोग किया जाता है। यह चरणबद्ध दृष्टिकोण स्क्रैच से जटिल मॉडल को प्रशिक्षित करने की चुनौतियों को कम करने और प्रत्येक चरण में अनुरूप अनुकूलन की अनुमति देने जैसे लाभ प्रदान कर सकता है।
"अनुकूली" तत्व बताता है कि प्रशिक्षण प्रक्रिया स्थिर नहीं है, लेकिन मॉडल के प्रदर्शन और विशेषताओं के प्रति गतिशील रूप से प्रतिक्रिया करती है। इस अनुकूलन क्षमता में हाइपरपैरामीटर को समायोजित करना, प्रशिक्षण डेटा वितरण को संशोधित करना या विभिन्न प्रशिक्षण उद्देश्यों के योगदान को गतिशील रूप से भारित करना शामिल हो सकता है। एक अनुकूली प्रक्रिया AI को अधिक प्रभावी ढंग से सीखने और सुधारने की अनुमति देती है।
SASR की "हाइब्रिड" प्रकृति से पता चलता है कि यह विभिन्न प्रशिक्षण पद्धतियों के तत्वों को जोड़ती है। यह एक महत्वपूर्ण पहलू है क्योंकि SFT और RL में ताकत और कमजोरियां हैं। विधियों का मिश्रण मॉडल को प्रत्येक दृष्टिकोण के लाभों का लाभ उठाने के साथ-साथ इसकी सीमाओं को दूर करने में सक्षम बनाता है। इन तीन विशेषताओं को एकीकृत करके, SARS सिद्धांत रूप से तर्क और तर्क विकसित करने के लिए बेहतर ढंग से तैयार किया गया है।
पारंपरिक विधियों के साथ SASR की तुलना करना
पर्यवेक्षित फाइन-ट्यूनिंग (SFT) पारंपरिक रूप से एक बड़े, लेबल वाले डेटासेट पर निर्भर करती है जहां AI मॉडल वांछित आउटपुट के लिए इनपुट को मैप करना सीखता है। सुदृढीकरण सीखने (RL) में परीक्षण और त्रुटि के माध्यम से मॉडल को प्रशिक्षित करना, एक विशिष्ट उद्देश्य को अधिकतम करने के लिए कार्यों को पुरस्कृत या दंडित करना शामिल है।
SASR दोनो को एकीकृत करने का प्रयास करता है, साथ ही प्रत्येक विधि की सीमाओं को दूर करता है। उदाहरण के लिए, SFT लेबल वाले डेटा की गुणवत्ता और व्यापकता पर बहुत अधिक निर्भर हो सकता है। कई वास्तविक दुनिया के परिदृश्यों में, पर्याप्त, सटीक डेटा प्राप्त करना समय लेने वाला और महंगा दोनों हो सकता है। RL, जबकि लेबल वाले डेटा की आवश्यकता नहीं होती है, अस्थिर हो सकता है और इनाम हैकिंग की संभावना होती है। इनाम हैकिंग तब होती है जब AI मॉडल अपने इनाम को अधिकतम करने के अनपेक्षित तरीकों की खोज करता है, जिससे संभावित रूप से अवांछित व्यवहार होता है।
गोकू के ढांचे में SFT और RL की सीमाओं पर सुधार होने की संभावना है। हालांकि, कंपनी के पेपर में प्रलेखित प्रारंभिक परिणामों को सत्यापित करने के लिए आगे और निरंतर परीक्षण की आवश्यकता है।
एल्गोरिथम नवाचार और हार्डवेयर बाधाएं
गोकू के SASR ढांचे की खबर विशेष रूप से अमेरिका-चीन तकनीकी संबंधों के संदर्भ में प्रासंगिक है। कुछ समय से, अमेरिकी सरकार ने Nvidia जैसी कंपनियों से उन्नत कंप्यूटिंग हार्डवेयर, विशेष रूप से उच्च-अंत GPU तक पहुंच को प्रतिबंधित करके AI क्षेत्र में चीन के उदय को कम करने का प्रयास किया है। इन प्रतिबंधों के पीछे विचार यह है कि शक्तिशाली हार्डवेयर तक चीन की पहुंच को सीमित करने से उनके AI विकास के प्रयासों में धीमापन आएगा।
हालांकि, Nvidia के CEO जेन्सन हुआंग की टिप्पणियों और चीनी AI प्रयोगशालाओं से उभरने वाली प्रगति से पता चलता है कि ये नीतियां उतने प्रभावी नहीं हो सकती हैं जितना कि इरादा था। हुआंग ने प्रसिद्ध रूप से कहा है कि चीन दुनिया के AI डेवलपर प्रतिभा का एक महत्वपूर्ण हिस्सा रखता है, और हार्डवेयर पहुंच को प्रतिबंधित करने से उन्हें वैकल्पिक समाधान खोजने के लिए प्रोत्साहित किया जा सकता है।
गोकू द्वारा दावा की गई AI सफलता से पता चलता है कि एल्गोरिथम नवाचार संभावित रूप से हार्डवेयर सीमाओं की भरपाई कर सकता है, कम से कम कुछ हद तक। यदि चीनी शोधकर्ता अधिक कुशल प्रशिक्षण एल्गोरिदम विकसित कर सकते हैं, तो वे कम शक्तिशाली हार्डवेयर के साथ तुलनीय AI प्रदर्शन प्राप्त करने में सक्षम हो सकते हैं। इसका वैश्विक AI परिदृश्य पर महत्वपूर्ण प्रभाव पड़ सकता है, क्योंकि इससे पता चलता है कि चीन चल रहे प्रतिबंधों के बावजूद अपनी AI क्षमताओं को आगे बढ़ाना जारी रख सकता है।
यह नहीं कहना है कि हार्डवेयर अप्रासंगिक है। उन्नत GPU अभी भी अत्याधुनिक AI मॉडल को प्रशिक्षित करने के लिए महत्वपूर्ण हैं, और नवीनतम हार्डवेयर तक पहुंच निस्संदेह एक महत्वपूर्ण प्रतिस्पर्धी लाभ प्रदान करती है। हालांकि, गोकू का काम हार्डवेयर और सॉफ्टवेयर दोनों में निवेश करने के महत्व को दर्शाता है, और एक क्षेत्र में प्रगति संभावित रूप से दूसरे में सीमाओं की भरपाई कर सकती है।
चीनी AI का उदय: DeepSeek से आगे
AI क्षेत्र में DeepSeek का एक प्रमुख खिलाड़ी के रूप में उभरना एक उत्प्रेरक रहा है, जो इस परिवर्तनकारी तकनीक में वैश्विक नेता बनने के लिए चीन के दृढ़ संकल्प को दर्शाता है। हालांकि, DeepSeek केवल एक उदाहरण है, और गोकू का SASR प्रशिक्षण ढांचे के साथ उदय, चीनी AI पारिस्थितिकी तंत्र के भीतर बढ़ती ताकत और नवाचार को और अधिक दर्शाता है।
इस गति में कई कारक योगदान करते हैं। सबसे पहले, चीन के पास डेटा का एक विशाल पूल है, जो AI মডেল को प्रशिक्षित करने के लिए आवश्यक है। बड़ी आबादी और डिजिटल तकनीकों को व्यापक रूप से अपनाने के साथ, चीनी कंपनियों को विशाल डेटासेट तक पहुंच प्राप्त है जिनका उपयोग उनके AI एल्गोरिदम को विकसित और परिष्कृत करने के लिए किया जा सकता है।
दूसरा, चीन STEM शिक्षा पर बहुत जोर देता है, जिससे प्रतिभाशाली इंजीनियरों और वैज्ञानिकों की एक बड़ी संख्या का उत्पादन होता है। इसने AI और संबंधित क्षेत्रों में नवाचार को चलाने में सक्षम एक अत्यधिक कुशल कार्यबल बनाया है।
तीसरा, चीनी सरकार ने AI को एक रणनीतिक प्राथमिकता दी है, अनुसंधान और विकास के लिए महत्वपूर्ण funding और समर्थन प्रदान किया है। इसने AI स्टार्टअप के लिए एक उपजाऊ वातावरण बनाया है और शिक्षाविदों और उद्योग के बीच सहयोग को बढ़ावा दिया है।
अंत में, चीनी कंपनियां अक्सर नवाचार के लिए अधिक व्यावहारिक और जोखिम लेने वाला दृष्टिकोण अपनाने को तैयार रहती हैं, जो उन्हें जल्दी से आगे बढ़ने और नए विचारों के साथ प्रयोग करने की अनुमति देता है।
इन कारकों के परिणामस्वरूप, चीन AI क्षमताओं के मामले में अमेरिका से तेजी से आगे निकल रहा है। जबकि अमेरिका अभी भी कुछ क्षेत्रों में बढ़त बनाए हुए है, जैसे कि बुनियादी अनुसंधान और उच्च-अंत हार्डवेयर, चीन कंप्यूटर विज़न, प्राकृतिक भाषा प्रसंस्करण और रोबोटिक्स जैसे क्षेत्रों में महत्वपूर्ण प्रगति कर रहा है।
गोकू और DeepSeek जैसी कंपनियों का उदय बताता है कि चीन आने वाले वर्षों में AI क्षेत्र में अपनी वृद्धि जारी रखने के लिए अच्छी स्थिति में है।
शंघाई गोकू टेक्नोलॉजीज: नवाचार के पीछे कंपनी
शंघाई गोकू टेक्नोलॉजीज एक मात्रात्मक ट्रेडिंग फंड है जिसकी स्थापना 2015 में हुई थी। यह AI-संचालित रणनीतियों का उपयोग करके महत्वपूर्ण संपत्तियों का प्रबंधन करता है। कंपनी का घोषित मिशन अपने ग्राहकों के लिए बेहतर रिटर्न देने के लिए "प्रौद्योगिकी और मौलिक विश्लेषण को जोड़ना" है। परिसंपत्ति प्रबंधन में अपने मूल व्यवसाय के अलावा, गोकू ने AI अनुसंधान की सीमाओं को आगे बढ़ाने की प्रतिबद्धता का प्रदर्शन किया है। AI सहायक कंपनी ऑलमाइंड आर्टिफिशियल इंटेलिजेंस टेक्नोलॉजी, अपने AI अनुसंधान प्रयासों को औपचारिक रूप देने और गति देने के लिए एक रणनीतिक कदम का प्रतिनिधित्व करती है।
कंपनी की आंतरिक संरचना और परिचालन गतिशीलता के बारे में विवरण अपेक्षाकृत दुर्लभ है। हालांकि, इसके सार्वजनिक बयान और हालिया गतिविधियां इसके दृष्टिकोण में अंतर्दृष्टि प्रदान करती हैं। कंपनी का नारा, जिसका अनुवाद "तर्क और सच्चाई ही एकमात्र सिद्धांत हैं जिनका हम पालन करते हैं", एक डेटा-संचालित और विश्लेषणात्मक culture को दर्शाता है। AI अनुसंधान और विकास में निवेश एक दीर्घकालिक दृष्टि और AI की परिवर्तनकारी क्षमता के बारे में जागरूकता को इंगित करता है, न केवल वित्तीय क्षेत्र के भीतर बल्कि विभिन्न उद्योगों में भी। यह संभावना है कि गोकू अपने व्यापार रणनीतियों में सुधार करने और बाजार में प्रतिस्पर्धात्मक बढ़त हासिल करने के लिए AI अनुसंधान से अंतर्दृष्टि का लाभ उठाने का इरादा रखता है।