शांघाय फंडचा AI मध्ये मोठा दावा: DeepSeek ला टक्कर?

शांघायस्थित (Shanghai-based) एका क्वांटिटेटिव्ह ट्रेडिंग फंडने (quantitative trading fund) आर्टिफिशियल इंटेलिजन्सच्या (Artificial Intelligence - AI) क्षेत्रात एक महत्त्वाचा दावा केला आहे. एका आंतरराष्ट्रीय परिषदेमध्ये (international conference) सादर केलेल्या त्यांच्या रिसर्च पेपरमध्ये (research paper), त्यांनी एक नवीन प्रशिक्षण तंत्र (training technique) विकसित केल्याचा दावा केला आहे, जे DeepSeek 2.0 सारख्या AI प्रशिक्षण पद्धतींना आव्हान देऊ शकते. या नवीन तंत्रामुळे AI अल्गोरिदम्समध्ये मोठी प्रगती होण्याची शक्यता आहे.

गोकूच्या (Goku) SASR ट्रेनिंग फ्रेमवर्कचे (SASR Training Framework) विश्लेषण

२०१५ मध्ये स्थापित शांघाय गोकू टेक्नॉलॉजीजने (Shanghai Goku Technologies) SASR (स्टेप-वाइज ॲडॉप्टिव्ह हायब्रिड ट्रेनिंग - step-wise adaptive hybrid training) नावाचे एक नवीन AI ट्रेनिंग फ्रेमवर्क सादर केले आहे. सुपरवाईज्ड फाइन-ट्यूनिंग (Supervised Fine-Tuning - SFT) आणि रिइन्फोर्समेंट लर्निंग (Reinforcement Learning - RL) यांसारख्या प्रचलित पद्धतींच्या मर्यादांवर मात करण्याचा या नवीन तंत्रज्ञानाचा उद्देश आहे. गोकूचा (Goku) दावा आहे की, SASR हे मानवी तर्कशक्ती (reasoning skills) विकसित करण्याच्या पद्धतीवर आधारित आहे, ज्यामुळे प्रगत AI मॉडेल्स (advanced AI models) अधिक प्रभावीपणे तयार करता येतात.

SFT आणि RL या AI प्रशिक्षणाच्या महत्त्वाच्या पद्धती आहेत, ज्यांचा उपयोग OpenAI आणि DeepSeek सारख्या मोठ्या कंपन्या करतात. DeepSeek ने त्यांच्या V3 मॉडेलच्या (model) कामगिरीत सुधारणा करण्यासाठी या तंत्रांच्या भूमिकेवर विशेष भर दिला आहे. डिसेंबरमध्ये (December) रिलीज (release) झालेल्या V3 मॉडेलने (model) तंत्रज्ञान क्षेत्रात खूप लक्ष वेधले आहे.

शांघाय जियाओ टोंग युनिव्हर्सिटी (Shanghai Jiao Tong University) आणि गोकूच्या (Goku) AI सब्सिडियरी (subsidiary) शांघाय ऑलमाइंड आर्टिफिशियल इंटेलिजन्स टेक्नॉलॉजीच्या (Shanghai AllMind Artificial Intelligence Technology) संशोधकांनी SASR हे SFT, RL आणि स्टॅटिक हायब्रिड ट्रेनिंग (static hybrid training) पद्धतींपेक्षा अधिक प्रभावी असल्याचे सांगितले आहे. गोकू टीमने (Goku team) त्यांच्या रिसर्च पेपरमध्ये (research paper) नमूद केले आहे की, “SASR ने SFT, RL आणि स्टॅटिक हायब्रिड ट्रेनिंग (static hybrid training) पद्धतींपेक्षा उत्तम कामगीरी दर्शवली आहे.”

गोकूच्या (Goku) प्रगतीचा अर्थ

गोकूच्या (Goku) AI प्रशिक्षणातील (training) यश चीनने (China) AI क्षेत्रात केलेल्या प्रगतीचा पुरावा आहे. अमेरिकेच्या (U.S. government)hardware निर्बंधांच्या धोरणांना यामुळे आव्हान मिळू शकते. Nvidia चे CEO जेनसेन हुआंग (Jensen Huang) यांनी अलीकडेच या निर्बंधांच्या निष्प्रभावीतेवर टिप्पणी केली आहे. ते म्हणाले, “जगातील ५० टक्के AI डेव्हलपर्स (developers) चीनमध्ये (China) आहेत.”

DeepSeek, जी High-Flyer हेज फंडातून (hedge fund) उदयास आलेली एक चीनी AI स्टार्टअप (startup) आहे, तिने प्रगत अल्गोरिदम्स (advanced algorithms) आणि हार्डवेअर (hardware) आणि सॉफ्टवेअरच्या (software) एकत्रीकरणामुळे चीनची (China) AI क्षेत्रातील क्षमता दर्शवली आहे.

गोकूच्या (Goku) AI रणनीतीमध्ये (strategy) ऑलमाइंडची (AllMind) भूमिका

ऑलमाइंडची (AllMind) स्थापना आणि गोकूच्या (Goku) रिसर्चचे (research) प्रकाशन एकाच वेळी झाले, यावरून AI रिसर्च (research) आणि डेव्हलपमेंटसाठी (development) संसाधने समर्पित करण्याची योजना दिसून येते. चीनी व्यवसाय नोंदणी records नुसार, ऑलमाइंडची (AllMind) नोंदणी (registered) त्याच दिवशी झाली ज्या दिवशी गोकूने (Goku) आपले रिसर्च (research) प्रकाशित केले.

गोकूचे (Goku) संस्थापक (founder) आणि ऑलमाइंडचे (AllMind) कायदेशीर प्रतिनिधी वांग शियाओ (Wang Xiao) यांनी सांगितले की, नवीन AI शक्यता शोधण्यासाठी ही नवीन कंपनी (entity) तयार करण्यात आली आहे. High-Flyer ने 2023 मध्ये DeepSeek ची स्थापना केली, त्याच धर्तीवर हे करण्यात आले आहे.

गेल्या वर्षाच्या अखेरीस, गोकूने (Goku) देशांतर्गत (domestic) आणि आंतरराष्ट्रीय स्तरावर (international level) AI-आधारित रणनीती (strategies) वापरून १५ अब्ज युआन (जवळपास US$ २.१ अब्ज) पेक्षा जास्त मालमत्ता व्यवस्थापित (managed) केली आहे, अशी माहिती त्यांच्या अधिकृत (official) वेबसाइटवर (website) उपलब्ध आहे.

SASR मध्ये अधिक माहिती: स्टेप-वाइज ॲडॉप्टिव्ह हायब्रिड ट्रेनिंग फ्रेमवर्क (Step-Wise Adaptive Hybrid Training Framework)

AI मॉडेल ट्रेनिंगच्या (model training) क्षेत्रात गोकूचे (Goku) SASR फ्रेमवर्क (framework) एक चांगला पर्याय आहे. याची क्षमता (potential) समजून घेण्यासाठी, त्याचे घटक (components) आणि कार्यप्रणाली (workings) सविस्तरपणे समजून घेणे आवश्यक आहे.

SASR चा “स्टेप-वाइज” (step-wise) दृष्टिकोन दर्शवितो की, AI मॉडेल (model) अनेक टप्प्यातून (multi-stage) सुधारित (refinement) केले जाते. प्रत्येक टप्प्यात विशिष्ट (specific) उद्दिष्टे (objectives) असतात आणि मॉडेलमध्ये (model) क्षमता (capabilities) विकसित करण्यासाठी वेगळ्या ट्रेनिंग डेटाचा (training data) वापर केला जातो. या टप्प्याटप्प्याने केलेल्या दृष्टिकोन complex मॉडेलला (complex model) सुरवातीपासून ट्रेनिंग (training) देण्याच्या समस्या कमी करतो आणि प्रत्येक टप्प्यावर optimization (अनुकूलन) करण्यास मदत करतो.

“ॲडॉप्टिव्ह” (adaptive) घटक दर्शवितो की, ट्रेनिंगची (training) प्रक्रिया स्थिर (static) नाही, तर मॉडेलच्या (model) कामगिरीनुसार (performance) आणि वैशिष्ट्यांनुसार (characteristics) बदलते. या adaptibility मध्ये हायपरपॅरामीटर्स ॲडजस्ट (hyperparameters adjust) करणे, ट्रेनिंग डेटा डिस्ट्रीब्यूशनमध्ये (training data distribution) बदल करणे किंवा वेगवेगळ्या ट्रेनिंग (training) उद्दिष्टांचे (objectives) योगदान dynamically वेट (weight) करणे इत्यादींचा समावेश असू शकतो. ॲडॉप्टिव्ह (adaptive) प्रक्रिया AI ला अधिक प्रभावीपणे शिकण्यास आणि सुधारण्यास मदत करते.

SASR चा “हायब्रिड” (hybrid) भाग दर्शवितो की, ते वेगवेगळ्या ट्रेनिंग पद्धतींचे (training methodologies) घटक (elements) एकत्र करते. SFT आणि RL मध्ये काही strength (सामर्थ्य) आणि weakness (कमजोरी) आहेत. पद्धतींचे मिश्रण (blend) मॉडेलला (model) प्रत्येक दृष्टिकोनाचा फायदा घेण्यास आणि मर्यादांवर मात करण्यास सक्षम करते. एकत्रितपणे या तीन वैशिष्ट्यांचा वापर केल्यामुळे, SASR तर्क (logic) आणि विचारशक्ती (reasoning) विकसित करण्यासाठी अधिक उपयुक्त आहे.

पारंपरिक (traditional) पद्धतींशी SASR ची तुलना

सुपरवाईज्ड फाइन-ट्यूनिंग (SFT) मोठ्या, लेबल असलेल्या डेटासेटवर (labelled dataset) अवलंबून असते. यामध्ये AI मॉडेल (model) इनपुटला (input) अपेक्षित आउटपुटमध्ये (output) रूपांतरित (map) करायला शिकते. रिइन्फोर्समेंट लर्निंगमध्ये (RL) trial and error (प्रयत्न आणि त्रुटी) द्वारे मॉडेलला (model) ट्रेनिंग (training) दिले जाते, ज्यामध्ये विशिष्ट (specific) उद्दिष्टे (objective) साध्य करण्यासाठी actions ना reward (बक्षीस) किंवा penalty (शिक्षा) दिली जाते.

SASR या दोन्ही पद्धती एकत्र करण्याचा प्रयत्न करते आणि त्याच वेळी त्यांच्या मर्यादांवर मात करते. उदाहरणार्थ, SFT लेबल असलेल्या डेटाच्या (labelled data) गुणवत्तेवर आणि विस्तृततेवर (comprehensiveness) मोठ्या प्रमाणावर अवलंबून असते. अनेक वास्तविक (real-world) परिस्थितींमध्ये पुरेसा (sufficient) आणि अचूक (accurate) डेटा (data) मिळवणे वेळखाऊ आणि खर्चिक असू शकते. RL ला लेबल असलेल्या डेटाची (labelled data) आवश्यकता नसते, परंतु ते अस्थिर (unstable) आणि reward hacking प्रवण (prone) असू शकते. Reward hacking तेव्हा होते, जेव्हा AI मॉडेलला (model) त्याचे reward (बक्षीस) वाढवण्याचे अनपेक्षित (unintended) मार्ग सापडतात, ज्यामुळे undesired behavior (अवांछित वर्तन) होऊ शकते.

गोकूचे (Goku) फ्रेमवर्क (framework) SFT आणि RL च्या मर्यादांवर मात करून सुधारणा (improvement) करण्याची क्षमता (possibility) ठेवते. तथापि, कंपनीच्या पेपरमध्ये (paper) नोंदवलेल्या सुरुवातीच्या (initial) निकालांची पडताळणी (verify) करण्यासाठी पुढील (further) आणि सतत (continued) चाचणी (testing) करणे आवश्यक आहे.

अल्गोरिदमिक (algorithmic) नवोपक्रम (innovation) आणि हार्डवेअर (hardware) मर्यादा

गोकूच्या (Goku) SASR फ्रेमवर्कची (framework) बातमी US-China tech संबंधांच्या संदर्भात (context) महत्त्वपूर्ण (relevant) आहे. बऱ्याच काळापासून, अमेरिकन सरकारने (US government) AI क्षेत्रात चीनची (China) वाढ रोखण्यासाठी प्रगत (advanced) computing हार्डवेअरच्या (hardware) वापरावर निर्बंध (restrictions) लादले आहेत, विशेषत: Nvidia सारख्या कंपन्यांच्या high-end GPUs वर. या निर्बंधां (restrictions)मागील कल्पना (idea) अशी आहे की, शक्तिशाली (powerful) हार्डवेअरमध्ये (hardware) चीनचा (China) प्रवेश (access) मर्यादित (limit) केल्याने त्यांच्या AI विकासाचा वेग मंदावेल.

तथापि, Nvidia चे CEO जेनसेन हुआंग (Jensen Huang) यांच्या टिप्पण्या (comments) आणि चीनी AI प्रयोगशाळांमधून (labs) समोर येणाऱ्या प्रगती (advancements) दर्शवतात की, ही धोरणे (policies) तितकी प्रभावी (effective) नसू शकतात. हुआंग (Huang) यांनी नमूद केले आहे की, चीनमध्ये (China) जगातील AI डेव्हलपर्सचा (developers) मोठा भाग (significant portion) आहे आणि हार्डवेअरचा (hardware) प्रवेश (access) प्रतिबंधित (restrict) केल्याने त्यांना वैकल्पिक (alternative) उपाय (solutions) शोधण्यासाठी प्रोत्साहन (incentivize) मिळू शकते.

गोकूचा (Goku) AI मधील breakthrough (यश) दर्शवितो की, algorithmic innovation (अल्गोरिदमिक नवोपक्रम) काही प्रमाणात (extent) हार्डवेअर (hardware) मर्यादांना ऑफसेट (offset) करू शकते. जर चीनी संशोधक (researchers) अधिक कार्यक्षम (efficient) ट्रेनिंग अल्गोरिदम्स (training algorithms) विकसित करू शकले, तर ते कमी शक्तिशाली (less powerful) हार्डवेअरसह (hardware) AI ची तुलनात्मक (comparable) कामगिरी (performance) साध्य (achieve) करू शकतात. याचे जागतिक (global) AI परिदृश्यावर (landscape) महत्त्वपूर्ण (significant) परिणाम (implications) होऊ शकतात, कारण चीन (China) सध्याच्या (ongoing) निर्बंधांनंतरही (restrictions) आपली AI क्षमता (capabilities) विकसित (advancing) करणे सुरू ठेवू शकेल.

याचा अर्थ असा नाही की हार्डवेअर (hardware) अप्रासंगिक (irrelevant) आहे. अत्याधुनिक (cutting-edge) AI मॉडेलला (model) ट्रेनिंग (training) देण्यासाठी प्रगत (advanced) GPUs अजूनही महत्त्वाचे (critical) आहेत आणि नवीनतम (latest) हार्डवेअरमध्ये (hardware) प्रवेश (access) केल्याने नि:संशयपणे (undoubtedly) एक महत्त्वपूर्ण (significant) स्पर्धात्मक (competitive) advantage ( फायदा) मिळतो. तथापि, गोकूचे (Goku) कार्य (work) हार्डवेअर (hardware) आणि सॉफ्टवेअर (software) या दोन्हीमध्ये गुंतवणूक (investing) करण्याचे महत्त्व (importance) दर्शवते आणि एका क्षेत्रातील (area) प्रगती (progress) दुसर्‍या क्षेत्रातील (area) मर्यादांची भरपाई (compensate) करू शकते.

चीनी (Chinese) AI चा उदय (rise): DeepSeek च्या पलीकडे

AI क्षेत्रात DeepSeek चा उदय (emergence) एक महत्त्वाचा (prominent) खेळाडू (player) म्हणून झाला आहे. या transformative technology ( transformational technology) मध्ये जागतिक (global) नेता (leader) बनण्याची चीनची (China) इच्छाशक्ती (determination) दर्शवते. DeepSeek हे फक्त एक उदाहरण (example) आहे. SASR ट्रेनिंग फ्रेमवर्कसह (training framework) गोकूचा (Goku) उदय (rise) चीनी (Chinese) AI इकोसिस्टममधील (ecosystem) वाढती (growing) ताकद (strength) आणि नवोपक्रम (innovation) दर्शवितो.

या गतीला (momentum) अनेक घटक (factors) कारणीभूत (contribute) आहेत. सर्वप्रथम, चीनमध्ये (China) डेटाचा (data) मोठा (vast) साठा (pool) आहे, जो AI मॉडेलना (models) ट्रेनिंग (training) देण्यासाठी आवश्यक (essential) आहे. मोठ्या (large) लोकसंख्येमुळे (population) आणि डिजिटल टेक्नॉलॉजीजच्या (digital technologies) व्यापक (widespread) स्वीकृतीमुळे (adoption), चीनी (Chinese) कंपन्यांना मोठ्या (massive) डेटासेट्समध्ये (datasets) प्रवेश (access) मिळतो, ज्याचा उपयोग AI अल्गोरिदम्स (algorithms) विकसित (develop) आणि सुधारण्यासाठी (refine) केला जाऊ शकतो.

दुसरे म्हणजे, चीनमध्ये (China) STEM शिक्षणावर (education) (विज्ञान, तंत्रज्ञान, अभियांत्रिकी आणि गणित) जोरदार (strong) भर (emphasis) दिला जातो, ज्यामुळे मोठ्या (large) संख्येने (number) प्रतिभाशाली (talented) अभियंते (engineers) आणि शास्त्रज्ञ (scientists) तयार होतात. यामुळे AI आणि संबंधित (related) क्षेत्रांतील (fields) नवोपक्रमांना (innovation) चालना (driving) देण्यासाठी उच्च (highly) कुशल (skilled) मनुष्यबळ (workforce) तयार झाले आहे.

तिसरे म्हणजे, चीनी (Chinese) सरकारने (government) AI ला एक धोरणात्मक (strategic) प्राधान्य (priority) दिले आहे आणि संशोधन (research) आणि विकासासाठी (development) महत्त्वपूर्ण (significant) निधी (funding) आणि समर्थन (support) पुरवले आहे. यामुळे AI स्टार्टअप्ससाठी (startups) एक fertile environment (उपजाऊ वातावरण) तयार झाले आहे आणि शिक्षण (academia) आणि उद्योग (industry) यांच्यात सहकार्य (collaboration) वाढले आहे.

शेवटी, चीनी (Chinese) कंपन्या (companies) नवोपक्रमासाठी (innovation) अधिक pragmatic (व्यवहार्य) आणि risk-taking (धोका पत्करण्यास तयार) दृष्टिकोन (approach) स्वीकारण्यास तयार असतात, ज्यामुळे त्यांना लवकर (quickly) पुढे सरकता येते (move) आणि नवीन (new) कल्पनांचा (ideas) प्रयोग (experiment) करता येतो.

या घटकांमुळे (factors) चीन (China) AI क्षमतांच्या (capabilities) बाबतीत अमेरिकेच्या (US) जवळपास पोहोचत आहे. अमेरिका अजूनही मूलभूत (fundamental) संशोधन (research) आणि high-end हार्डवेअर (hardware) यांसारख्या काही क्षेत्रांमध्ये (areas) आघाडीवर (lead) असले, तरी चीन (China) computer vision (कॉम्प्युटर व्हिजन), natural language processing (नैसर्गिक भाषा प्रक्रिया) आणि रोबोटिक्स (robotics) यांसारख्या क्षेत्रांमध्ये (areas) महत्त्वपूर्ण (significant) प्रगती (strides) करत आहे.

गोकू (Goku) आणि DeepSeek सारख्या कंपन्यांचा (companies) उदय (emergence) दर्शवितो की, चीन (China) येत्या (coming) वर्षांमध्ये (years) AI क्षेत्रात (domain) आपली वाढ (rise) सुरू ठेवण्यासाठी सज्ज (well-positioned) आहे.

शांघाय गोकू टेक्नॉलॉजीज: (Shanghai Goku Technologies) नवोपक्रमामागील कंपनी (company)

शांघाय गोकू टेक्नॉलॉजीज (Shanghai Goku Technologies) ही २०१५ मध्ये (in 2015) स्थापित (founded) केलेली क्वांटिटेटिव्ह ट्रेडिंग फंड (quantitative trading fund) आहे. हे AI-आधारित (driven) रणनीती (strategies) वापरून महत्त्वपूर्ण (significant) मालमत्ता (assets) व्यवस्थापित (manages) करते. कंपनीचे (company) उद्दिष्ट (mission) "तंत्रज्ञान (technology) आणि मूलभूत (fundamental) विश्लेषणाचे (analysis) संयोजन (combine) करून आपल्या ग्राहकांसाठी (clients) चांगले (better) उत्पन्न (returns) मिळवणे” आहे. ॲसेट मॅनेजमेंटमधील (asset management) मुख्य (core) व्यवसायाव्यतिरिक्त (business), गोकूने (Goku) AI संशोधनाच्या (research) सीमा (boundaries) पुढे ढकलण्याची बांधिलकी (commitment) दर्शविली आहे. ऑलमाइंड आर्टिफिशियल इंटेलिजन्स टेक्नॉलॉजी (AllMind Artificial Intelligence Technology), AI सब्सिडियरी (subsidiary), AI संशोधनाच्या (research) प्रयत्नांना (efforts) औपचारिक (formalize) आणि गती (accelerate) देण्याचे धोरणात्मक (strategic) पाऊल (move) दर्शवते.

कंपनीच्या (company) अंतर्गत (internal) संरचने (structure) आणि कार्यात्मक (operational) गतिशीलतेबद्दल (dynamics) तपशील (details) तुलनेने (relatively) कमी (scarce) आहेत. तथापि (however), तिची (its) सार्वजनिक (public) विधाने (statements) आणि अलीकडील (recent) क्रियाकलाप (activities) तिच्या (its) दृष्टिकोनाबद्दल (approach) माहिती (insights) देतात. कंपनीचे (company) घोषवाक्य (slogan) “तर्क (logic) आणि सत्य (truth) हेच आमचे (we obey) एकमेव (only) सिद्धांत (principles) आहेत”, हे डेटा-आधारित (data driven) आणि विश्लेषणात्मक (analytical) संस्कृती (culture) दर्शवते. AI संशोधनातील (research) आणि विकासातील (development) गुंतवणूक (investment) दीर्घकालीन (long-term) दृष्टीकोन (vision) आणि AI च्या transformative (transformative) क्षमतेची (potential) जाणीव (awareness) दर्शवते, केवळ (only) आर्थिक (financial) क्षेत्रातच (sector) नव्हे (not), तर विविध (various) उद्योगांमध्येही (industries). AI संशोधनातून (research) मिळालेल्या (insights) माहितीचा (leverage) उपयोग (intends) करून, गोकू (Goku) आपल्या ट्रेडिंग स्ट्रॅटेजीजमध्ये (trading strategies) सुधारणा (improve) करण्याचा (leverage) आणि बाजारात (market) स्पर्धात्मक (competitive) advantage (फायदा) मिळवण्याचा (gain) मानस (intends) आहे.