चीन में AI तकनीक के तेजी से विकास ने कई स्टार्टअप के लिए उत्साह और अनिश्चितता दोनों पैदा की हैं। कभी महत्वाकांक्षी लक्ष्यों से भरे, कुछ कंपनियां अब अपनी रणनीतियों को पुन: व्यवस्थित कर रही हैं, और एक प्रतिस्पर्धी और संसाधन-गहन बाजार की कठोर वास्तविकताओं का सामना कर रही हैं।
भव्य दृष्टिकोण से रणनीतिक बदलाव
चीन के ‘AI छोटे बाघों’ में से एक, Baichuan Intelligent के CEO के एक हालिया आंतरिक पत्र में कंपनी की दूसरी वर्षगांठ को चिह्नित किया गया और एक रणनीतिक बदलाव पर प्रकाश डाला गया। चिकित्सा अनुप्रयोगों को प्राथमिकता देते हुए, ध्यान संकुचित होगा। यह OpenAI के समान एक अभूतपूर्व नींव मॉडल बनाने के अपने शुरुआती मिशन के विपरीत था, जो नवीन अनुप्रयोगों से परिपूर्ण था।
इसी तरह, एक अन्य ‘छोटे बाघ’ 01.AI के संस्थापक ली कैइफू ने जनवरी में घोषणा की कि उनकी कंपनी ‘छोटे लेकिन सुंदर’ दृष्टिकोण को अपनाएगी। यह AGI के आगमन को गति देने के लिए AI 2.0 प्लेटफॉर्म बनाने के भव्य दृष्टिकोण से एक उल्लेखनीय प्रस्थान था।
इन रणनीतिक पीछे हटने ने अटकलों को हवा दी है, कुछ पर्यवेक्षकों का सुझाव है कि ये ‘छोटे बाघ’ ‘बीमार बिल्लियों’ की तरह होते जा रहे हैं। निरंतर परिवर्तन के इस माहौल में, ये कंपनियां अपना भविष्य कैसे सुरक्षित कर सकती हैं?
इस प्रश्न का उत्तर देने के लिए, Zhiwei की संपादकीय टीम ने बड़े मॉडल प्रौद्योगिकी विशेषज्ञों, वित्त और स्वास्थ्य सेवा में AI विशेषज्ञों और प्रमुख कंपनियों के AI तकनीकी विशेषज्ञों सहित विभिन्न विशेषज्ञों से जानकारी मांगी।
DeepSeek प्रभाव और बदलती रणनीतियाँ
AI परिदृश्य DeepSeek की विस्फोटक लोकप्रियता के बाद नाटकीय रूप से बदल गया, जिसने बाजार को हिला दिया। एक दुर्जेय योद्धा की तरह, DeepSeek ने परिदृश्य को बाधित किया, जिससे कई AI कंपनियों को अपनी स्थिति का पुनर्मूल्यांकन करने और विभिन्न रास्तों का अनुसरण करने के लिए मजबूर होना पड़ा।
हालांकि, यह परिवर्तन कई लोगों की तुलना में पहले शुरू हुआ था। एक बड़े मॉडल प्रौद्योगिकी विशेषज्ञ वांग वेनगुआंग के अनुसार, कुछ चीनी AI कंपनियों ने DeepSeek V3 और R1 की रिलीज से पहले ही बड़े मॉडल प्रशिक्षण का पीछा करना छोड़ दिया था। लागत बहुत अधिक थी, और इन कंपनियों को DeepSeek V2.5 और Alibaba के Qwen 70B जैसे स्वतंत्र रूप से उपलब्ध और ओपन-सोर्स विकल्पों के साथ प्रतिस्पर्धा करने में असमर्थता महसूस हुई।
AI प्रौद्योगिकी सेवा उद्यम के एक विशेषज्ञ लियांग हे ने कहा कि हालांकि 2024 के मध्य में अधिकांश ‘छोटे बाघ’ अभी भी बड़े मॉडल को प्रशिक्षित कर रहे थे, लेकिन उनका निवेश पहले ही काफी कम हो गया था। जनवरी 2025 तक, DeepSeek R1 की रिलीज के साथ, कई छोटी कंपनियों को एहसास हुआ कि वे प्रतिस्पर्धा नहीं कर सकती हैं।
इस अचानक बदलाव ने ‘छोटे बाघों’ के लिए एक बड़ा बदलाव किया, जो AGI विकास से अधिक विशिष्ट दृष्टिकोणों की ओर बढ़ रहा है।
Baichuan और 01.AI ने बड़े मॉडल को पूर्व-प्रशिक्षण देना छोड़ दिया है, क्रमशः चिकित्सा AI और उद्योग अनुप्रयोग पर ध्यान केंद्रित कर रहे हैं। MiniMax अपने B2B कार्यों को कम कर रहा है और C-एंड वीडियो निर्माण और अन्य अनुप्रयोगों के साथ विदेशी बाजारों पर ध्यान केंद्रित कर रहा है। Zhipu, Moonshot AI, और StepUp अभी भी ओपन-सोर्स समुदाय में सक्रिय हैं, लेकिन उन्होंने DeepSeek R1 से बेहतर कोई नया मॉडल नहीं बनाया है। Zhipu ने काफी धन और सरकारी-उद्यम भागीदारी हासिल की है, जिससे इसका अस्तित्व सुनिश्चित हो गया है। Moonshot AI के प्राथमिक उत्पाद, Kimi को Yuanbao से खतरा है, जिससे इसकी स्थिति तेजी से अजीब होती जा रही है।
कुल मिलाकर, ‘छोटे बाघ’ तेजी से B2B SaaS बाजार के साथ अभिसरण कर रहे हैं, जिसे कुछ लोग ‘अकल्पनीय’ मानते हैं।
B2B बाजार का आकर्षण और सीमाएँ
01.AI ने हाल ही में विभिन्न उद्योगों के लिए एक-स्टॉप एंटरप्राइज़ लार्ज मॉडल प्लेटफॉर्म बनाने के लिए DeepSeek को पूरी तरह से एकीकृत करने के अपने इरादे की घोषणा की। हालांकि, इस कदम को संदेह के साथ देखा गया है।
वित्तीय AI विशेषज्ञ जियांग शाओ का मानना है कि 01.AI का भविष्य अनिश्चित है क्योंकि इसका व्यापक ध्यान है, DeepSeek के उदय के बाद तकनीकी प्रतिस्पर्धात्मकता की कमी है, और सीमित वाणिज्यिक क्षमताएं हैं।
वांग वेनगुआंग ने इस भावना को दोहराया, यह देखते हुए कि एक-स्टॉप लार्ज मॉडल प्लेटफॉर्म के लिए प्रवेश के लिए तकनीकी बाधा अपेक्षाकृत कम है।
वांग ने लगभग छह महीनों में स्वतंत्र रूप से इस तरह के प्लेटफॉर्म को विकसित करने के अपने अनुभव को साझा किया, और इसे व्यक्तिगत चैनलों के माध्यम से बेचा। उन्होंने तर्क दिया कि कंपनी के रूप में इस उत्पाद से लाभ कमाना मुश्किल है, लेकिन एक एकल उद्यम के रूप में यह लाभदायक हो सकता है।
वांग कई B2B कंपनियों के साथ सहयोग करता है जो बड़े मॉडल सेवाएं प्रदान करते हैं लेकिन उनके पास तकनीकी प्लेटफॉर्म नहीं है। वह अपने प्लेटफॉर्म को कम लागत पर, लगभग 40,000 से 50,000 युआन प्रति लाइसेंस पर प्रदान करता है, जो बड़ी कंपनियों को काफी कम कर देता है।
उनका प्लेटफॉर्म, KAF (नॉलेज-बेस्ड एजेंट फैक्ट्री), बड़े मॉडल और एजेंट अनुप्रयोगों को वितरित करने के लिए ज्ञान ग्राफ, वेक्टर डेटाबेस और खोज इंजन का उपयोग करता है। यह उपयोगकर्ताओं को शीघ्र और मॉडल प्रबंधन के माध्यम से कोडिंग के बिना कस्टम ज्ञान सहायक या एजेंट बनाने में सक्षम बनाता है। वांग ने बाजार में समान प्लेटफार्मों की व्यापकता को नोट किया, जिससे इसे दोहराना आसान हो गया।
वांग के अनुसार, एक B2B लार्ज मॉडल एप्लिकेशन विकसित करने की इच्छुक कंपनी कुशल व्यक्तियों की एक छोटी टीम को काम पर रखकर या एक बाहरी AI कंपनी के साथ साझेदारी करके जल्दी से एक उत्पाद बना सकती है। यह दृष्टिकोण एक बड़े मॉडल को प्रशिक्षित करने की तुलना में काफी सस्ता है।
प्लेटफॉर्म मॉडल के अलावा, एकीकृत समाधान हार्डवेयर, सॉफ्टवेयर और निष्पादन वातावरण प्रदान करते हैं, जो आउट-ऑफ-द-बॉक्स कार्यक्षमता प्रदान करते हैं। पिंग एन इंश्योरेंस में प्रौद्योगिकी प्लेटफॉर्म समूह के प्रमुख झांग सेनसेन का मानना है कि एकीकृत समाधानों का एक व्यवहार्य बाजार है, विशेष रूप से सीमित तकनीकी परिनियोजन क्षमताओं वाले सरकारी और शैक्षणिक संस्थानों के बीच। ये समाधान उपयोग में आसानी और तकनीकी स्वायत्तता को प्राथमिकता देते हैं, जैसे कि डेटा सुरक्षा, गोपनीयता अनुपालन और हार्डवेयर-सॉफ्टवेयर अनुकूलन जैसे लाभ प्रदान करते हैं। वे घरेलू स्तर पर उत्पादित चिप्स का भी उपयोग कर सकते हैं, प्रतिबंधों को दरकिनार कर सकते हैं और दक्षता में सुधार कर सकते हैं। लागत के प्रति संवेदनशील और ROI-केंद्रित कंपनियां अपने लंबे जीवनचक्र के कारण एकीकृत समाधानों को आकर्षक पा सकती हैं।
घरेलू SaaS बाजार ने ऐतिहासिक रूप से उच्च अनुकूलन आवश्यकताओं, सामान्य और समरूप उत्पादों, तीव्र प्रतिस्पर्धा, कम मूल्य निर्धारण रणनीतियों और अल्पकालिक मुद्रीकरण पर ध्यान केंद्रित करने जैसी चुनौतियों का सामना किया है। इस बाजार में ग्राहकों के पास अक्सर डिजिटलीकरण का निम्न स्तर और भुगतान करने की सीमित इच्छा होती है।
इसके विपरीत, अंतर्राष्ट्रीय SaaS बाजार विशेषज्ञता पर जोर देता है, कंपनियां विशिष्ट क्षेत्रों पर ध्यान केंद्रित करती हैं और बड़े और मध्यम आकार के ग्राहकों को भुगतान करने की अधिक इच्छा के साथ गहन सेवाएं प्रदान करती हैं।
बड़ा मॉडल क्षेत्र इन प्रवृत्तियों को दर्शाता है। अंतर्राष्ट्रीय SaaS बाजार में हाल की घटनाएं इसे प्रदर्शित करती हैं:
- फरवरी 2025 में, MongoDB ने Voyage AI का अधिग्रहण किया, जो 17 महीने पुराना AI स्टार्टअप है जो एम्बेडिंग और री-रैंकिंग मॉडल पर केंद्रित है, जिसकी कीमत $220 मिलियन है।
- 2024 में, Amazon ने Adept के साथ एक प्रौद्योगिकी लाइसेंसिंग समझौते की घोषणा की, जो दो साल पुराना AI एजेंट स्टार्टअप है, जिसमें कुछ Adept सदस्य Amazon की AGI टीम में शामिल हो रहे हैं।
इन स्टार्टअप ने बड़े मॉडल प्रौद्योगिकी के भीतर एक विशिष्ट क्षेत्र पर ध्यान केंद्रित करके सफलता हासिल की। चीन में ऐसे उदाहरण दुर्लभ हैं। कई छोटे और मध्यम आकार के उद्यमों को लगातार बड़ी कंपनियों से अपने स्थान पर प्रवेश करने से बचाना पड़ता है।
वांग वेनगुआंग ने B2B बाजार में अपने व्यापक अनुभव से इसका कठोर वास्तविकता बताई। उन्होंने कहा कि एक-स्टॉप प्लेटफॉर्म के लिए एक बड़ा बाजार है, लेकिन यह खंडित है। कम परिचालन लागत वाली छोटी कंपनियां प्रतिस्पर्धी मूल्य निर्धारण की पेशकश कर सकती हैं, जिससे बड़ी कंपनियों को कम करके आंका जा सकता है। इससे एप्लिकेशन सेवाओं की कीमत कम हो जाती है। यहां तक कि बड़ी कंपनियों को अन्य स्टार्टअप और पारंपरिक इंटीग्रेटर्स से प्रतिस्पर्धा का सामना करना पड़ता है। बड़ी कंपनियों के पास अपने स्वयं के बड़े मॉडल और ब्रांड फायदे हो सकते हैं, लेकिन उन्हें समान B2B व्यावसायिक रणनीतियों का सामना करना पड़ता है।
जैसा कि वांग ने कहा, ‘मैं भी DeepSeek का उपयोग कर रहा हूं, और कई अन्य कंपनियां DeepSeek का उपयोग कर रही हैं, इसलिए कोई अंतर नहीं है। चीन में बहुत सारे क्लाउड वेंडर हैं, इसलिए कम से कम उतने ही प्रतियोगी होंगे। घरेलू B2B बाजार हमेशा ऐसा ही रहा है; जीवित रहने के लिए, आपके पास या तो मजबूत संबंध, अच्छी सेवा या कम कीमतें होनी चाहिए।’
लियांग हे ने 01.AI के वर्तमान विकल्पों और भविष्य की संभावनाओं का संक्षिप्त मूल्यांकन पेश किया:
- ली कैइफू का 01.AI के व्यवसाय को पूरी तरह से B2B अनुप्रयोगों में स्थानांतरित करने और एक-स्टॉप एंटरप्राइज़ लार्ज मॉडल प्लेटफॉर्म को बढ़ावा देने का निर्णय व्यावसायिक रूप से उचित है, लेकिन इससे तीव्र प्रतिस्पर्धा होगी।
- 01.AI की बड़ी कंपनियों की तुलना में कम कीमत वाले बड़े मॉडल उत्पाद पेश करने की आवश्यकता एप्लिकेशन परत पर अपने अनूठे फायदों की कमी का परिणाम है।
- 01.AI का B2B में जाना कल्पना की कमी और कम ‘सेक्सी’ परियोजनाओं का संकेत देता है। यह 2017 में AI की पिछली लहर से कई कंप्यूटर विज़न कंपनियों की नियति के समान है।
- यदि 01.AI विदेशी बाजारों का पता लगाता है तो उसके पास अवसर हो सकते हैं।
01.AI की तुलना में, Baichuan के भविष्य पर राय कम निराशावादी है।
हालांकि, चिकित्सा क्षेत्र में Baichuan के प्रवेश में अद्वितीय फायदों की कमी है, विशेष रूप से डेटा में।
जियांग शाओ ने कहा कि चिकित्सा में Baichuan का बदलाव केवल जीवित रहने का एक तरीका है। हालांकि, 01.AI की तुलना में, Baichuan कम से कम एक विशिष्ट बाजार में प्रवेश करने का प्रयास कर रहा है।
झांग सेनसेन ने कहा कि वह चिकित्सा डेटा वाली कंपनियों के बारे में अधिक आशावादी हैं जो प्रौद्योगिकी कंपनियों की तुलना में चिकित्सा बड़े मॉडल विकसित कर रही हैं। यह किसी भी कंपनी पर लागू होता है जो उद्योग-विशिष्ट बड़ा मॉडल बनाना चाहती है। चिकित्सा बड़े मॉडल बनाने में प्रमुख चुनौती मॉडल नहीं, बल्कि डेटा है। चीन में कई उत्कृष्ट अस्पताल हैं जो अपने स्वयं के उपयोग के लिए DeepSeek का उपयोग करके एक बड़े मॉडल को ठीक कर सकते हैं।
चिकित्सा डेटा को प्रभावी ढंग से कैसे प्राप्त किया जा सकता है? जियांग शाओ ने कहा कि AI प्रौद्योगिकी स्टार्टअप में डेटा में फायदे की कमी है। चिकित्सा बड़े मॉडल बनाने के लिए, उन्हें उन कंपनियों के साथ सहयोग करने की आवश्यकता हो सकती है जो पहले से ही अस्पतालों को IT सेवाएं प्रदान करती हैं।
कथित तौर पर, ‘छोटे बाघों’ में से एक ने घरेलू डॉक्टर एक्सचेंज फोरम के साथ विशेष रूप से भागीदारी की है ताकि डॉक्टर एक्सचेंजों से उत्पन्न मामलों की भारी संख्या का उपयोग करके मॉडल को प्रशिक्षित किया जा सके।
विशिष्ट बाजारों पर अधिक आशावादी दृष्टिकोण के अलावा, उद्योग विशेषज्ञों को Baichuan के संस्थापक वांग शियाओचुआन से उम्मीदें हैं।
लियांग हे का मानना है कि दवा में विशेषज्ञता में वांग शियाओचुआन की सफलता इस बात पर निर्भर करती है कि वह एक आदर्श का पीछा करना चाहते हैं या पैसा कमाना चाहते हैं। उनका मानना है कि वांग एक आदर्श का पीछा करने, अभूतपूर्व चिकित्सा AI अनुसंधान परिणाम बनाने के लिए अधिक इच्छुक हैं।
वांग वेनगुआंग ने इस बाजार के पुराने स्वभाव पर जोर दिया। उन्होंने कहा कि यदि लक्ष्य अल्पकालिक वाणिज्यिककरण है, तो चिकित्सा क्षेत्र भी अत्यधिक प्रतिस्पर्धी है, जो समग्र B2B बाजार के समान है। कई कंपनियां चिकित्सा अनुप्रयोगों के लिए ज्ञान ग्राफ, वेक्टर खोज और बड़े मॉडल का उपयोग कर सकती हैं।
चिकित्सा AI विशेषज्ञों के साथ Zhiwei की चर्चाओं के अनुसार, चिकित्सा अनुसंधान में ही महत्वपूर्ण ज्ञान अंतराल हैं, और नया ज्ञान तेजी से बढ़ रहा है। इसलिए, चिकित्सा बुनियादी अनुसंधान करने के लिए बड़े मॉडल का उपयोग करने की महत्वपूर्ण क्षमता है। उदाहरण के लिए, प्रोटीन संरचना भविष्यवाणी के लिए AlphaFold मॉडल का उपयोग दुनिया भर के 1.8 मिलियन से अधिक वैज्ञानिकों द्वारा अनुसंधान को गति देने के लिए किया गया है, जिसमें जैव-अक्षय सामग्री का विकास और आनुवंशिक अनुसंधान को आगे बढ़ाना शामिल है, Meis Medical के अनुसार।
एक आदर्श का पीछा करने या पैसा बनाने के अलावा, चिकित्सा AI स्टार्टअप को यह भी सवाल है कि एक सामान्य चिकित्सा बड़ा मॉडल बनाना है या नहीं।
झांग सेनसेन ने कहा कि घरेलू बाजार में सामान्य चिकित्सा बड़े मॉडल में कोई सफलता नहीं मिली है, मुख्य रूप से बड़े पैमाने पर डेटा संग्रह और अनुप्रयोग के लिए शक्तिशाली चिकित्सा उपकरणों पर निर्भरता के कारण। चीन में कई चिकित्सा सुविधाओं को व्यापक रूप से प्रचारित नहीं किया गया है, जिससे AI के लिए सटीक निदान करना मुश्किल हो गया है। हालांकि, कुछ मजबूत अस्पतालों, जैसे Mayo Clinic ने अपने स्वयं के बड़े मॉडल लॉन्च करना शुरू कर दिया है। हालांकि अल्पावधि में लाभ के अवसर देखना मुश्किल है, लेकिन इस प्रकार के बड़े मॉडल का चिकित्सा उद्योग पर लंबे समय में गहरा प्रभाव पड़ सकता है।
चिकित्सा उद्योग को पूरी तरह से स्वचालित निदान की चुनौती का भी सामना करना पड़ता है, खासकर घरेलू बाजार में, जहां उपकरण अपर्याप्त हैं, और AI पारंपरिक निदान विधियों को पूरी तरह से प्रतिस्थापित नहीं कर सकता है। व्यापक चिकित्सा उपकरणों की कमी, खासकर दूरदराज के क्षेत्रों में, चिकित्सा प्रौद्योगिकी को पूरी तरह से कवर करना मुश्किल बना देती है, इसलिए पूरी तरह से स्वचालित निदान एक महत्वपूर्ण चुनौती बनी हुई है।
चिकित्सा उद्योग में सख्त लाइसेंसिंग और अनुपालन आवश्यकताएं हैं, और चिकित्सा क्षेत्र में प्रवेश करते समय बड़े मॉडल को अनुपालन मुद्दों को संबोधित करना होगा। भविष्य की C-एंड चिकित्सा सेवाएं निदान और उपचार की दक्षता में सुधार करने के लिए डॉक्टरों की तकनीकों और AI को जोड़ सकती हैं, खासकर छोटी पीढ़ियों के लिए।
अंत में, घरेलू B2B बाजार की विशेषताओं को भी ध्यान में रखते हुए, बड़े मॉडल अनुप्रयोगों में प्रतिस्पर्धा To B बाजार में जीवित रहना मुश्किल बना देती है। वांग वेनगुआंग ने कहा कि बड़े मॉडल To B उत्पादों के लिए डिज़ाइन मॉडल अभी भी खोजे जा रहे हैं, लेकिन वे अंततः अभिसरण करेंगे। यह न केवल चीन में सच है, बल्कि सिलिकॉन वैली प्रौद्योगिकी कंपनियों जैसे OpenAI, Anthropic और Google में भी सच है। जब तक मॉडल के प्रदर्शन में कोई महत्वपूर्ण अंतर नहीं है, तब तक इस बाजार में पैसा कमाना असंभव है, और अंततः हर कोई एक ही स्तर पर होगा।
यही कारण है कि DeepSeek R1 का सबसे बड़ा प्रभाव चीन में नहीं, बल्कि विदेशों में पड़ा है, खासकर सिलिकॉन वैली प्रौद्योगिकी कंपनियों पर। R1 की रिलीज के बाद अमेरिकी शेयर बाजार में उच्च अस्थिरता और फिर गिरावट का अनुभव होना शुरू हुआ। मूल तर्क सरल है: सिलिकॉन वैली के बड़े मॉडल चीन द्वारा पकड़े गए हैं। उन्हें पार नहीं करते हुए, अंतर को चौड़ा करने में असमर्थता ने इस तरह के उच्च मूल्यांकन का समर्थन करना असंभव बना दिया है, जिससे शेयर की कीमतों में गिरावट आई है।
बेशक, To B बाजार के लिए ग्राहकों को आकर्षित करने का एक और तरीका है: ओपन सोर्स। ओपन-सोर्स के लिए प्राथमिक लाभ मॉडल में भुगतान-स्तर के कार्यों, क्लाउड होस्टिंग और ओपन-सोर्स तकनीक पर आधारित उद्यम-स्तर की परामर्श और प्रशिक्षण जैसी मूल्य वर्धित सेवाएं प्रदान करना शामिल है।
ओपन-सोर्स बड़े मॉडल का सबसे सीधा प्रभाव प्रौद्योगिकी के लोकप्रिय होने को बढ़ावा देना है। झांग सेनसेन ने कहा कि DeepSeek के ओपन सोर्स ने बड़ी मॉडल कंपनियों के अनुप्रयोग को काफी तेज कर दिया है। वरिष्ठ प्रबंधन बड़े मॉडल के अनुप्रयोग का बहुत समर्थन करते हैं। जैसा कि बड़े मॉडल व्यावहारिक अनुप्रयोगों में अच्छा प्रदर्शन करते हैं, खासकर मानव हस्तक्षेप को कम करने और दक्षता बढ़ाने में, समर्थन में वृद्धि जारी रहेगी।
वित्तीय उद्योग, डेटा गुणवत्ता वाले उद्योग के रूप में, हमेशा AI में समृद्ध तकनीकी संचय रहा है और जल्दी से बनाए रख सकता है। DeepSeek की परवाह किए बिना, वित्त AI तकनीक को लागू करेगा। हालांकि, DeepSeek के साथ, AI न केवल वित्तीय उद्योग के मुख्य व्यवसायों को सक्षम करेगा, बल्कि दैनिक कार्यालय कार्यों और कार्यों में भी उपयोग किया जाएगा जिन्हें पहले करना मुश्किल था।
संचालन पहले बहुत महंगा हुआ करता था। उदाहरण के लिए, रूट कॉज विश्लेषण के लिए पहले पारंपरिक संचालन निगरानी और AIOps, साथ ही छोटे मॉडल को प्रशिक्षित करने की आवश्यकता होती थी। अब, DeepSeek का उपयोग ज्ञान आधारों के साथ संयोजन में एप्लिकेशन योजनाओं को उत्पन्न करने के लिए किया जा सकता है ताकि निगरानी, अलार्म, स्व-सेवा विश्लेषण और पता लगाने की क्षमता, स्वचालित प्रसंस्करण और स्थिरता सुधार को संभाला जा सके, जो AIOps की तुलना में अधिक लचीला है।
इसके अलावा, संचालन के AI कवरेज व्यापक हो गया है, जिसमें अन्तरक्रियाशीलता और पहल पर अधिक विचार किया गया है। पहल का अर्थ है AI को सक्रिय रूप से संचालन करने की अनुमति देना। नियमों, मनुष्यों या यहां तक कि व्यक्तिगत अनुभव पर निर्भर रहने से लेकर, जहां मानव अनुभव के स्तर ने संचालन क्षमताओं के स्तर को निर्धारित किया, हल्के AI मॉडल का उपयोग अब इसे सीधे प्राप्त करने के लिए किया जा सकता है।
हालांकि DeepSeek की मतिभ्रम दर अभी भी अधिक है, यहां तक कि अन्य समान मॉडलों से भी महत्वपूर्ण रूप से अलग नहीं है, इसकी तर्क और व्यावहारिक अनुप्रयोग क्षमताएं मतिभ्रम के नकारात्मक प्रभावों को दूर कर सकती हैं। इस मुद्दे को RAG और अन्य संबंधित तकनीकों का उपयोग करके ठीक ट्यूनिंग और अनुकूलन के माध्यम से धीरे-धीरे सुधारा जाएगा।
Alibaba के बड़े मॉडल प्रौद्योगिकी विशेषज्ञ गाओ पेंग का मानना है कि DeepSeek का प्रभाव बड़ी और छोटी कंपनियों के लिए अलग-अलग होता है:
Alibaba द्वारा आंतरिक रूप से उपयोग किए जाने वाले बड़े मॉडल हमेशा उद्योग में सबसे उन्नत रहे हैं, इसलिए DeepSeek के उद्भव का कोई महत्वपूर्ण प्रभाव नहीं पड़ा है। Alibaba प्रदर्शन मूल्यांकन और तुलना के लिए DeepSeek का उपयोग करता है, जो एक तकनीकी प्रेरणा प्रदान करता है। DeepSeek का तर्क में कार्यान्वयन अपेक्षाकृत तेज है, और तकनीकी विवरण अधिक सामान्य हैं। DeepSeek Qianwen से भी प्रभावित हुआ है।
इसके विपरीत, DeepSeek का छोटे और मध्यम आकार की कंपनियों पर अधिक प्रभाव पड़ता है, क्योंकि पहले कोई ऐसा मॉडल नहीं था जो कम लागत वाले, निजी परिनियोजन प्रदान करते हुए DeepSeek के प्रभाव को प्राप्त कर सके। DeepSeek की रिलीज के बाद, DeepSeek एकीकृत मशीनों को बेचने वाली कई कंपनियां उभरी हैं। हालांकि, DeepSeek कई ओपन-सोर्स मॉडल एकीकृत मशीनों की तुलना में सबसे सस्ता नहीं है, जो विशिष्ट मानकों पर निर्भर करता है।
किसी भी मामले में, घरेलू ओपन-सोर्स बड़ा मॉडल अब फलफूल रहा है और विश्व स्तर पर प्रतिस्पर्धा कर सकता है। हालांकि, पिंग एन इंश्योरेंस के बड़े मॉडल के कार्यान्वयन के आधार पर, झांग सेनसेन का मानना है कि ओपन-सोर्स बड़े मॉडल में अभी भी दुर्गम सीमाएं हैं:
हमारे लिए, DeepSeek में मुख्य रूप से एक बड़ा लागत लाभ है। क्षमताओं के संदर्भ में, यह तर्क, सामान्यीकरण क्षमता और प्रासंगिक समझ के संदर्भ में संचालन परिदृश्यों में अन्य मॉडलों से बेहतर हो सकता है। हालांकि, DeepSeek वित्तीय जोखिम नियंत्रण जैसे अधिक जटिल परिदृश्यों में अच्छा प्रदर्शन नहीं करता है। ऐसा इसलिए है क्योंकि अन्य मॉडलों के संयोजन में अधिक विस्तृत फाइन-ट्यूनिंग या यहां तक कि अनुकूलन की आवश्यकता होती है। इसलिए, मॉडल प्रदर्शन को और बेहतर बनाने के लिए विशिष्ट अनुप्रयोग परिदृश्यों के आधार पर लक्षित फाइन-ट्यूनिंग की आवश्यकता होती है।
पिंग एन के स्व-विकसित बड़े मॉडल को दो परतों में विभाजित किया गया है: अंतर्निहित नींव बड़ा मॉडल और बैंकिंग, बीमा और अन्य व्यवसायों के लिए जिम्मेदार डोमेन मॉडल। आंतरिक रूप से उपयोग किए जाने वाले बड़े मॉडल पेशेवर ज्ञान के क्षेत्र में DeepSeek से बेहतर प्रदर्शन करते हैं, खासकर वित्त और चिकित्सा जैसे विशिष्ट क्षेत्रों में, जहां मॉडल अधिक सटीक होते हैं। हालांकि, DeepSeek में अभी भी तर्क क्षमता में एक मजबूत लाभ है। कुछ परिदृश्यों में, हम यह देखने के लिए DeepSeek का उपयोग करना चाहते हैं कि इसे चलाया जा सकता है या नहीं।
Alibaba Qianwen, Baidu Wenxin, और Zhipu ChatGLM और DeepSeek के बीच इस संबंध में कोई महत्वपूर्ण अंतर नहीं है। निर्णय इस तथ्य पर आधारित है कि इन मॉडलों में तर्क क्षमता और ज्ञान आधार संरचना में DeepSeek से कोई महत्वपूर्ण अंतर नहीं है।
कुल मिलाकर, ओपन-सोर्स बड़े मॉडल का प्रभाव वर्तमान में सीमित है, और उनके बीच प्रतिस्पर्धा की गति तीव्र है।
To C बाजार के खतरे
जबकि To B बाजार में प्रतिस्पर्धा भयंकर है, इसका मतलब यह नहीं है कि To C मार्ग अधिक आशा प्रदान करता है।
बड़े मॉडलों के लिए To C बाजार में प्रतिस्पर्धा भी बहुत भयंकर है, लेकिन यह To B बाजार से बहुत अलग है।
बाजार का परिदृश्य लगातार बदल रहा है।
To C का मुद्रीकरण मुश्किल है।
सबसे लोकप्रिय एप्लिकेशन जरूरी नहीं कि सबसे अधिक राजस्व उत्पन्न करें। उदाहरण के लिए, ChatGPT का राजस्व सबसे अधिक है, लेकिन OpenAI अभी भी प्रति वर्ष $5 बिलियन खो देता है, जबकि ChatGPT के कई ‘कॉपीकैट’ अनुप्रयोगों ने शायद तेजी से लाभप्रदता हासिल कर ली है; DeepSeek लोकप्रिय होने के बाद, नकल करने वाले और जालसाज बड़ी संख्या में आए।
C-एंड बाजार से ‘छोटे बाघों’ की स्थिति का अवलोकन करना भी आशावादी नहीं है। Zhiwei का उद्योग विशेषज्ञों के साथ संचार आमतौर पर मानता है कि बड़े निर्माता महान उत्तरजीविता दबाव लाएंगे।
जियांग शाओ ने कहा कि उपभोक्ता बाजार में ‘छोटे बाघों’ में से सबसे अच्छा प्रदर्शन करने वाला Moonshot AI का Kimi है। लेकिन अब, Tencent का Yuanbao पहले स्थान पर है, DeepSeek दूसरे स्थान पर है और Doubao तीसरे स्थान पर है। शीर्ष तीन कंपनियां लगभग अधिकांश बाजार हिस्सेदारी पर कब्जा करती हैं। Tencent के Yuanbao ने WeChat पारिस्थितिकी तंत्र की मदद से बड़ी संख्या में ग्राहक यातायात प्राप्त किया है, जबकि DeepSeek ने अपनी तकनीकी नवाचार और कई परिदृश्यों में उत्कृष्ट प्रदर्शन के साथ बाहर खड़े हो गए हैं।
लियांग हे ने कहा कि Kimi की बड़ी मॉडल तकनीक अपने प्रतिस्पर्धियों से बहुत अलग नहीं है, इसलिए यह केवल मुफ्त हो सकता है, जिससे Moonshot के लिए व्यावसायीकरण करना बहुत मुश्किल हो जाता है। To C एप्लिकेशन के रूप में, यह स्पष्ट नहीं है कि यह Yuanbao और Doubao से कहां अलग है। इसके अलावा, Doubao को Byte के अन्य व्यवसायों द्वारा समर्थित किया जा सकता है, और Yuanbao को Tencent के अन्य व्यवसायों द्वारा समर्थित किया जा सकता है। वे इन अनुप्रयोगों का समर्थन करने के लिए 100 बिलियन का निवेश कर सकते हैं।
जियांग शाओ ने कहा कि C-एंड उपयोगकर्ता उत्पाद उपयोग में आसानी के बारे में अधिक चिंतित हैं, जिसमें Tencent और Byte बेहतर हैं। बेशक, Alibaba के पास भी अवसर हैं। Alibaba ‘AI लिसनिंग’ नामक एक एप्लिकेशन का ऊष्मायन कर रहा है, जो चैट और इंटरैक्शन के लिए AI का उपयोग करता है, जिसका उद्देश्य शॉर्ट वीडियो प्लेटफॉर्म में Douyin को बदलना है। हालांकि Douyin उच्च गुणवत्ता वाली सामग्री उत्पन्न करने के लिए बड़ी संख्या में रचनाकारों को आकर्षित करता है, लेकिन AI चैट एप्लिकेशन अधिक व्यक्तिगत और इंटरैक्टिव अनुभव प्रदान करके उपयोगकर्ता समूहों को आकर्षित करने की क्षमता रखते हैं। दोनों के बीच अंतर सामग्री निर्माण और इंटरैक्शन में निहित है। यदि Alibaba इसे तोड़ सकता है, तो उसके पास टेबल को बदलने का भी मौका है, लेकिन यह कहना मुश्किल है कि Tencent सूट का पालन करता है या नहीं।
MiniMax के बारे में, उद्योग की राय थोड़ी अलग है।
लियांग हे का मानना है कि MiniMax का Conch AI वर्तमान में अच्छा लाभ कमा रहा है। इसने अपना खुद का रास्ता खोज लिया है, लेकिन यह अभी तक ज्ञात नहीं है कि क्या यह मार्ग MiniMax को अपने मूल्यांकन को पर्याप्त रूप से बढ़ाने की अनुमति देगा। इसके एप्लिकेशन ओरिएंटेशन के कारण, DeepSeek के आने के बाद MiniMax अधिक आराम से है। यदि वे DeepSeek के मॉडल का उपयोग करते हैं, तो यह मॉडल के अनुसंधान और विकास की लागत को बचाएगा, और इसके एप्लिकेशन पैसे कमाना जारी रख सकते हैं, यहां तक कि और भी अधिक।
जियांग शाओ का मानना है कि यदि MiniMax बाद में एक लोकप्रिय APP बना सकता है, तो उसके पास एक मौका है, लेकिन Alibaba इसे पार कर सकता है और पहले एक लोकप्रिय APP बना सकता है, इसलिए भले ही MiniMax के पास एक मौका हो, लेकिन संभावना अधिक नहीं है।
अंततः, उत्पाद विभेदन अभी भी C-एंड अनुप्रयोगों के लिए सफलता का बिंदु है।
a16z की नवीनतम रिपोर्ट ‘टॉप 100 जेन AI कंज्यूमर एप्स’ के अनुसार, कई कम उपयोग वाले एप्लिकेशन वास्तव में बेहतर राजस्व प्राप्त करते हैं। कुछ खराब बहुमुखी प्रतिभा वाले उत्पाद, जैसे पौधे की पहचान और पोषण, सामान्य उत्पादों की तुलना में अधिक भुगतान करने वाले उपयोगकर्ताओं को आकर्षित करते हैं।
सामान्य AI उत्पादों को विभेदित करना मुश्किल है। उपयोगकर्ताओं के पास भुगतान करने की कम इच्छा होती है, लाभ चक्र लंबा होता है, इसलिए वे बड़ी कंपनियों से नहीं बच सकते हैं।
और यदि विभेदन ऊर्ध्वाधर रूप से पर्याप्त गहरा नहीं है, तो इसे आधार बड़े मॉडल द्वारा क्षमता उन्नयन के माध्यम से आंतरिक बनाना भी आसान है। उदाहरण के लिए, हाल ही में GPT-4o की छवि निर्माण क्षमताओं ने Midjourney जैसे टेक्स्ट-टू-इमेज स्टार्ट-अप के लिए एक आयामीता में कमी का झटका लाया है। यह कवरेज क्षमता अक्सर यादृच्छिक और अप्रत्याशित होती है, जैसा कि कहा जाता है, ‘आपको नष्ट करने का आपसे कोई लेना-देना नहीं है।’
प्रतिस्पर्धियों की पिक्सेल-स्तरीय नकल और आधार बड़े मॉडलों के तेजी से उन्नयन C-एंड AI स्टार्ट-अप के दृश्यों को लगभग हमेशा केवल कुछ समय के लिए बनाए रखते हैं।
सफलता बनने की अत्यंत कम संभावना को कैसे पकड़ा जाए, इसके लिए उद्योग विशेषज्ञ सर्वसम्मति से मानते हैं कि ‘अनुसरण करने के लिए मूल रूप से कोई अनुभव नहीं है।’
‘छोटे बाघों’ ने आज की दुर्दशा में प्रवेश किया है, बड़े पैमाने पर क्योंकि उन्होंने आधार बड़े मॉडल में बहुत अधिक निवेश किया और इस ट्रैक पर जीवित रहने और उत्कृष्ट प्रदर्शन करने के लिए आवश्यक जनशक्ति, वित्तीय संसाधनों और भौतिक संसाधनों को कम करके आंका, जिसके परिणामस्वरूप एप्लिकेशन ट्रैक पर अंतर करना मुश्किल है।
अब, ‘छोटे बाघ’ AGI पर हमला करने के लिए कम और कम दृढ़ हैं, और ली कैइफू ने सार्वजनिक रूप से कहा है कि घरेलू आधार बड़े मॉडल में केवल DeepSeek, Ali और Byte ही बचे रहेंगे।
इस संबंध में, उद्योग विशेषज्ञों ने Zhiwei के साथ संवाद किया जो मूल रूप से इस दृष्टिकोण से सहमत हैं।
जियांग शाओ ने कहा कि AI स्टार्ट-अप जो अभी भी बड़ी मॉडल तकनीक पर कड़ी मेहनत कर रहे हैं, उन्हें मूल रूप से मरना होगा। सबसे आशाजनक निश्चित रूप से DeepSeek है, दूसरा Alibaba है और तीसरा ByteDance है। पहले स्थान को 50%-80% यातायात प्राप्त होने की उम्मीद है, और बाद के दो को 10% यातायात प्राप्त हो सकता है। मुख्य बात यह है कि पहले AGI कौन बनाता है, और अंतिम विजेता कौन है।
DeepSeek वर्तमान में बड़े मॉडलों के क्षेत्र में सबसे अधिक प्रतिस्पर्धी है, और इसके तकनीकी नवाचार और व्यावहारिक अनुप्रयोगों में प्रदर्शन त्रुटिहीन हैं। Alibaba और ByteDance में भी मजबूत प्रतिस्पर्धा है, खासकर क्रॉस-प्लेटफ़ॉर्म अनुप्रयोगों और डेटा संसाधनों में। रैंकिंग मुख्य रूप से प्रत्येक कंपनी की बुनियादी प्रौद्योगिकी, कंप्यूटिंग शक्ति, डेटा संसाधनों और व्यावहारिक अनुप्रयोगों में नवाचार क्षमताओं पर आधारित है।
Zhipu और Kimi टीमें दृढ़ता से मानती हैं कि आधार मॉडल की क्षमताओं को बढ़ाना भविष्य है। इसके विपरीत, मेरा मानना है कि बाजार की मांग में बदलाव और अनुप्रयोग परिदृश्यों के विविधीकरण के साथ, केवल आधार मॉडल को मजबूत करने का मार्ग सीमित हो सकता है, और अधिक लचीला और अनुकूलन योग्य मॉडल विकास पथ बाजार में अधिक प्रतिस्पर्धी हो सकते हैं।
बड़े मॉडल प्रौद्योगिकी में प्रतिस्पर्धा बेहद भयंकर है, और भारी निवेश वाली कंपनियों को अंततः प्रतिस्पर्धा बनाए रखने के लिए नवाचार, कंप्यूटिंग शक्ति, डेटा और अनुकूलन में स्पष्ट सफलताएँ प्राप्त करनी चाहिए। अन्य कंपनियां जो तकनीकी प्रगति के साथ तालमेल बिठाने में विफल रहती हैं या बाजार की मांग का सामना करने में असमर्थ हैं, उन्हें धीरे-धीरे समाप्त कर दिया जाएगा।
लियांग हे ने कहा कि भविष्य में घरेलू आधार बड़ी मॉडल कंपनी में केवल DeepSeek, Ali और Byte ही बचे रहेंगे, इस तथ्य के आधार पर कि इन तीनों में अनुसंधान और विकास में सुपर संसाधनों का निवेश करने की ताकत और दृढ़ संकल्प है। Byte के लिए, बड़े मॉडलों के अवसर को छोड़ना असंभव है, अन्यथा इसका समग्र रूप से बहुत बड़ा प्रभाव पड़ेगा। और DeepSeek की तकनीक में Byte के लिए बहुत अधिक बाधाएं नहीं होंगी, लेकिन DeepSeek को वर्तमान में R&D दक्षता में अधिक लाभ है। Alibaba का Qianwen ओपन-सोर्स मॉडल स्वयं एक उच्च स्तर पर है। DeepSeek के लोकप्रिय होने से पहले, Qianwen और Llama मूल रूप से एक-दूसरे का पीछा कर रहे थे। Alibaba के लिए, Qianwen मॉडल पैसे नहीं कमा सकता है, लेकिन संबंधित क्लाउड व्यवसाय पैसे कमा सकते हैं, और Byte भी समान है, और Douyin और अन्य Apps के अनुभव को लगातार अनुकूलित करने के लिए बड़ी मॉडल तकनीक का उपयोग करना जारी रख सकते हैं। AI स्टार्ट-अप के लिए, यदि मॉडल स्वयं पैसे नहीं कमाता है, तो यह अस्तित्व की जड़ को छूता है।
वांग वेनगुआंग ने कहा कि DeepSeek का लाभ मुख्य रूप से तकनीकी आदर्शवाद में निहित है। स्प्रिंग फेस्टिवल से पहले और बाद में दो या तीन महीनों के भीतर, DeepSeek का ट्रैफ़िक बहुत अधिक था। यदि यह व्यावसायीकरण करना चाहता था, तो यह जल्द ही दुनिया में शीर्ष पर पहुंच जाएगा, और Doubao जैसे अन्य बड़े मॉडलों को बिल्कुल भी मौका नहीं मिलेगा। जब तक DeepSeek हाल के ओपन-सोर्स सप्ताह में बुनियादी ढांचे से संबंधित अनुकूलन विधियों को ओपन सोर्स नहीं करता है, तब तक यह भविष्य में पैसा कमाने के लिए इस पर निर्भर रह सकता है, ताकि दूसरों को कोई मौका न मिले। DeepSeek को वित्त पोषित नहीं किया गया है और इसे निवेशकों से प्रभावित होने की आवश्यकता नहीं है। तकनीकी आदर्शवाद और प्रतिभा सबसे बड़ी बाधाएं हैं। OpenAI की तुलना में, OpenAI अब जो परिणाम देखसकता है, वे मूल रूप से Altman और Ilya के बीच विवाद से पहले के अनुसंधान परिणाम हैं। कम से कम नवाचार बिंदुओं का निर्धारण किया गया है। अब, आदर्शवादियों की मूल टीम के जाने के बाद, OpenAI में लगभग कोई नवाचार नहीं है। वर्तमान में, OpenAI का नवाचार एप्लिकेशन स्तर पर अधिक है, जैसे कि Deep Research। एप्लिकेशन स्तर पर नवाचार के लिए कोई बाधाएं नहीं हैं, इसलिए इसे प्रतियोगियों के साथ प्रतिस्पर्धा करनी पड़ती है।
वांग मु, एक बड़े कारखाने AI प्रौद्योगिकी विशेषज्ञ ने Zhiwei को बताया कि जब तक पैसा, प्रतिभा और हार्डवेयर नहीं है, तब तक बड़े मॉडल को पूर्व-प्रशिक्षण करने में प्रयास बर्बाद करने की कोई आवश्यकता नहीं है। DeepSeek के पास 2021 की शुरुआत में 10,000-कार्ड का क्लस्टर था और पैसे की कमी नहीं है। इसके विपरीत, अन्य छोटे और मध्यम आकार की कंपनियां शायद ही इस स्थिति को एक साथ रख सकती हैं।
गाओ पेंग ने कहा कि AI स्टार्ट-अप जीवित रहना चाहते हैं, उन्हें अभी भी अनुप्रयोगों की ओर मुड़ना होगा। मैंने एक या दो साल पहले ऐसा सोचा था, और अब मुड़ने में बहुत देर हो सकती है। अगले AI कंपनियों का पहला बैच जिसे समाप्त किया जाएगा, वे वे हैं जो आधार बड़े मॉडल बनाते हैं। बड़े मॉडल प्रशिक्षण में वास्तव में बहुत सारे जटिल विवरण होते हैं और यह अनुभव के संचय पर बहुत निर्भर होता है। ट्रांसफार्मर आर्किटेक्चर के आंतरिक विवरण आम तौर पर अच्छी तरह से समझे जाते हैं, लेकिन ओपन-सोर्स या क्लोज्ड-सोर्स मॉडल के पेपर मूल रूप से आपको यह नहीं बताते हैं कि डेटा कैसे तैयार किया जाता है, डेटा विवरण क्या हैं, डेटा स्केल कितना बड़ा है और डेटा की गुणवत्ता कितनी अच्छी है। उद्योग में कोई एकीकृत मानक नहीं है।
ओपन-सोर्स ओपन-हाफ हमेशा बड़े मॉडल ट्रैक में एक विशिष्ट अभ्यास रहा है। वर्तमान में, बहुत कम बड़े मॉडल हैं जो कोड, वज़न, डेटा सेट और प्रशिक्षण प्रक्रिया को पूरी तरह से प्रकट करेंगे। अधिक प्रसिद्ध OLMo, BLOOM, आदि हैं।
हालांकि, भले ही अनुप्रयोगों की ओर मुड़ने से बचा जा सकता है? To B ट्रैक और To C ट्रैक के पिछले विश्लेषण से, AI स्टार्ट-अप के लिए अनुप्रयोगों में अपनी उद्योग बाधाओं का निर्माण करना लगभग मुश्किल है। इस संबंध में, गाओ पेंग ने कहा कि अपनी उद्योग बाधाओं का निर्माण करने की कुंजी इस बात पर निर्भर करती है कि आपके पास कौन सा डेटा है। मॉडल का उपयोग कोई भी कर सकता है। डेटा को दो पहलुओं में विभाजित किया गया है: एक उद्यमी का क्षेत्र अनुभव है, और दूसरा हाथ में डेटा है।
कॉर्पोरेट संस्कृति के दृष्टिकोण से, गाओ पेंग का मानना है कि आधार बड़े मॉडल के अनुसंधान और विकास के लिए प्रयोगात्मक और इंजीनियरिंग कड़ी मेहनत की भावना की आवश्यकता होती है। ‘पहले से बहुत पहले, कई घरेलू AI स्टार्ट-अप बहुत हाई-प्रोफाइल थे। जब आप प्रौद्योगिकी कर रहे हों, तो आपको पहले इसे कम प्रोफ़ाइल तरीके से करना चाहिए और फिर इसे उच्च प्रोफ़ाइल तरीके से बढ़ावा देना चाहिए। कुछ टीमें शिक्षा जगत से अधिक भारी बनी हैं, लेकिन शिक्षा जगत में लोग कभी-कभी प्रौद्योगिकी का अध्ययन बहुत सैद्धांतिक रूप से करते हैं। प्रतिभा या टीम के संदर्भ में, एक बड़ी मॉडल टीम की सफलता मुख्य रूप से इस बात पर निर्भर करती है कि बॉस बड़े मॉडल को समझता है या नहीं। यदि बॉस बड़ी मॉडल तकनीक को नहीं समझता है या बने रहने का विश्वास नहीं रखता है, क्योंकि यह पैसा नहीं कमाता है, तो यह बिल्कुल भी काम नहीं करेगा। DeepSeek की सफलता अधिक टॉप-डाउन संगठन मोड पर निर्भर करती है। बॉस तकनीकी विवरणों को बहुत अच्छी तरह से समझता है और सभी को एक साथ करने के लिए प्रेरित करता है। ऐसे बहुत कम घरेलू मॉडल हैं जो इस मॉडल को पूरा करते हैं।’
घरेलू आधार बड़े मॉडल के अंतिम विजेता भविष्यवाणी पर उद्योग की गरमागरम चर्चा के बारे में, गाओ पेंग का मानना है कि यह निर्णय बहुत जल्द है। ‘प्रतिस्पर्धा में भाग लेने वाले खिलाड़ियों के तकनीकी मार्गों में बहुत अंतर नहीं होगा। बस ट्रांसफार्मर आर्किटेक्चर का पालन करें और विस्तृत अनुकूलन करें। Mamba और RWKV को भी उम्मीद है। मुख्य बात यह है कि चीजों को लगातार किया जाए, और समय सब कुछ साबित कर देगा। अंतिम विजेता और शीर्ष तीन कहना आसान नहीं है। बड़ी मॉडल तकनीक स्टैक एक बहुत जटिल चीज है, और कौन जानता है कि क्या कई लोग हैं जो चुपचाप एक चीज कर रहे हैं, लेकिन समय अभी तक नहीं आया है।’
वर्तमान स्थिति में जहां मॉडल विजेता का न्याय करना मुश्किल है, डेटा सबसे महत्वपूर्ण खाई बन गया है। Sequoia Capital के एक भागीदार Konstantine Buhler ने एक बार कहा था कि ChatGPT पर OpenAI ने एक गलती यह नहीं की कि प्रतिक्रिया पाश में उच्च गुणवत्ता वाला डेटा प्रदान किया जा सकता था और एक गहरी खाई का निर्माण किया जा सकता था।
क्या डेटा AI की मदद से किसी विशेष उद्योग को और विकसित करने की अनुमति दे सकता है या वर्तमान में नए व्यावसायिक अवसर ला सकता है, यह भी बहुत महत्वपूर्ण है। झांग सेनसेन ने कहा कि AI लैंडिंग की परिपक्वता वित्तीय और इंटरनेट उद्योगों के करीब है। मैं AI कार्यालय, AI सरकारी मामलों और AI ई-कॉमर्स के बारे में अधिक आशावादी हूं। यह मुख्य रूप से इसके उच्च स्तर के डिजिटलीकरण और प्रदर्शन की उच्च निश्चितता पर आधारित है।
‘हालांकि ई-कॉमर्स अपेक्षाकृत परिपक्व है, लेकिन AI ई-कॉमर्स की दक्षता में सुधार करना जारी रखेगा, खासकर कमोडिटी सिफारिश, ग्राहक सेवा और लॉजिस्टिक्स अनुकूलन में। AI अधिक सटीक बाजार विश्लेषण और निर्णय लेने के अनुकूलन के माध्यम से ई-कॉमर्स प्लेटफॉर्म की दक्षता में सुधार कर सकता है। दक्षता में यह सुधार न केवल ऑफ़लाइन खुदरा की निरंतरता होगी बल्कि ई-कॉमर्स के नए रूपों को लाएगा, खासकर सीमा पार ई-कॉमर्स के क्षेत्र में, AI इसके विस्फोटक विकास में मदद करेगा।’
‘इसके विपरीत, वित्तीय उद्योग ने 2024 में प्रदर्शन विस्फोट का अनुभव किया, और 2025 में AI व्यवसाय के गहन होने के कारण विकास के लिए अभी भी बहुत जगह है।’
‘उन उद्योगों को देखते हुए जहां AI लैंडिंग परिपक्व नहीं है, विशेष रूप से स्मार्ट विनिर्माण, बहुत सारी अनुकूलित चीजें हैं, और प्रत्येक उद्यम द्वारा उत्पादित उत्पाद अलग-अलग हैं, और कोई एकीकृत मानक नहीं है। इसलिए, उद्यमों के लिए AI कार्य स्वचालन को बढ़ावा देना मुश्किल है, डेटा की कीमत बहुत अधिक है, और परिशुद्धता आवश्यकताएं भी बहुत अधिक हैं। हालांकि औद्योगिक सॉफ्टवेयर मूल रूप से स्मार्ट विनिर्माण लैंडिंग के लिए सबसे पहला समाधान दिशा है, इसका बेहतर प्रभाव पड़ता है। हालांकि, विनिर्माण उद्योग के AI उन्नयन पर एक ऐतिहासिक बोझ है। विनिर्माण उद्योग के अधिकांश डेटा और सूचना स्तर पर्याप्त नहीं हैं, जो उन्हें AI करते समय डेटा की कमी की ओर ले जाते हैं, खासकर असामान्य नमूनों का संग्रह लगभग न के बराबर है। जटिलता भी अधिक है, जैसे उपकरणों के प्रकारों की बड़ी संख्या और असंगत डेटा मानक, जो खराब एल्गोरिदम हस्तांतरणीयता की ओर ले जाते हैं, अक्सर कुछ प्रमुख कारकों जैसे तापमान, सामग्री या कुछ अप्रत्याशित चर के प्रभाव को अनदेखा करते हैं। इसके अलावा, उद्यमों में सेंसर डेटा पर उनके ध्यान में विचलन होता है। विभिन्न सेंसर विफलता डेटा के लिए, उद्यम मुख्य रूप से उस डेटा पर ध्यान केंद्रित करते हैं जो उत्पादन परिणामों को प्रभावित करेगा। वास्तव में, वे एज सेंसर डेटा हमारे लिए भविष्य में पूरे विनिर्माण उद्योग के नवाचार और व्यावसायीकरण का लाभ उठाने के लिए एक आधार बन सकते हैं। AI इन डेटा के विश्लेषण के माध्यम से संभावित अनुकूलन अवसरों की खोज कर सकता