DeepSeek: चीनी AI पॉवरहाऊसचा उदय | mr

DeepSeek, हे नाव जागतिक AI संभाषणात झपाट्याने उदयास आले आहे. तंत्रज्ञान आणि आर्थिक क्षेत्रांमध्ये तीव्र चर्चा आणि अटकळ निर्माण झाली आहे. या वेगाने वाढणाऱ्या चिनी AI प्रयोगशाळेने प्रस्थापित व्यवस्थेत व्यत्यय आणला आहे, ज्यामुळे विश्लेषकांना AI शर्यतीत अमेरिकेच्या वर्चस्वाच्या टिकाऊपणाबद्दल आणि सध्याच्या AI चिप मागणीच्या दीर्घकालीन व्यवहार्यतेबद्दल प्रश्न विचारण्यास प्रवृत्त केले आहे. पण DeepSeek ला सध्याच्या उंचीवर नेणारे प्रमुख घटक कोणते आहेत?

DeepSeek चा उदय: हेज फंड ते AI प्रयोगशाळा

DeepSeek चा उगम मोठ्या प्रमाणावर संख्यात्मक वित्त जगात आहे. या कंपनीला High-Flyer Capital Management चा पाठिंबा आहे. हा चिनी हेज फंड AI चा उपयोग डेटा-आधारित ट्रेडिंग निर्णय घेण्यासाठी करतो यासाठी प्रसिद्ध आहे.

झेजियांग विद्यापीठातील शिक्षण घेत असताना, ट्रेडिंगचा अनुभव असलेले आणि AI मध्ये आवड असलेले लिआंग वेनफेंग यांनी 2015 मध्ये High-Flyer ची सह-स्थापना केली. 2019 मध्ये, त्यांनी High-Flyer Capital Management ची स्थापना हेज फंड म्हणून केली, ज्यामध्ये आर्थिक उपयोगांसाठी AI अल्गोरिदम विकसित करण्यावर आणि अंमलात आणण्यावर लक्ष केंद्रित केले.

2023 मध्ये, High-Flyer ने DeepSeek ला समर्पित AI संशोधन प्रयोगशाळा म्हणून सुरू केले, जे त्याच्या मूळ वित्तीय व्यवसायापासून स्वतंत्रपणे काम करते. त्यानंतर, High-Flyer एक महत्त्वाचा गुंतवणूकदार असल्याने, प्रयोगशाळेला DeepSeek हे नाव कायम ठेवून एक स्वतंत्र अस्तित्व म्हणून वेगळे करण्यात आले.

सुरुवातीपासूनच, DeepSeek ने मॉडेल प्रशिक्षणासाठी स्वतःचे डेटा सेंटर क्लस्टर स्थापित करण्यास प्राधान्य दिले. तथापि, चीनमध्ये कार्यरत असलेल्या इतर AI कंपन्यांप्रमाणेच, DeepSeek ला प्रगत हार्डवेअरवरील अमेरिकेच्या निर्यात निर्बंधांमुळे अडचणींचा सामना करावा लागला. परिणामी, त्यांच्या अधिक आधुनिक मॉडेल्सला प्रशिक्षित करण्यासाठी, कंपनीला Nvidia H800 चिप्स वापरण्याची सक्ती करावी लागली, जी H100 चिप्सपेक्षा कमी शक्तिशाली आहे आणि अमेरिकन कंपन्यांना सहज उपलब्ध आहे.

DeepSeek ची तांत्रिक टीम त्यांच्या युवा आणि गतिशीलतेसाठी ओळखली जाते. कंपनी आघाडीच्या चीनी विद्यापीठांमधील डॉक्टरेट AI संशोधकांची सक्रियपणे भरती करते. याव्यतिरिक्त, DeepSeek विविध पार्श्वभूमीतील व्यक्तींना कामावर ठेवते, ज्यांच्याकडे संगणक शास्त्रातील कौशल्ये नसली तरीही, हे सुनिश्चित करते की त्यांचे तंत्रज्ञान विस्तृत विषयांना प्रभावीपणे समजू शकेल आणि त्यांची पूर्तता करू शकेल, असे न्यूयॉर्क टाइम्सने वृत्त दिले आहे.

DeepSeek चे AI मॉडेल्स: स्थितीला आव्हान

DeepSeek ने नोव्हेंबर 2023 मध्ये DeepSeek Coder, DeepSeek LLM आणि DeepSeek Chat मॉडेल्सचा पहिला संच सादर केला. परंतु, स्प्रिंगमध्ये DeepSeek-V2 मॉडेलच्या पुढील पिढीच्या प्रकाशनाने AI उद्योगाचे लक्ष वेधून घेतले.

DeepSeek-V2, एक बहुमुखी प्रणाली जी मजकूर आणि प्रतिमा दोन्हीचे विश्लेषण करण्यास सक्षम आहे, तिने विविध AI बेंचमार्कवर प्रभावी कामगिरी दर्शविली. विशेष म्हणजे, त्यावेळी उपलब्ध असलेल्या प्रतिस्पर्धी मॉडेल्सच्या तुलनेत लक्षणीयरीत्या कमी खर्चात हे यश मिळवले. यामुळे ByteDance आणि Alibaba यांसारख्या DeepSeek च्या देशांतर्गत प्रतिस्पर्धकांना त्यांच्या काही मॉडेल्सची किंमत कमी करण्यास आणि काही पूर्णपणे विनामूल्य देण्यास प्रवृत्त केले.

DeepSeek V3 ने Meta च्या Llama सारख्या डाउनलोड करण्यायोग्य, ओपन-सोर्स मॉडेल्स आणि OpenAI च्या GPT-4o सारख्या API द्वारे प्रवेशयोग्य असलेल्या "बंद" मॉडेल्सपेक्षा उत्कृष्ट कामगिरी दर्शविली आहे.

DeepSeek चे R1 "तर्क" मॉडेल देखील तितकेच उल्लेखनीय आहे. जानेवारीमध्ये लॉन्च केलेले, DeepSeek चा दावा आहे की R1 प्रमुख बेंचमार्कवर OpenAI च्या o1 मॉडेलच्या तुलनेत तुलनात्मक कामगिरी करते.

तर्क मॉडेल असल्याने, R1मध्ये स्व-तपासणी यंत्रणा समाविष्ट आहेत, ज्यामुळे मानक मॉडेल्सशी संबंधित काही सामान्य धोके कमी होतात. तर्क मॉडेलला समाधानापर्यंत पोहोचण्यासाठी किंचित जास्त वेळ लागतो (सेकंदांपासून मिनिटांपर्यंत), तरीही ते भौतिकशास्त्र, विज्ञान आणि गणित यांसारख्या डोमेनमध्ये अधिक विश्वासार्हता दर्शवतात.

तथापि, R1 आणि DeepSeek V3 सह DeepSeek च्या मॉडेल्स चीनच्या इंटरनेट नियामकांच्या देखरेखेखाली आहेत, जे त्यांच्या प्रतिक्रिया "मूलभूत समाजवादी मूल्यां"शी जुळतात याची खात्री करतात. उदाहरणार्थ, DeepSeek च्या चॅटबॉट ॲपमध्ये, R1 तियानमेन स्क्वेअर किंवा तैवानच्या स्वायत्ततेशी संबंधित प्रश्नांची उत्तरे देणार नाही.

मार्चमध्ये, DeepSeek च्या वेबसाइटला 16.5 दशलक्षाहून अधिक भेटी मिळाल्या. फेब्रुवारीच्या तुलनेत ट्रॅफिकमध्ये 25% घट झाली असली तरी, Similarweb चे संपादक डेव्हिड कार यांच्या मते, DeepSeek दैनिक भेटींच्या बाबतीत दुसऱ्या क्रमांकावर आहे. तथापि, हे आकडे ChatGPT च्या तुलनेत खूपच कमी आहेत, ज्याने मार्चमध्ये 500 दशलक्ष साप्ताहिक सक्रिय वापरकर्त्यांची संख्या ओलांडली.

AI क्षेत्रात विघटनकारी दृष्टीकोन

DeepSeek चे व्यवसाय मॉडेल काहीसे गूढ आहे. कंपनी आपल्या उत्पादनांची आणि सेवांची किंमत बाजार मूल्यापेक्षा खूपच कमी ठेवते आणि काही विनामूल्य देखील देते. याव्यतिरिक्त, उद्यम भांडवल कंपन्यांकडून मोठ्या प्रमाणात रस असूनही, तिने बाह्य निधीला विरोध केला आहे.

DeepSeek आपल्या अत्यंत खर्चिक स्पर्धेचे श्रेय कार्यक्षमतेतील प्रगतीला देते. तथापि, काही तज्ञांनी कंपनीने दिलेल्या आकडेवारीच्या अचूकतेवर प्रश्नचिन्ह उपस्थित केले आहे.

असे असले तरी, विकासकांनी DeepSeek च्या मॉडेल्सचा स्वीकार केला आहे, जे पारंपारिक अर्थाने ओपन सोर्स नसले तरी, व्यावसायिक वापरासाठी परवानगी देणाऱ्या परवान्याअंतर्गत उपलब्ध आहेत. Hugging Face चे CEO क्लेम डेलंग्यू यांच्या म्हणण्यानुसार, प्लॅटफॉर्मवरील विकासकांनी R1 ची 500 हून अधिक डेरिव्हेटिव्ह मॉडेल्स तयार केली आहेत, ज्याने एकत्रितपणे 2.5 दशलक्ष डाउनलोड्स जमा केले आहेत.

मोठ्या, अधिक प्रस्थापित प्रतिस्पर्धकांविरुद्ध DeepSeek च्या यशाचे वर्णन "AI ला उलथून टाकणे" आणि "अतिशयोक्तीपूर्ण" असे केले गेले आहे. कंपनीच्या कामगिरीमुळे जानेवारीमध्ये Nvidia च्या स्टॉकच्या किमतीत 18% घट झाली आणि OpenAI चे CEO सॅम Altman यांना सार्वजनिक प्रतिक्रिया देण्यास प्रवृत्त केले. रॉयटर्सनुसार, अमेरिकेच्या वाणिज्य विभागाच्या ब्युरोने DeepSeek ला सरकारी उपकरणांवर बंदी घातल्याचे वृत्त आहे.

Microsoft ने DeepSeek ला आपल्या Azure AI Foundry सेवेत समाविष्ट केले आहे, जे उद्योगांसाठी AI सेवा एकत्रित करते. Meta च्या पहिल्या तिमाहीतील कमाईच्या कॉल दरम्यान, CEO मार्क Zuckerberg यांनी सांगितले की AI पायाभूत सुविधांमधील गुंतवणूक कंपनीसाठी "Strategic advantage" ठरत राहील, जेव्हा त्यांना Meta च्या AI खर्चावर DeepSeek च्या संभाव्य परिणामाबद्दल विचारले गेले. मार्चमध्ये, OpenAI ने DeepSeek ला "राज्य-अनुदानित" आणि "राज्य-नियंत्रित" असे लेबल लावले आणि अमेरिकन सरकारने त्याच्या मॉडेल्सवर बंदी घालण्याचा विचार करावा अशी शिफारस केली.

Nvidia च्या चौथ्या तिमाहीतील कमाईच्या कॉल दरम्यान, CEO जेन्सन हुआंग यांनी DeepSeek च्या "उत्कृष्ट नवोपक्रमा"वर प्रकाश टाकला आणि नमूद केले की त्याच्या तर्क मॉडेलला लक्षणीयरीत्या जास्त संगणकीय शक्तीची आवश्यकता आहे, ज्यामुळे Nvidia ला फायदा होतो.

याउलट, दक्षिण कोरिया आणि न्यूयॉर्क राज्यासह काही कंपन्या, देश आणि सरकारांनी सरकारी उपकरणांवर DeepSeek चा वापर নিষিদ্ধ केला आहे.

मे मध्ये, Microsoft चे उपाध्यक्ष आणि अध्यक्ष ब्रॅड स्मिथ यांनी सिनेटसमोर साक्ष दिली की डेटा सुरक्षा आणि संभाव्य प्रचाराच्या चिंतेमुळे Microsoft कर्मचाऱ्यां DeepSeek वापरण्यास मनाई आहे.

DeepSeek चे अनिश्चित भविष्य

DeepSeek चा भविष्यातील मार्ग अनिश्चित आहे. मॉडेलमध्ये आणखी सुधारणा अपेक्षित असताना, अमेरिकन सरकार कथित हानिकारक परदेशी प्रभावांबद्दल अधिकाधिक सावध दिसत आहे. मार्चमध्ये, वॉल स्ट्रीट जर्नलने वृत्त दिले की अमेरिका DeepSeek ला सरकारी उपकरणांवर নিষিদ্ধ करण्याची शक्यता आहे.

DeepSeek च्या जलद उद्रेकाने AI उद्योगाचा पाया निःसंशयपणे हादरवून टाकला आहे, ज्यामुळे स्पर्धात्मक गतिशीलता आणि विघटनकारी नवोपक्रमाच्या क्षमतेचे पुनर्मूल्यांकन करण्यास प्रवृत्त केले आहे. वाढती तपासणी आणि नियामक आव्हानांना तोंड देत तो आपला सध्याचा वेग टिकवून ठेवू शकतो की नाही हे पाहणे बाकी आहे. आगामी वर्षे जागतिक AI परिदृश्यावर DeepSeek च्या दीर्घकालीन परिणामाचे निर्धारण करण्यात महत्त्वपूर्ण ठरतील. तांत्रिक प्रगती, भू-राजकीय विचार आणि नैतिक चिंता यांच्यातील गुंतागुंतीच्या आंतरक्रियेतून मार्ग काढण्याची त्याची क्षमता शेवटी त्याचा वारसा निश्चित करेल. AI जग बारकाईने लक्ष ठेवेल.

DeepSeek ची कथा एक स्मरणपत्र आहे की कृत्रिम बुद्धिमत्तेच्या झपाट्याने विकसित होणाऱ्या जगात, नवीन खेळाडू लवकर उदयास येऊ शकतात आणि प्रस्थापित व्यवस्थेला आव्हान देऊ शकतात. कंपनीचे यश, नाविन्यपूर्ण तंत्रज्ञान आणि पारंपारिक व्यवसाय मॉडेलमध्ये व्यत्यय आणण्याची तयारी यामुळे उद्योगाला दखल घेण्यास भाग पाडले आहे. DeepSeek चा विकास आणि विस्तार सुरू ठेवतो, तसतसे ते AI च्या भविष्याला आकार देण्यात निःसंशयपणे महत्त्वपूर्ण भूमिका बजावेल.

रोजी अद्यतनित २०२५-०५-१०

# LLM # AIGC # DeepSeek