डीपसीक, एक उभरती हुई चीनी AI स्टार्टअप, अपने महत्वपूर्ण रूप से रियायती फाउंडेशन मॉडलों के साथ लहरें पैदा कर रही है। इस कदम में सबसे महत्वपूर्ण बाधाओं में से एक - लागत को संबोधित करके व्यवसायों के लिए AI अपनाने में क्रांति लाने की क्षमता है।
AI अपनाने की उच्च लागत
बोफा ग्लोबल रिसर्च के विश्लेषकों ब्रैड सिल्ल्स और कार्ली लियू के अनुसार, AI अनुप्रयोगों से जुड़ा खर्च उनके व्यापक कार्यान्वयन में बाधा डालने वाली प्राथमिक बाधा है। उनकी रिपोर्ट, मंगलवार, 28 जनवरी को जारी की गई, बताती है कि लागत में कमी में सफलताएं कीमतों को और कम कर सकती हैं, जिससे गोद लेने की दर बढ़ सकती है।
सोमवार, 27 जनवरी को डीपसीक की घोषणा ने AI उद्योग में सदमे की लहरें भेजीं, जिससे कई AI कंपनियों के शेयरों में गिरावट आई। कंपनी ने 2,048 Nvidia H800 चिप्स का उपयोग करके केवल $5.58 मिलियन में एक फाउंडेशन मॉडल को प्रशिक्षित करने की अपनी क्षमता का खुलासा किया। यह आंकड़ा OpenAI और Anthropic की अनुमानित लागतों के बिल्कुल विपरीत है, जो $100 मिलियन से लेकर एक बिलियन डॉलर तक है और इसमें हजारों Nvidia की AI चिप्स का उपयोग शामिल है।
eSIMple में CTO रॉय बेनेश ने डीपसीक की उपलब्धि की परिवर्तनकारी क्षमता पर जोर देते हुए कहा कि यह छोटे कंपनियों, व्यक्तिगत डेवलपर्स और यहां तक कि शोधकर्ताओं को भी भारी लागतों को वहन किए बिना AI की शक्ति का लाभ उठाने का अधिकार देता है। यह बढ़ी हुई पहुंच अभिनव विचारों और तकनीकों के विकास को बढ़ावा दे सकती है, जिससे क्षेत्र में अधिक प्रतिस्पर्धा हो सकती है। नतीजतन, ग्राहक नए विकल्पों से लाभान्वित हो सकते हैं, जबकि स्थापित AI कंपनियां अपनी कीमतों को कम करने और तकनीकी प्रगति को तेज करने की संभावना है।
बोफा के विश्लेषकों ने मौजूदा AI अनुप्रयोगों से जुड़ी लागतों के उदाहरण प्रदान किए। Microsoft का 365 Copilot Chat अनुरोध की जटिलता के आधार पर प्रति प्रॉम्प्ट 1 सेंट और 30 सेंट के बीच शुल्क लेता है। Salesforce का Agentforce for Service Cloud $2 प्रति रूपांतरण की फ्लैट दर लेता है।
जबकि बोफा ने स्वीकार किया कि डीपसीक द्वारा प्रस्तुत $5.58 मिलियन का आंकड़ा अनुसंधान, प्रयोगों, आर्किटेक्चर, एल्गोरिदम और डेटा से संबंधित लागतों के बहिष्कार के कारण कुछ हद तक भ्रामक है, विश्लेषकों ने कम खर्चीले प्रशिक्षण विधियों की व्यवहार्यता का प्रदर्शन करने में स्टार्टअप के नवाचारों के महत्व पर जोर दिया।
प्री-ट्रेनिंग बनाम इन्फेरेंसिंग: लागतों को समझना
फाउंडेशन AI मॉडल, जैसे कि OpenAI का GPT-4o और Google का Gemini, प्री-ट्रेनिंग नामक एक प्रक्रिया से गुजरते हैं, जहां उन्हें सामान्य ज्ञान विकसित करने के लिए बड़ी मात्रा में डेटा, जैसे कि संपूर्ण इंटरनेट के सामने उजागर किया जाता है। हालाँकि, इन मॉडलों को विशिष्ट कंपनियों और उद्योगों के लिए अधिक प्रासंगिक और उपयोगी बनाने के लिए, उद्यमों को अपने स्वयं के डेटा का उपयोग करके उन्हें आगे प्रशिक्षित या फाइन-ट्यून करने की आवश्यकता होती है।
एक बार AI मॉडल को फाइन-ट्यून करने के बाद, यह उपयोगकर्ता संकेतों को संसाधित कर सकता है और प्रासंगिक प्रतिक्रियाएं उत्पन्न कर सकता है। हालाँकि, मॉडल को संकेत देने और प्रतिक्रिया प्राप्त करने की प्रक्रिया में इन्फेरेंसिंग लागत लगती है, जो नए डेटा को समझने और विश्लेषण करने के लिए मॉडल को संलग्न करने से जुड़ी फीस है।
यह ध्यान रखना महत्वपूर्ण है कि अधिकांश कंपनियां फाउंडेशन मॉडल को प्रशिक्षित करने की लागत वहन नहीं करती हैं। यह जिम्मेदारी OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, कुछ शोध प्रयोगशालाओं और Baidu और Alibaba जैसे चीनी तकनीकी दिग्गजों सहित इन मॉडलों के डेवलपर्स के साथ है।
व्यवसायों को मुख्य रूप से AI वर्कलोड को संसाधित करने के लिए इन्फेरेंसिंग लागत लगती है, जो AI से संबंधित खर्चों का अधिकांश हिस्सा है।
चीन कनेक्शन: डीपसीक की इन्फेरेंसिंग लागत और गोपनीयता चिंताएं
डीपसीक सिलिकॉन वैली की कंपनियों की तुलना में काफी कम लागत पर अपनी इन्फेरेंसिंग सेवाएं प्रदान करता है। हालाँकि, इन सेवाओं का उपयोग करते समय कुछ बातों का ध्यान रखना चाहिए।
डीपसीक की गोपनीयता नीति के अनुसार, उपयोगकर्ता जानकारी चीन में स्थित सर्वरों पर संग्रहीत की जाती है। कंपनी यह भी बताती है कि वह कानूनी दायित्वों का पालन करेगी और सार्वजनिक हित में या अपने उपयोगकर्ताओं और अन्य लोगों के महत्वपूर्ण हितों की रक्षा के लिए कार्य करेगी।
चीन का राष्ट्रीय खुफिया कानून, विशेष रूप से अनुच्छेद 7, अनिवार्य करता है कि सभी संगठन और नागरिक कानून के अनुसार राष्ट्रीय खुफिया प्रयासों का समर्थन, सहायता और सहयोग करें और राष्ट्रीय खुफिया कार्य रहस्यों की रक्षा करें जिनके बारे में उन्हें पता है।
Appvance के CEO केविन सुरास ने गोपनीयता के बारे में चिंता व्यक्त करते हुए कहा कि चीन में उपयोगकर्ताओं से डेटा संग्रह एक आम बात है। उन्होंने उपयोगकर्ताओं को सावधानी बरतने की सलाह दी।
PYMNTS द्वारा किए गए एक प्रयोग में, डीपसीक के चैटबॉट को यह बताने के लिए कहा गया कि 1989 के तियानमेन स्क्वायर विरोध प्रदर्शन ने चीनी राजनीति को कैसे प्रभावित किया है। चैटबॉट ने जवाब दिया, ‘क्षमा करें, मुझे अभी तक यह नहीं पता कि इस प्रकार के प्रश्न को कैसे हल किया जाए।’
Presearch के CEO टिम एनेकिंग ने बताया कि डीपसीक एक 100% चीनी स्वामित्व वाली कंपनी है जो चीन में स्थित है। उन्होंने कहा कि चैटबॉट की तियानमेन स्क्वायर या वरिष्ठ चीनी सरकारी हस्तियों के बारे में जानकारी प्रदान करने में असमर्थता प्रौद्योगिकी की निष्पक्षता में सीमाओं का सुझाव देती है। जबकि एनेकिंग ने प्रौद्योगिकी की रोमांचक क्षमता को स्वीकार किया, उन्होंने इसके नियंत्रण के बारे में चिंता व्यक्त की।
हालांकि, एनेकिंग ने डीपसीक के मॉडलों की ओपन-सोर्स प्रकृति पर भी प्रकाश डाला, जो सरकार और कॉर्पोरेट नियंत्रणों को हटाने के लिए संशोधनों की अनुमति देता है। उनका मानना है कि कंपनी की इंजीनियरिंग रचनात्मकता छोटे कंपनियों और देशों के लिए जेनरेटिव AI परिदृश्य में भाग लेने और सफल होने के अवसर पैदा करती है।
डीपसीक की सभी के लिए अनुमान लागत को कम करने की क्षमता
कम लागत पर फाउंडेशन मॉडल को प्रशिक्षित करने के लिए डीपसीक के अभिनव दृष्टिकोण का Microsoft जैसी कंपनियों के लिए सकारात्मक निहितार्थ है, जो AI कंप्यूटिंग की लागत को कम करना और पैमाने को बढ़ाना जारी रख सकती हैं। सिल्ल्स और लियू के अनुसार, कम कंप्यूटिंग लागत से AI- सक्षम पेशकशों पर बेहतर मार्जिन हो सकता है।
एक अलग शोध नोट में, बोफा के विश्लेषकों अल्केश शाह, एंड्रयू मॉस और ब्रैड सिल्ल्स ने सुझाव दिया कि कम AI कंप्यूट लागत विभिन्न क्षेत्रों, ऑटोमोबाइल से लेकर स्मार्टफोन तक, में व्यापक AI सेवाओं को सक्षम कर सकती है।
हालांकि यह संभावना नहीं है कि OpenAI जैसे फाउंडेशन मॉडल डेवलपर्स तुरंत डीपसीक के रूप में कम प्रशिक्षण लागत प्राप्त करेंगे, विश्लेषकों का मानना है कि डीपसीक की अभिनव प्रशिक्षण और पोस्ट-ट्रेनिंग तकनीकों को प्रतिस्पर्धात्मक फ्रंटियर-मॉडल डेवलपर्स द्वारा दक्षता बढ़ाने के लिए अपनाया जाएगा। हालांकि, वे जोर देते हैं कि AI एजेंटों के लिए नींव बनने के कारण वर्तमान मॉडलों को अभी भी महत्वपूर्ण निवेश की आवश्यकता होगी।
लंबे समय में, विश्लेषकों को चैटबॉट, कोपायलट और एजेंट दोनों के स्मार्ट और सस्ते होने के कारण उद्यमों द्वारा AI को अपनाने में तेजी आने की उम्मीद है, एक ऐसी घटना जिसे जेवन्स विरोधाभास के रूप में जाना जाता है।
Microsoft के CEO सत्य नडेला ने X पर इसी भावना को दोहराते हुए कहा कि जेवन्स विरोधाभास काम कर रहा है क्योंकि AI अधिक कुशल और सुलभ हो रहा है। उनका मानना है कि इससे AI के उपयोग में वृद्धि होगी, जिससे यह एक ऐसी वस्तु में बदल जाएगी जिसे हम पर्याप्त नहीं प्राप्त कर सकते हैं।
फाउंडेशन मॉडल और उनके प्रभाव में गहरी डुबकी
फाउंडेशन मॉडल, आधुनिक AI की रीढ़, व्यवसायों के संचालन और प्रौद्योगिकी के साथ बातचीत करने के तरीके में क्रांति ला रहे हैं। विशाल डेटासेट पर प्रशिक्षित ये मॉडल प्राकृतिक भाषा प्रसंस्करण से लेकर छवि पहचान तक कई प्रकार के कार्यों को करने की क्षमता रखते हैं। हालांकि, इन मॉडलों के विकास और परिनियोजन में प्रशिक्षण लागत, अनुमान लागत, डेटा गोपनीयता और नैतिक विचारों सहित कारकों का एक जटिल अंतःक्रिया शामिल है।
फाउंडेशन मॉडल को समझना
अपने मूल में, फाउंडेशन मॉडल बड़े न्यूरल नेटवर्क होते हैं जिन्हें विशाल डेटासेट पर प्रशिक्षित किया जाता है। यह प्रशिक्षण प्रक्रिया उन्हें डेटा के भीतर पैटर्न और संबंधों को सीखने की अनुमति देती है, जिससे वे उल्लेखनीय सटीकता के साथ विभिन्न प्रकार के कार्यों को करने में सक्षम होते हैं। फाउंडेशन मॉडल के कुछ उदाहरणों में शामिल हैं:
- GPT-4o: OpenAI द्वारा विकसित एक शक्तिशाली भाषा मॉडल, जो मानव-गुणवत्ता वाला पाठ उत्पन्न करने, भाषाओं का अनुवाद करने और व्यापक तरीके से प्रश्नों का उत्तर देने में सक्षम है।
- Google का Gemini: एक मल्टीमॉडल AI मॉडल जो पाठ, छवियों और ऑडियो सहित विभिन्न प्रकार के डेटा को संसाधित और समझ सकता है।
ये मॉडल विशिष्ट कार्यों तक सीमित नहीं हैं, लेकिन अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए अनुकूलित किए जा सकते हैं, जो उन्हें व्यवसायों के लिए बहुमुखी उपकरण बनाते हैं।
प्री-ट्रेनिंग और फाइन-ट्यूनिंग की भूमिका
एक फाउंडेशन मॉडल के विकास में आमतौर पर दो प्रमुख चरण शामिल होते हैं: प्री-ट्रेनिंग और फाइन-ट्यूनिंग।
- प्री-ट्रेनिंग: इस चरण में, मॉडल को सामान्य ज्ञान और भाषा कौशल सीखने के लिए एक विशाल डेटासेट, जैसे कि संपूर्ण इंटरनेट पर प्रशिक्षित किया जाता है। यह प्रक्रिया मॉडल को पाठ को समझने और उत्पन्न करने, भाषाओं का अनुवाद करने और अन्य बुनियादी कार्यों को करने की क्षमता से लैस करती है।
- फाइन-ट्यूनिंग: इस चरण में, प्री-ट्रेन किए गए मॉडल को एक विशेष कार्य या उद्योग से संबंधित एक छोटे, अधिक विशिष्ट डेटासेट पर आगे प्रशिक्षित किया जाता है। यह प्रक्रिया मॉडल को एप्लिकेशन की विशिष्ट आवश्यकताओं के लिए अपने ज्ञान और कौशल को अनुकूलित करने की अनुमति देती है।
उदाहरण के लिए, एक प्री-ट्रेन किए गए भाषा मॉडल को ग्राहक सेवा इंटरैक्शन के डेटासेट पर फाइन-ट्यून किया जा सकता है ताकि एक चैटबॉट बनाया जा सके जो प्रभावी ढंग से ग्राहक पूछताछ का जवाब दे सके।
प्रशिक्षण और अनुमान की लागत
फाउंडेशन मॉडल से जुड़ी लागतों को दो मुख्य श्रेणियों में विभाजित किया जा सकता है: प्रशिक्षण लागत और अनुमान लागत।
- प्रशिक्षण लागत: इन लागतों में फाउंडेशन मॉडल को प्रशिक्षित करने के लिए आवश्यक कम्प्यूटेशनल संसाधन, डेटा और विशेषज्ञता शामिल है। एक बड़े फाउंडेशन मॉडल को प्रशिक्षित करना बेहद महंगा हो सकता है, जिसके लिए अक्सर लाखों डॉलर के निवेश की आवश्यकता होती है।
- अनुमान लागत: इन लागतों में प्रशिक्षित मॉडल का उपयोग भविष्यवाणियां करने या आउटपुट उत्पन्न करने के लिए आवश्यक कम्प्यूटेशनल संसाधन शामिल हैं। अनुमान लागत मॉडल के आकार और जटिलता, संसाधित किए जा रहे डेटा की मात्रा और उपयोग किए जा रहे बुनियादी ढांचे के आधार पर भिन्न हो सकती है।
डीपसीक का नवाचार फाउंडेशन मॉडल से जुड़ी प्रशिक्षण लागत को काफी कम करने की अपनी क्षमता में निहित है, जिससे वे व्यवसायों और संगठनों की एक विस्तृत श्रृंखला के लिए अधिक सुलभ हो जाते हैं।
गोपनीयता और नैतिक चिंताओं को संबोधित करना
फाउंडेशन मॉडल का उपयोग डेटा गोपनीयता और नैतिक विचारों के बारे में महत्वपूर्ण प्रश्न उठाता है। फाउंडेशन मॉडल को विशाल डेटासेट पर प्रशिक्षित किया जाता है, जिसमें संवेदनशील या व्यक्तिगत जानकारी हो सकती है। यह सुनिश्चित करना महत्वपूर्ण है कि इन मॉडलों का उपयोग एक जिम्मेदार और नैतिक तरीके से किया जाए, उपयोगकर्ता गोपनीयता का सम्मान किया जाए और पूर्वाग्रह से बचा जाए।
इन चिंताओं को दूर करने के लिए कुछ रणनीतियों में शामिल हैं:
- डेटा अनामीकरण: उपयोगकर्ता गोपनीयता की रक्षा के लिए प्रशिक्षण डेटा से व्यक्तिगत जानकारी को हटाना या मास्किंग करना।
- पूर्वाग्रह का पता लगाना और शमन: यह सुनिश्चित करने के लिए प्रशिक्षण डेटा में पूर्वाग्रहों की पहचान करना और उन्हें संबोधित करना कि मॉडल हानिकारक रूढ़ियों या भेदभावपूर्ण प्रथाओं को कायम नहीं रखता है।
- पारदर्शिता और जवाबदेही: मॉडल कैसे काम करता है और इसका उपयोग कैसे किया जा रहा है, इसके बारे में स्पष्ट जानकारी प्रदान करना, और त्रुटियों या अनपेक्षित परिणामों के मामले में जवाबदेही के लिए तंत्र स्थापित करना।
जैसे-जैसे फाउंडेशन मॉडल अधिक प्रचलित होते जाते हैं, यह सुनिश्चित करने के लिए कि उनका उपयोग समाज के लाभ के लिए किया जाता है, इन गोपनीयता और नैतिक चिंताओं को सक्रिय रूप से संबोधित करना आवश्यक है।
फाउंडेशन मॉडल का भविष्य
फाउंडेशन मॉडल तेजी से विकसित हो रहे हैं, और समाज पर उनका संभावित प्रभाव बहुत अधिक है। भविष्य में, हम यह देखने की उम्मीद कर सकते हैं:
- अधिक शक्तिशाली और बहुमुखी मॉडल: जैसे-जैसे शोधकर्ता नए आर्किटेक्चर और प्रशिक्षण तकनीकों को विकसित करना जारी रखते हैं, फाउंडेशन मॉडल और भी अधिक शक्तिशाली और बहुमुखी हो जाएंगे, जो अधिक सटीकता के साथ कार्यों की एक विस्तृत श्रृंखला को करने में सक्षम होंगे।
- बढ़ी हुई पहुंच: जैसे-जैसे प्रशिक्षण लागत घटती है और क्लाउड-आधारित AI प्लेटफॉर्म अधिक प्रचलित होते जाते हैं, फाउंडेशन मॉडल सभी आकार के व्यवसायों के लिए अधिक सुलभ हो जाएंगे।
- नए अनुप्रयोग और उपयोग के मामले: फाउंडेशन मॉडल विभिन्न उद्योगों, स्वास्थ्य सेवा से लेकर वित्त से लेकर शिक्षा तक नए और अभिनव उपयोग के मामलों पर लागू होना जारी रखेंगे।
फाउंडेशन मॉडल का उदय कृत्रिम बुद्धिमत्ता के क्षेत्र में एक प्रतिमान बदलाव का प्रतिनिधित्व करता है। उनकी क्षमताओं, लागतों और नैतिक विचारों को समझकर, हम एक बेहतर भविष्य बनाने के लिए उनकी शक्ति का उपयोग कर सकते हैं।
AI के लोकतंत्रीकरण में डीपसीक का योगदान
फाउंडेशन मॉडल को प्रशिक्षित करने की लागत को काफी कम करने में डीपसीक की उपलब्धि AI के लोकतंत्रीकरण में एक महत्वपूर्ण क्षण है। प्रवेश में बाधा को कम करके, डीपसीक AI क्रांति में भाग लेने के लिए संगठनों और व्यक्तियों की एक विस्तृत श्रृंखला को सशक्त बना रहा है।
छोटे व्यवसायों पर प्रभाव
छोटे व्यवसायों में अक्सर अपने स्वयं के AI मॉडल विकसित और तैनात करने के लिए संसाधनों और विशेषज्ञता का अभाव होता है। डीपसीक के लागत प्रभावी फाउंडेशन मॉडल इन व्यवसायों को अत्याधुनिक AI तकनीक तक पहुंच प्रदान करते हैं जो पहले पहुंच से बाहर थी। यह खेल के मैदान को समतल कर सकता है, जिससे छोटे व्यवसायों को बड़े, अधिक स्थापित कंपनियों के साथ अधिक प्रभावी ढंग से प्रतिस्पर्धा करने की अनुमति मिलती है।
उदाहरण के लिए, एक छोटा ई-कॉमर्स व्यवसाय अपने ग्राहकों के लिए उत्पाद अनुशंसाओं को वैयक्तिकृत करने, अपनी ग्राहक सेवा में सुधार करने या अपने मार्केटिंग अभियानों को स्वचालित करने के लिए डीपसीक के मॉडल का उपयोग कर सकता है।
व्यक्तिगत डेवलपर्स का सशक्तिकरण
डीपसीक के मॉडल व्यक्तिगत डेवलपर्स और शोधकर्ताओं को नए AI अनुप्रयोगों और नवाचारों का पता लगाने के लिए भी सशक्त बनाते हैं। किफायती फाउंडेशन मॉडल तक पहुंच के साथ, डेवलपर्स विभिन्न विचारों के साथ प्रयोग कर सकते हैं, नए AI-संचालित उपकरण विकसित कर सकते हैं और AI तकनीक की उन्नति में योगदान कर सकते हैं।
इससे नवाचार में वृद्धि हो सकती है, क्योंकि अधिक लोगों को AI के विकास में भाग लेने का अवसर मिलता है।
ओपन-सोर्स सहयोग की संभावना
डीपसीक का ओपन-सोर्स दृष्टिकोण AI समुदाय में सहयोग और नवाचार को और बढ़ावा देता है। अपने मॉडलों को जनता के लिए उपलब्ध कराकर, डीपसीक डेवलपर्स को उनके सुधार में योगदान करने, बगों की पहचान करने और उन्हें ठीक करने और नई सुविधाओं को विकसित करने के लिए प्रोत्साहित करता है।
यह सहयोगात्मक दृष्टिकोण AI तकनीक के विकास को गति दे सकता है और यह सुनिश्चित कर सकता है कि इसका उपयोग सभी के लाभ के लिए किया जाए।
AI अपनाने में तेजी
AI की लागत को कम करके, डीपसीक विभिन्न उद्योगों में AI को अपनाने में तेजी ला रहा है। जैसे-जैसे AI अधिक किफायती और सुलभ होता जाएगा, अधिक व्यवसाय इसे अपने संचालन में एकीकृत करने में सक्षम होंगे, जिससे उत्पादकता, दक्षता और नवाचार में वृद्धि होगी।
इसका वैश्विक अर्थव्यवस्था पर गहरा प्रभाव पड़ सकता है, जिससे विकास को बढ़ावा मिल सकता है और नए अवसर पैदा हो सकते हैं।
एक अधिक समावेशी AI पारिस्थितिकी तंत्र
AI को लोकतांत्रिक बनाने के लिए डीपसीक के प्रयास एक अधिक समावेशी AI पारिस्थितिकी तंत्र में योगदान कर रहे हैं, जहां अधिक लोगों को AI के विकास और उपयोग में भाग लेने का अवसर मिलता है। यह यह सुनिश्चित करने में मदद कर सकता है कि AI का उपयोग इस तरह से किया जाए जिससे समाज के सभी सदस्यों को लाभ हो, न कि केवल कुछ चुनिंदा लोगों को।
छोटे व्यवसायों, व्यक्तिगत डेवलपर्स और शोधकर्ताओं को सशक्त बनाकर, डीपसीक एक अधिक विविध और नवीन AI परिदृश्य को बढ़ावा दे रहा है।