AI खर्च: मांग दक्षता पर हावी

शुरुआती हलचल: DeepSeek और दक्षता का भ्रम

इस साल की शुरुआत में चीन के DeepSeek AI के उभरने से तकनीकी निवेश परिदृश्य में हलचल मच गई। इसके प्रतीत होने वाले अभूतपूर्व दृष्टिकोण, जिसमें काफी कम कम्प्यूटेशनल ओवरहेड के साथ शक्तिशाली आर्टिफिशियल इंटेलिजेंस का वादा किया गया था, ने तुरंत अटकलों को जन्म दिया। जल्द ही एक कहानी बन गई: शायद AI बुनियादी ढांचे का निरंतर, महंगा विस्तार, जो विशेष चिप्स और सिस्टम की भारी खरीद की विशेषता है, धीमा होने वाला था। बाजार ने प्रतिक्रिया व्यक्त की, यह विश्वास दर्शाते हुए कि लागत प्रभावी AI का एक नया युग प्रत्याशित खर्च में भारी कटौती कर सकता है।

हालांकि, उद्योग के दिग्गजों की हालिया उच्च-स्तरीय सभा से मिली अंतर्दृष्टि एक बिल्कुल अलग तस्वीर पेश करती है। Bloomberg Intelligence द्वारा न्यूयॉर्क में आयोजित एक जनरेटिव AI सम्मेलन ने सुझाव दिया कि प्रारंभिक व्याख्या, जो केवल संभावित लागत बचत पर केंद्रित थी, बड़ी कहानी से चूक गई। खर्च में मंदी का संकेत देने के बजाय, इस आयोजन ने अधिक AI क्षमता के लिए लगभग अतृप्त भूख को रेखांकित किया। आम सहमति कटौती करने के बारे में नहीं थी; यह पता लगाने के बारे में था कि बुद्धिमान प्रणालियों के लिए तेजी से बढ़ती भूख को कैसे पूरा किया जाए, भले ही यह सख्त इच्छा हो कि मेनू कम महंगा हो।

जमीनी स्तर से आवाजें: क्षमता की अतृप्त प्यास

दिन भर चले इस आयोजन के दौरान हुई चर्चाओं, जिसमें डेवलपर्स, रणनीतिकार और निवेशक एक साथ आए, लगातार बढ़ती मांग के विषय पर केंद्रित रहीं जो भारी निवेश को प्रेरित कर रही थी। Bloomberg Intelligence के एक वरिष्ठ प्रौद्योगिकी विश्लेषक और आयोजन के आयोजकों में से एक, Mandeep Singh ने प्रचलित भावना को संक्षेप में व्यक्त किया। कई पैनलों और विशेषज्ञ चर्चाओं पर विचार करते हुए, उन्होंने एक सार्वभौमिक बात नोट की: शामिल किसी को भी यह महसूस नहीं हुआ कि उनके पास पर्याप्त AI क्षमता है। अत्यधिक भावना अधिक की आवश्यकता की थी, न कि बहुत अधिक होने की।

महत्वपूर्ण रूप से, Singh ने कहा, ‘बुनियादी ढांचे के बुलबुले’ का डर, जो तेजी से बढ़ते तकनीकी क्षेत्रों में एक आम डर है, बातचीत से विशेष रूप से अनुपस्थित था। ध्यान पूरी तरह से पूरे उद्योग के सामने आने वाली मूलभूत चुनौती पर केंद्रित रहा। Singh के सहयोगी और Bloomberg Intelligence के IT सेवाओं और सॉफ्टवेयर के वरिष्ठ विश्लेषक, Anurag Rana ने इसे सर्वोपरि प्रश्न के रूप में प्रस्तुत किया: ‘हम उस [AI बुनियादी ढांचे के निर्माण] चक्र में कहाँ हैं?’

यह स्वीकार करते हुए कि इस विशाल निर्माण के सटीक चरण का पता लगाना मायावी बना हुआ है (‘कोई निश्चित रूप से नहीं जानता’, Rana ने स्वीकार किया), DeepSeek घटना ने निस्संदेह दृष्टिकोण बदल दिया। इसने एक शक्तिशाली आशा जगाई कि महत्वपूर्ण AI वर्कलोड को संभावित रूप से अधिक किफायती तरीके से संभाला जा सकता है। ‘DeepSeek ने बहुत से लोगों को हिला दिया’, Rana ने देखा। निहितार्थ स्पष्ट था: यदि परिष्कृत AI मॉडल वास्तव में कम मांग वाले हार्डवेयर पर कुशलता से चल सकते हैं, तो शायद विशाल परियोजनाएं, जैसे कि प्रमुख तकनीकी खिलाड़ियों को शामिल करने वाले कंसोर्टिया द्वारा नियोजित होने वाली अफवाह वाली बहु-सौ-अरब-डॉलर की पहल, का पुनर्मूल्यांकन या अलग तरह से मापन किया जा सकता है।

Rana के अनुसार, पूरे उद्योग में गूंजने वाला सपना, AI परिचालन लागतों के लिए है, विशेष रूप से inference (वह चरण जहां प्रशिक्षित मॉडल भविष्यवाणियां या सामग्री उत्पन्न करते हैं), पिछले दशक में क्लाउड कंप्यूटिंग स्टोरेज में देखी गई नाटकीय गिरावट की प्रवृत्ति का पालन करना। उन्होंने याद किया कि Amazon Web Services (AWS) जैसे प्लेटफार्मों पर बड़ी मात्रा में डेटा संग्रहीत करने की अर्थशास्त्र लगभग आठ वर्षों में नाटकीय रूप से सुधरी। ‘लागत वक्र में वह गिरावट… अर्थशास्त्र अच्छा था’, उन्होंने कहा। ‘और यही हर कोई उम्मीद कर रहा है, कि inference पक्ष पर… यदि वक्र उस स्तर तक गिर जाता है, हे भगवान, AI पर अपनाने की दर… शानदार होने वाली है।’ Singh ने सहमति व्यक्त की, यह देखते हुए कि DeepSeek के आगमन ने मौलिक रूप से ‘दक्षता प्राप्त करने के बारे में सभी की मानसिकता बदल दी है।’

दक्षता के लिए यह लालसा पूरे सम्मेलन सत्रों में स्पष्ट थी। जबकि कई पैनलों ने उद्यम AI परियोजनाओं को वैचारिक चरणों से लाइव उत्पादन में ले जाने की व्यावहारिकता पर विचार किया, एक समानांतर चर्चा ने लगातार इन AI मॉडलों को तैनात करने और चलाने से जुड़ी लागतों में कटौती करने की महत्वपूर्ण आवश्यकता पर जोर दिया। लक्ष्य स्पष्ट है: अनुप्रयोगों और उपयोगकर्ताओं की एक विस्तृत श्रृंखला केलिए AI को आर्थिक रूप से व्यवहार्य बनाकर पहुंच का लोकतंत्रीकरण करना। Bloomberg के अपने मुख्य प्रौद्योगिकीविद्, Shawn Edwards ने सुझाव दिया कि DeepSeek जरूरी नहीं कि एक पूर्ण आश्चर्य था, बल्कि एक सार्वभौमिक इच्छा का एक शक्तिशाली चित्रण था। ‘इसने मुझे सोचने पर मजबूर किया कि यह बहुत अच्छा होगा यदि आप एक छड़ी लहरा सकें और इन मॉडलों को अविश्वसनीय रूप से कुशलता से चला सकें’, उन्होंने टिप्पणी की, इच्छा को AI मॉडल के पूरे स्पेक्ट्रम तक बढ़ाते हुए, न कि केवल एक विशिष्ट सफलता तक।

प्रसार सिद्धांत: कंप्यूट मांग को बढ़ावा देना

विशेषज्ञों द्वारा दक्षता की खोज के बावजूद AI बुनियादी ढांचे में निरंतर, पर्याप्त निवेश की उम्मीद करने का एक प्राथमिक कारण AI मॉडल का प्रसार है। न्यूयॉर्क सम्मेलन के दौरान एक आवर्ती विषय सभी कार्यों को संभालने में सक्षम एकल, अखंड AI मॉडल की धारणा से निर्णायक कदम दूर था।

  • एक पारिवारिक मामला: जैसा कि Bloomberg के Edwards ने कहा, ‘हम मॉडल के एक परिवार का उपयोग करते हैं। सर्वश्रेष्ठ मॉडल जैसी कोई चीज नहीं है।’ यह बढ़ती समझ को दर्शाता है कि विभिन्न AI आर्किटेक्चर विभिन्न कार्यों में उत्कृष्टता प्राप्त करते हैं - भाषा निर्माण, डेटा विश्लेषण, छवि पहचान, कोड पूर्णता, इत्यादि।
  • एंटरप्राइज कस्टमाइज़ेशन: पैनलिस्ट व्यापक रूप से सहमत थे कि जबकि बड़े, सामान्य-उद्देश्य वाले ‘foundation’ या ‘frontier’ मॉडल प्रमुख AI प्रयोगशालाओं द्वारा विकसित और परिष्कृत किए जाते रहेंगे, व्यवसायों के भीतर वास्तविक कार्रवाई में संभावित रूप से सैकड़ों या हजारों विशेषज्ञ AI मॉडल तैनात करना शामिल है।
  • Fine-Tuning और मालिकाना डेटा: इनमें से कई एंटरप्राइज मॉडल fine-tuning नामक प्रक्रिया के माध्यम से बेस मॉडल से अनुकूलित किए जाएंगे। इसमें कंपनी के विशिष्ट, अक्सर मालिकाना, डेटा पर एक पूर्व-प्रशिक्षित न्यूरल नेटवर्क को फिर से प्रशिक्षित करना शामिल है। यह AI को अद्वितीय व्यावसायिक संदर्भों, शब्दावली और ग्राहक इंटरैक्शन को समझने की अनुमति देता है, जो एक सामान्य मॉडल की तुलना में कहीं अधिक प्रासंगिक और मूल्यवान परिणाम प्रदान करता है।
  • विकास का लोकतंत्रीकरण: डेटा साइंस प्लेटफॉर्म Dataiku का प्रतिनिधित्व करने वाले Jed Dougherty ने एंटरप्राइज AI एजेंटों के लिए ‘मॉडल के बीच वैकल्पिक विकल्प’ की आवश्यकता पर प्रकाश डाला। उन्होंने कंपनियों को उनके AI उपकरणों पर नियंत्रण, निर्माण क्षमताएं और auditability देने के महत्व पर जोर दिया। ‘हम इन चीजों को बनाने के लिए उपकरण लोगों के हाथों में देना चाहते हैं’, Dougherty ने जोर देकर कहा। ‘हम नहीं चाहते कि दस PhD सभी एजेंटों का निर्माण करें।’ विकास में व्यापक पहुंच की ओर यह अभियान स्वयं इन वितरित निर्माण प्रयासों का समर्थन करने के लिए अधिक अंतर्निहित बुनियादी ढांचे की आवश्यकता का तात्पर्य है।
  • ब्रांड-विशिष्ट AI: रचनात्मक उद्योग एक प्रमुख उदाहरण प्रस्तुत करते हैं। Adobe में नए व्यावसायिक उद्यमों का नेतृत्व करने वाली Hannah Elsakr ने कस्टम मॉडल पर दांव लगाने की उनकी रणनीति को एक प्रमुख विभेदक के रूप में समझाया। ‘हम आपके ब्रांड के लिए कस्टम मॉडल एक्सटेंशन प्रशिक्षित कर सकते हैं जो एक नए विज्ञापन अभियान के लिए सहायक हो सकते हैं’, उन्होंने स्पष्ट किया, यह दर्शाते हुए कि विशिष्ट ब्रांड सौंदर्यशास्त्र और संदेश को बनाए रखने के लिए AI को कैसे अनुकूलित किया जा सकता है।

मॉडल के विविधीकरण से परे, कॉर्पोरेट वर्कफ़्लो के भीतर AI agents की बढ़ती तैनाती प्रसंस्करण मांग का एक और महत्वपूर्ण चालक है। इन एजेंटों की कल्पना केवल निष्क्रिय उपकरणों के रूप में नहीं बल्कि बहु-चरणीय कार्यों को निष्पादित करने में सक्षम सक्रिय प्रतिभागियों के रूप में की जाती है।

Microsoft के Copilot Studio एजेंटों और स्वचालन प्रयासों के प्रमुख Ray Smith ने एक ऐसे भविष्य की भविष्यवाणी की जहां उपयोगकर्ता Copilot जैसे एकीकृत इंटरफ़ेस के माध्यम से संभावित रूप से सैकड़ों विशेष एजेंटों के साथ बातचीत करेंगे। ‘आप एक पूरी प्रक्रिया को एक एजेंट में नहीं ठूंसेंगे, आप इसे भागों में तोड़ देंगे’, उन्होंने समझाया। ये एजेंट, उन्होंने सुझाव दिया, अनिवार्य रूप से प्रोग्रामिंग की ‘नई दुनिया में ऐप्स’ हैं। दृष्टि यह है कि उपयोगकर्ता बस अपना लक्ष्य बताएं - ‘उन्हें बताएं कि हम क्या हासिल करना चाहते हैं’ - और एजेंट आवश्यक कदम उठाएगा। ‘Agentic ऐप्स सिर्फ वर्कफ़्लो का एक नया तरीका है’, Smith ने कहा, इस बात पर जोर देते हुए कि इस दृष्टि को साकार करना तकनीकी संभावना का मामला कम है (‘यह सब तकनीकी रूप से संभव है’) और ‘जिस गति से हम इसे बनाते हैं’ के बारे में अधिक है।

AI एजेंटों को रोजमर्रा की संगठनात्मक प्रक्रियाओं में अधिक गहराई से एम्बेड करने का यह दबाव लागत में कमी और कुशल तैनाती के लिए दबाव को और तेज करता है। माइक्रोप्रोसेसर दिग्गज ARM Holdings में उत्पाद प्रबंधन के प्रमुख James McNiven ने पहुंच के संदर्भ में चुनौती पेश की। ‘हम अधिक से अधिक उपकरणों पर पहुंच कैसे प्रदान करते हैं?’ उन्होंने विचार किया। विशिष्ट कार्यों में लगभग ‘PhD-स्तर’ की क्षमताओं को प्राप्त करने वाले मॉडलों को देखते हुए, उन्होंने वर्षों पहले विकासशील देशों में मोबाइल भुगतान प्रणाली लाने के परिवर्तनकारी प्रभाव के समानांतर एक रेखा खींची। मूल प्रश्न बना हुआ है: ‘हम उस [AI क्षमता] को उन लोगों तक कैसे पहुंचाएं जो उस क्षमता का उपयोग कर सकते हैं?’ परिष्कृत AI एजेंटों को कार्यबल के एक व्यापक वर्ग के लिए सहायकों के रूप में आसानी से उपलब्ध कराने के लिए न केवल चतुर सॉफ्टवेयर बल्कि कुशल हार्डवेयर और, अनिवार्य रूप से, अधिक अंतर्निहित बुनियादी ढांचे के निवेश की आवश्यकता होती है, भले ही प्रति गणना दक्षता में सुधार हो।

स्केलिंग बाधाएं: सिलिकॉन, पावर, और क्लाउड दिग्गज

यहां तक कि सबसे व्यापक रूप से उपयोग किए जाने वाले, सामान्य फाउंडेशन मॉडल भी आश्चर्यजनक गति से बढ़ रहे हैं, जिससे मौजूदा बुनियादी ढांचे पर भारी दबाव पड़ रहा है। Amazon Web Services (AWS) के लिए कंप्यूटिंग और नेटवर्किंग की देखरेख करने वाले Dave Brown ने खुलासा किया कि उनका प्लेटफॉर्म अकेले ग्राहकों को लगभग 1,800 विभिन्न AI मॉडलों तक पहुंच प्रदान करता है। उन्होंने इन शक्तिशाली उपकरणों को चलाने की ‘लागत को कम करने के लिए बहुत कुछ करने’ पर AWS के गहन ध्यान को रेखांकित किया।

AWS जैसे क्लाउड प्रदाताओं के लिए एक प्रमुख रणनीति में अपना custom silicon विकसित करना शामिल है। Brown ने AWS-डिज़ाइन किए गए चिप्स के बढ़ते उपयोग पर प्रकाश डाला, जैसे कि उनके Trainium प्रोसेसर जो AI प्रशिक्षण के लिए अनुकूलित हैं, यह कहते हुए, ‘AWS अन्य कंपनियों के प्रोसेसर की तुलना में हमारे अपने प्रोसेसर का अधिक उपयोग कर रहा है।’ विशेष, इन-हाउस हार्डवेयर की ओर यह कदम प्रदर्शन और लागत पर नियंत्रण पाने का लक्ष्य रखता है, जिससे Nvidia, AMD, और Intel जैसे सामान्य-उद्देश्य वाले चिप आपूर्तिकर्ताओं पर निर्भरता कम हो जाती है। इन प्रयासों के बावजूद, Brown ने स्पष्ट रूप से मौलिक वास्तविकता को स्वीकार किया: ‘यदि लागत कम होती तो ग्राहक और अधिक करते।’ मांग की सीमा वर्तमान में संभावित अनुप्रयोगों की कमी के बजाय बजट की कमी से अधिक परिभाषित है।

अग्रणी AI डेवलपर्स द्वारा आवश्यक संसाधनों का पैमाना बहुत बड़ा है। Brown ने Anthropic के साथ AWS के दैनिक सहयोग का उल्लेख किया, जो भाषा मॉडल के परिष्कृत Claude परिवार के निर्माता हैं। Anthropic के एप्लीकेशन प्रोग्रामिंग इंटरफेस के प्रमुख Michael Gerstenhaber ने Brown के साथ बोलते हुए, आधुनिक AI की कम्प्यूटेशनल तीव्रता की ओर इशारा किया, विशेष रूप से जटिल तर्क या ‘सोचने’ के लिए डिज़ाइन किए गए मॉडल। ये मॉडल अक्सर अपने उत्तरों के लिए विस्तृत चरण-दर-चरण स्पष्टीकरण उत्पन्न करते हैं, जिससे महत्वपूर्ण प्रसंस्करण शक्ति की खपत होती है। ‘सोचने वाले मॉडल बहुत अधिक क्षमता का उपयोग करने का कारण बनते हैं’, Gerstenhaber ने कहा।

जबकि Anthropic सक्रिय रूप से AWS के साथ ‘prompt caching’ (संसाधनों को बचाने के लिए पिछली इंटरैक्शन से गणनाओं को संग्रहीत और पुन: उपयोग करना) जैसी अनुकूलन तकनीकों पर काम करता है, मौलिक हार्डवेयर आवश्यकता बहुत बड़ी बनी हुई है। Gerstenhaber ने स्पष्ट रूप से कहा कि Anthropic को केवल अपने मॉडल के वर्तमान सूट को चलाने के लिए ‘कई डेटा केंद्रों’ में वितरित ‘सैकड़ों हजारों accelerators’ - विशेष AI चिप्स - की आवश्यकता है। यह केवल एक प्रमुख AI खिलाड़ी को रेखांकित करने वाले कंप्यूट संसाधनों के विशाल पैमाने की ठोस समझ प्रदान करता है।

सिलिकॉन के विशाल बेड़े की खरीद और प्रबंधन की चुनौती को बढ़ाते हुए AI से जुड़ी बढ़ती ऊर्जा खपत है। Brown ने इसे एक महत्वपूर्ण, और तेजी से बढ़ती, चिंता के रूप में उजागर किया। गहन AI वर्कलोड का समर्थन करने वाले वर्तमान डेटा केंद्र पहले से ही सैकड़ों मेगावाट में मापी गई बिजली की खपत कर रहे हैं। अनुमान बताते हैं कि भविष्य की आवश्यकताएं अनिवार्य रूप से गीगावाट रेंज में चढ़ेंगी - बड़े बिजली संयंत्रों का उत्पादन। ‘यह जो बिजली की खपत करता है’, Brown ने AI का जिक्र करते हुए चेतावनी दी, ‘बड़ी है, और कई डेटा केंद्रों में पदचिह्न बड़ा है।’ यह बढ़ती ऊर्जा मांग न केवल भारी परिचालन लागत प्रस्तुत करती है, बल्कि AI बुनियादी ढांचे की अगली पीढ़ी को स्थापित करने और बिजली देने के लिए महत्वपूर्ण पर्यावरणीय और लॉजिस्टिक चुनौतियां भी प्रस्तुत करती है।

आर्थिक वाइल्डकार्ड: विकास योजनाओं पर एक छाया

तकनीकी प्रगति और बढ़ते उपयोग के मामलों से प्रेरित उत्साही दृष्टिकोण के बावजूद, AI निवेश के लिए सभी अनुमानों पर एक महत्वपूर्ण चर मंडरा रहा है: व्यापक आर्थिक माहौल। जैसा कि Bloomberg Intelligence सम्मेलन समाप्त हुआ, उपस्थित लोग पहले से ही नव घोषित वैश्विक टैरिफ पैकेजों से उत्पन्न बाजार की घबराहट देख रहे थे, जिन्हें प्रत्याशित से अधिक व्यापक माना गया था।

यह एक शक्तिशाली अनुस्मारक के रूप में कार्य करता है कि महत्वाकांक्षी तकनीकी रोडमैप व्यापक आर्थिक बाधाओं से तेजी से बाधित हो सकते हैं। Bloomberg के Rana ने आगाह किया कि जबकि AI खर्च शुरू में कुछ हद तक अछूता रह सकता है, कॉर्पोरेट IT निवेश के पारंपरिक क्षेत्र, जैसे कि AI से असंबंधित सर्वर और स्टोरेज, आर्थिक संकुचन में पहली жертва हो सकते हैं। ‘दूसरी बड़ी बात जिस पर हम ध्यान केंद्रित कर रहे हैं, वह गैर-AI तकनीकी खर्च है’, उन्होंने कहा, विशेष रूप से AI बजट पर विचार करने से पहले भी, आय के मौसम में प्रमुख तकनीकी सेवा प्रदाताओं पर संभावित प्रभाव के बारे में चिंता व्यक्त करते हुए।

हालांकि, एक प्रचलित सिद्धांत है कि AI विशिष्ट रूप से लचीला साबित हो सकता है। Rana ने सुझाव दिया कि प्रमुख निगमों में मुख्य वित्तीय अधिकारी (CFOs), आर्थिक अनिश्चितता या मंदी के कारण बजट की कमी का सामना कर रहे हैं, AI पहलों को प्राथमिकता देना चुन सकते हैं। वे संभावित रूप से भविष्य की प्रतिस्पर्धात्मकता के लिए महत्वपूर्ण माने जाने वाले रणनीतिक AI निवेशों की रक्षा के लिए कम महत्वपूर्ण क्षेत्रों से धन स्थानांतरित कर सकते हैं।

फिर भी, यह आशावादी दृष्टिकोण गारंटी से बहुत दूर है। Rana के अनुसार, अंतिम परीक्षा यह होगी कि क्या बड़े निगम बढ़ती आर्थिक अनिश्चितता के सामने अपने आक्रामक पूंजीगत व्यय लक्ष्यों को बनाए रखते हैं, विशेष रूप से AI डेटा केंद्रों के निर्माण के लिए। महत्वपूर्ण प्रश्न बना हुआ है: ‘क्या वे कहने जा रहे हैं, ‘आप जानते हैं क्या? यह बहुत अनिश्चित है।’’ इसका उत्तर यह निर्धारित करेगा कि क्या AI बुनियादी ढांचे के खर्च के पीछे प्रतीत होने वाली अजेय गति अपनी निरंतर चढ़ाई जारी रखती है या वैश्विक आर्थिक वास्तविकताओं द्वारा निर्धारित एक अप्रत्याशित ठहराव का सामना करती है।