कृत्रिम बुद्धिमत्ता कारखान्यांचा उदय: १२,००० वर्षांची अटळता

कृत्रिम बुद्धिमत्ता (Artificial Intelligence) क्षेत्रात, संदर्भाला सर्वाधिक महत्त्व आहे. मानवी बुद्धिमत्तेचे हेच प्रतिबिंब आहे, कारण आपणच आपल्या प्रतिरूपात AI तयार केले आहे.

आजकाल, NVIDIA सारख्या कंपन्या AI कारखान्यांचा (AI Factories) पुरस्कार करत आहेत. हे मूलत: सुपरकॉम्प्युटर आहेत जे मोठ्या प्रमाणात डेटा process करून बुद्धिमत्तापूर्ण प्रतिसाद देतात. यामुळे जागतिक अर्थव्यवस्था आणि संस्कृतीत महत्त्वपूर्ण बदल घडवून आणता येतात.

पण आपण या टप्प्यावर कसे पोहोचलो? याचे उत्तर नेहमीप्रमाणे, अनेक क्रमिक सुधारणांमध्ये दडलेले आहे.

AI कारखाने आणि व्यवसायाच्या आणि समाजाच्या भविष्यावर त्याचे परिणाम याबद्दल अधिक माहिती पाहण्यापूर्वी, काही मूलभूत संदर्भ समजून घेणे आवश्यक आहे.

नवपाषाण क्रांती: नवकल्पनांची पेरणी

सुमारे १२,००० वर्षांपूर्वी, आपले पूर्वज भटक्या शिकारी-संकलक जीवनशैलीतून स्थायिक शेतीत रूपांतरित झाले. त्यांनी अन्न उत्पादनासाठी वनस्पतींची लागवड आणि प्राण्यांचे पालनपोषण करण्यास सुरुवात केली. शेती, किंवा कृषी व्यवसाय, हा एक प्राथमिक अन्न कारखाना आहे, जो वनस्पती आणि प्राण्यांच्या वाढीसाठी सूर्यप्रकाश, पाणी आणि हवेवर अवलंबून असतो. ‘फर्मा’ हा शब्द, मध्ययुगीन काळात जमिनीच्या लागवडीसाठी निश्चित भाडे दर्शवण्यासाठी वापरला जात होता, जो पुढे शेतीचा समानार्थी बनला.

शेतीमुळे कार्यक्षम शेती कार्यांसाठी श्रेणीबद्ध सामाजिक संरचना आवश्यक झाली. लेखन हे एक प्रशासकीय साधन म्हणून उदयास आले, ज्यामुळे या अन्न कारखान्यांमधील इनपुट आणि आउटपुटचा मागोवा घेणे आणि सामाजिक नियम स्थापित करणे सोपे झाले. कालांतराने, लेखनाचा विस्तार विविध क्षेत्रांमध्ये झाला आणि ते जटिल माहिती प्रसारित करण्याचे एक प्रभावी माध्यम बनले.

ज्या क्षणी आपण धनुष्यबाण आणि भाले यांच्याऐवजी कुदळ, खुरपी आणि नांगर वापरण्यास सुरुवात केली, आणि माती किंवा दगडांमध्ये पहिले प्रतीकात्मक चित्र कोरले, तेव्हा AI चा उदय आणि परिणामी, AI कारखाना अटळ झाला. हा केवळ वेळेचा प्रश्न होता.

औद्योगिक क्रांती: मोठ्या प्रमाणावर उत्पादनाचा मार्ग

हजारो वर्षांपासून, मानवतेने आपली कृषी कौशल्ये सुधारली, ज्यामुळे अतिरिक्त उत्पादन झाले आणि व्यापारी वर्गाचा उदय झाला - जे लोक इतरांसाठी वस्तू तयार करण्यात गुंतलेले होते, किंवा ‘उत्पादन’ करत होते. यातून पैशांचा विकास झाला, जे विनिमयाचे माध्यम बनले आणि वस्तूंच्या देवाणघेवाणीला गती देऊन आधुनिक अर्थव्यवस्थेत रूपांतरित झाले. शोध युगाच्या (Age of Exploration) नंतर जागतिकीकरणामुळे प्रादेशिक आणि राष्ट्रीय अर्थव्यवस्था जोडल्या गेल्या.

जागतिकीकरणाच्या पुढील लाटांनी शेती आणि उत्पादन या दोन्ही क्षेत्रांना नव्याने आकार दिला. कारखान्यांमधील एक महत्त्वाचा बदल, म्हणजे प्रमाणित उत्पादनाचे केंद्र, उत्पादन प्रक्रियेला वेगळ्या चरणांमध्ये विभाजित करणे, ज्यामुळे गती आणि पुनरावृत्ती सुधारली. ही औद्योगिक क्रांती प्रबोधन युगाच्या (Enlightenment) बरोबरीने झाली. या काळात साक्षरतेचे प्रमाण वाढले कारण कारखान्यांना कार्यक्षमतेत सुधारणा करण्यासाठी आणि कचरा कमी करण्यासाठी शिक्षित कामगरांची आवश्यकता होती. शिक्षण आवश्यक बनले, ज्यामुळे मताधिकार, खाजगी मालमत्तेचे अधिकार, धार्मिक स्वातंत्र्य, सुरक्षितता, भाषण आणि त्वरित खटल्याचा अधिकार यांसारख्या गोष्टींची जाणीव झाली.

२१ व्या शतकात हे सिद्धांत स्वयंसिद्ध आहेत, परंतु त्यांची उत्पत्ती १८ व्या शतकात झाली.

कारखान्यांनी उत्पादनाला घरामध्ये आणले, वाफेचा आणि विजेचा वापर करून असेंबली लाईन्स आणि लीन उत्पादन तंत्रज्ञान (lean manufacturing techniques) वापरले. यामुळे वस्तू परवडणाऱ्या किमतीत तयार करणे शक्य झाले, ज्यामुळे जीवनमान उंचावले आणि मध्यमवर्गाची वाढ झाली, ज्यामुळे कृषी समाजाच्या क्षमतेपेक्षा अधिक आर्थिक विकास झाला.

कृत्रिम बुद्धिमत्ता क्रांती: डेटा हे नवे क्षेत्र

इंटरनेटच्या आगमनाने व्यक्ती जोडल्या गेल्या आणि एका नवीन संसाधनाची निर्मिती झाली: डेटा, जो माहितीपूर्ण विश्लेषणासाठी परिपक्व होता.

कृत्रिम बुद्धिमत्ता क्रांती मोठ्या प्रमाणात मजकूर, प्रतिमा, व्हिडिओ आणि ऑडिओच्या डिजिटायझेशनवर अवलंबून होती, तसेच या डेटावर प्रक्रिया करण्यासाठी स्वस्त संगणकीय शक्ती आवश्यक होती. मोठ्या डेटाने मोठ्या प्रमाणात समांतर GPUs आणि उच्च मेमरी बँडविड्थ (high memory bandwidth) सोबत, न्यूरल नेटवर्क्स (neural networks) तयार करण्यास सक्षम केले. हे जगाबद्दलची आपली समज एन्कोड (encode) करतात, ज्यामुळे कृत्रिम बुद्धिमत्ता शक्य होते.

थोडक्यात, मोठा डेटा GPU इंजिनवर चालणाऱ्या AI अल्गोरिदमसाठी कच्चा माल पुरवतो, ज्यामुळे कार्यात्मक न्यूरल नेटवर्क्स तयार होतात.

हे घटक एकाच वेळी एकत्र येणे आवश्यक आहे. 1980 च्या दशकात, संशोधकांकडे न्यूरल नेटवर्क अल्गोरिदम होते, परंतु त्यांच्याकडे अंमलबजावणी करण्यासाठी पुरेसे संगणकीय संसाधने आणि डेटा नव्हता. परिणामी, AI मोठ्या प्रमाणात सैद्धांतिक राहिले जोपर्यंत या तीनही अटी पूर्ण झाल्या नाहीत.

AI कारखाने: एक शाब्दिक बदल

‘AI कारखाना’ हा शब्द केवळ एक रूपक नाही, तर व्यावसायिक setting मध्ये काम करणाऱ्या आधुनिक AI सुपरकॉम्प्युटरचे अचूक वर्णन आहे. हे कॉर्पोरेट संगणन आणि डेटा विश्लेषणात मूलभूत बदल घडवते - डेटाचे कृती करण्यायोग्य माहितीमध्ये संश्लेषण करते.

AI कारखाना हा कृषी क्रांतीप्रमाणेच अटळ आहे, जिथे सामूहिक प्रयत्नांमुळे अन्न उत्पादन सुनिश्चित झाले. या क्रांतीमुळे झालेल्या सामाजिक आणि सांस्कृतिक बदलांमुळे मानवतेला चिंतन आणि नवोपक्रमासाठी वेळ मिळाला. आता, मशीन मानवी ज्ञानाच्या संपूर्णतेमध्ये प्रवेश करू शकतात आणि त्यावर प्रक्रिया करू शकतात, संभाषणात्मक शोध सक्षम करू शकतात आणि विविध स्वरूपात नवीन डेटा तयार करण्यासाठी AI अल्गोरिदमचा रिव्हर्स ॲप्लिकेशन (reverse application) करू शकतात.

व्यवसाय आणि व्यक्तींना AI कारखान्यांमध्ये थेट किंवा time-sharing व्यवस्थेद्वारे प्रवेश मिळेल. हे AI कारखाने नवीन कल्पना, दृष्टी निर्माण करतील आणि व्यक्तीच्या सर्जनशील क्षमता वाढवतील.

AI कारखान्यांची परिवर्तनकारी क्षमता सर्वसमावेशक आहे. चॅटबॉट्स, मॉडेल प्रशिक्षण आणि अनुमान (inference) साठी समांतर compute इंजिनचे विकासक आणि OpenAI, Anthropic, Google आणि Mistral सारखे मॉडेल निर्माते सहमत आहेत की AI आपल्या जीवनातील प्रत्येक पैलूला आकार देईल. विविध मुद्द्यांवर जागतिक मतभेद असले तरी, AI चा परिवर्तनकारी प्रभाव जगभरात मान्य आहे.

अंतर्दृष्टी आणि कृतीचे उत्पादन

AI कारखाने दोन प्राथमिक कार्ये करतात. पहिले म्हणजे फाउंडेशन मॉडेल्सना (foundation models) प्रशिक्षण देणे, ज्यामुळे व्यवसाय आणि वैयक्तिक सुधारणांसाठी अंतर्दृष्टी मिळते. दुसरे आणि अधिक महत्त्वाचे कार्य म्हणजे नवीन डेटा आणि प्रश्न या मॉडेल्समध्ये टाकणे, जेणेकरून नवीन उत्तरे मिळवता येतील, नवीन टोकन (token) तयार करता येतील आणि कृती करता येतील.

AI बद्दलच्या बऱ्याच चर्चेत अधिकाधिक विस्तारणाऱ्या फाउंडेशन मॉडेल्सना प्रशिक्षण देण्यावर लक्ष केंद्रित केले आहे, ज्यात शेकडो अब्जांपासून ते ट्रिलियन पॅरामीटर्स आणि प्रचंड डेटासेटचा समावेश आहे. टोकनची संख्या ज्ञानाची व्याप्ती दर्शवते, तर पॅरामीटर्स समजूतदारपणाची खोली दर्शवतात. मोठ्या टोकन सेट्ससह लहान पॅरामीटर संख्या जलद आणि सोपी उत्तरे देतात. याउलट, मोठ्या पॅरामीटर संख्या आणि लहान टोकन सेट्स मर्यादित डोमेनमध्ये अधिक सूक्ष्म अंतर्दृष्टी प्रदान करतात. चेन-ऑफ-थॉट रिझनिंग मॉडेल्स (Chain-of-thought reasoning models), जे multimodial स्वरूपाचे आहेत, ते इतर इनपुट चालवण्यासाठी आऊटपुटचा विचार करण्यासाठी विशेष मॉडेल्स एकत्र करतात आणि सर्वसमावेशक उत्तरे निर्माण करतात.

AI कारखाने मानवतेने तयार केलेली सर्व सामग्री आणि AI मॉडेलद्वारे व्युत्पन्न केलेला सिंथेटिक डेटा (synthetic data) कच्चा माल म्हणून वापरतात. या डेटाद्वारे मिळवलेल्या अंतर्दृष्टीचा उपयोग मानव आणि AI एजंट्सद्वारे कृती करण्यासाठी केला जातो. कारखान्यात काम करण्याऐवजी, व्यक्ती त्यात प्रवेश करतात आणि अधिक, चांगले आणि जलद परिणाम मिळवण्यासाठी AI मॉडेलच्या ज्ञानाने आणि वेगाने त्यांची कौशल्ये वाढवतात.

NVIDIA चे सह-संस्थापक आणि CEO जेनसेन हुआंग (Jensen Huang) यांच्या मते, ‘जग state-of-the-art, मोठ्या प्रमाणावर AI कारखाने तयार करण्यासाठी धावत आहे.’ AI कारखाना स्थापित करणे हे एक असाधारण अभियांत्रिकी कौशल्य आहे, ज्यासाठी प्रचंड संसाधने, मनुष्यबळ आणि सामग्री आवश्यक आहे.

AI कारखाना उभारणीसाठी मोठ्या प्रमाणात भांडवली गुंतवणुकीची आवश्यकता असते. एका सामान्य कॉन्फिगरेशनमध्ये NVIDIA DGX SuperPOD चा समावेश असतो, जो DGX प्रणालीच्या अनेक रॅकवर आधारित असतो. यात GPUs, CPUs, हाय-स्पीड इंटरकनेक्ट्स (high-speed interconnects) आणि स्टोरेज (storage) असते.

अनेक DGX प्रणालींसह, SuperPOD लक्षणीय मेमरी क्षमता आणि बँडविड्थसह उत्कृष्ट कार्यप्रदर्शन प्रदान करते. अधिक प्रणाली जोडून कार्यप्रदर्शन वाढवता येते.

AI कारखान्यासाठी NVIDIA च्या आणखी एका ब्लूप्रिंटमध्ये NVIDIA GB200 NVL72 प्लॅटफॉर्मवर लक्ष केंद्रित केले आहे. हे रॅकस्केल सिस्टम (rackscale system) GPUs, CPUs, DPUs, SuperNICs, NVLink आणि NVSwitch आणि हाय-स्पीड नेटवर्किंग एकत्रित करते. हे प्लॅटफॉर्म AI मॉडेलसाठी मोठे सामायिक GPU मेमरी डोमेन (memory domain) आणि उच्च compute घनता (compute density) प्रदान करते, ज्यामुळे लिक्विड कूलिंगची (liquid cooling) आवश्यकता असते.

GB200 NVL72, पूर्ण क्षमतेने shipping साठी तयार आहे. हे एक स्वयंपूर्ण सिस्टम आहे जे मॉडेल तयार करण्यास आणि विविध स्वरूपात डेटा निर्माण करण्यास सक्षम आहे.

GB200 NVL72 मध्ये NVIDIA Grace CPU सह Blackwell GPUs असलेले MGX सर्व्हर नोड (server node) आहे. यातील दोन सर्व्हर नोड NVL72 रॅकमधील compute ट्रे (compute tray) तयार करतात. अठरा compute ट्रेमध्ये अनेक GPUs आणि CPUs असतात.

GB200 NVL72 रॅकस्केल सिस्टम Grace CPUs ला Blackwell GPUs सोबत जोडते, जे हाय-स्पीड NVLink कनेक्शनद्वारे इंटरकनेक्ट केलेले असतात. NVLink पोर्ट आणि NVSwitch चिप्स सर्व GPUs ला सामायिक मेमरी कॉन्फिगरेशनमध्ये (shared memory configuration) लिंक करतात, जे फाउंडेशन मॉडेल प्रशिक्षण आणि चेन-ऑफ-थॉट इन्फरन्ससाठी (chain-of-thought inference) आदर्श आहे.

NVLink फॅब्रिक (fabric), नऊ NVLink स्विच ट्रेद्वारे सुलभ होते. हे AI ऍप्लिकेशन्ससाठी एकीकृत GPU म्हणून सर्व GPU dies मध्ये प्रवेश सक्षम करते.

GB200 NVL72 सिस्टममध्ये होस्ट प्रोसेसिंगसाठी अनेक Arm cores आणि महत्त्वपूर्ण फ्लोटिंग-पॉइंट प्रोसेसिंग पॉवर (floating-point processing power) आहे. GB200 NVL72 सिस्टममध्ये GPUs सोबत जोडलेली लक्षणीय HBM3e मेमरी आहे, ज्यात उच्च एकत्रित बँडविड्थ (aggregate bandwidth) आहे. Grace CPUs मध्ये LPDDR5X मेमरी आहे, जी NVLink द्वारे ऍक्सेस करता येते.

NVIDIA GB200 NVL72 ऑनलाइन व्यवहार प्रक्रियेवर (online transaction processing) System/360 च्या परिवर्तनकारी प्रभावाचे प्रतिबिंब आहे. NVL72 ची InfiniBand इंटरकनेक्ट्सद्वारे स्केलेबिलिटी (scalability) हा महत्त्वाचा फरक आहे.

NVL72 रॅकस्केल सिस्टमवर आधारित DGX SuperPOD कॉन्फिगरेशनसाठी मोठ्या प्रमाणात पॉवरची आवश्यकता असते, परंतु ते अनेक compute रॅकमध्ये प्रचंड संगणकीय शक्ती आणि मेमरी क्षमता प्रदान करते. अधिक रॅक जोडून कार्यप्रदर्शन वाढवता येते.

NVL72 रॅकची compute घनता (compute density) विशेष liquid cooling आणि डेटासेंटर इन्फ्रास्ट्रक्चरची (datacenter infrastructure) मागणी करते. हे भूतकाळातील त्या पद्धतीकडे परतणे आहे, जिथे water-cooled मशीनने कार्यक्षमता वाढवली होती.

AI कारखान्यांना लक्षणीय प्रमाणात अधिक संगणकीय शक्तीची आवश्यकता असेल कारण अनुमान (inference) विविध ऍप्लिकेशन्सचा अविभाज्य भाग बनतो, विशेषत: चेन-ऑफ-थॉट रिझनिंग मॉडेलकडे (chain-of-thought reasoning model) होणाऱ्या बदलामुळे.

AI कारखान्यांमध्ये केवळ हार्डवेअरच नाही, तर सिस्टम आणि डेव्हलपमेंट सॉफ्टवेअरचाही समावेश असतो.

DGX GB200 सिस्टम आणि DGX SuperPOD AI सुपरकॉम्प्युटरला व्यवस्थापन आणि मॉडेलिंगची आवश्यकता असते, जे NVIDIA Mission Control सारख्या साधनांद्वारे सुलभ केले जाते. हे AI वर्कलोड्सचे (workloads) व्यवस्थापन करते आणि आपोआप जॉब्स रिकव्हर (recover) करते. Mission Control सिस्टमचे आरोग्य (system health) तपासते आणि वीज वापर ऑप्टिमाइझ (optimize) करते.

NVIDIA AI Enterprise, सिस्टम सॉफ्टवेअर सूटमध्ये NVIDIA GPUs आणि नेटवर्क्ससाठी ऑप्टिमाइझ (optimize) केलेल्या लायब्ररी, मॉडेल आणि फ्रेमवर्कचा समावेश आहे. AI factory स्टॅकमध्ये NVIDIA Dynamo देखील आहे, जे NVLink आणि DGX SuperPOD इन्फ्रास्ट्रक्चरवर अनुमान चालवण्यासाठी एक ओपन-सोर्स फ्रेमवर्क आहे. DGX Expert Service आणि Support ग्राहकांना ही तंत्रज्ञान अंमलात आणण्यास मदत करते, ज्यामुळे first token चा वेळ कमी होतो. NVIDIA डेटासेंटर डिझाइनचे अनुकरण (simulate) आणि ऑप्टिमाइझ (optimize) करण्यासाठी त्याच्या Omniverse ‘डिजिटल ट्विन’ वातावरणासाठी AI फॅक्टरी ब्लूप्रिंट्स (factory blueprints) ऑफर करते.

AI कारखान्यांचा एक महत्त्वाचा पैलू म्हणजे ते विचारसरणीत बदल घडवतात, NVIDIA सिस्टमच्या वाढीसाठी headroom ला प्राधान्य देते.

NVIDIA मधील नेटवर्किंगचे वरिष्ठ उपाध्यक्ष गिलाड शाईनर (Gilad Shainer) यांच्या मते, ‘आता टोकन तयार करणे म्हणजे अनेक कंपन्यांसाठी महसूल (revenue) निर्माण करणे.’ डेटासेंटर (datacenter) हे खर्चिक केंद्र न राहता उत्पादक मालमत्ता बनत आहेत.

आणि हेच, AI कारखाना उभारणीचे सार आहे.