AMD चे प्रोजेक्ट GAIA: डिव्हाइसवरील AI साठी नवी दिशा

कृत्रिम बुद्धिमत्तेचे (Artificial Intelligence - AI) जग महत्त्वपूर्ण बदलातून जात आहे. अनेक वर्षांपासून, अत्याधुनिक AI मॉडेल्स, विशेषतः मोठे भाषा मॉडेल्स (Large Language Models - LLMs), यांच्या प्रचंड संगणकीय गरजांमुळे त्यांचे कार्य प्रामुख्याने मोठ्या डेटा सेंटर्समध्ये ठेवलेल्या शक्तिशाली, ऊर्जा-केंद्रित सर्व्हर्सपुरते मर्यादित होते. सामान्यतः इंटरनेटवर क्वेरी पाठवून आणि दूरस्थपणे प्रक्रिया केलेल्या प्रतिसादांची प्रतीक्षा करूनच याचा वापर करता येत होता. तथापि, प्रोसेसर तंत्रज्ञानातील प्रगती आणि डेटा गोपनीयता व लेटन्सी (latency) बद्दल वाढत्या चिंतांमुळे स्थानिक संगणनाकडे (localized computation) एक आकर्षक बदल जोर पकडत आहे. सेमीकंडक्टर क्षेत्रातील एक बलाढ्य खेळाडू, Advanced Micro Devices (AMD), या ट्रेंडला सक्रियपणे स्वीकारत आहे, वापरकर्त्यांना त्यांच्या वैयक्तिक संगणकांवर थेट जनरेटिव्ह AI (Generative AI) क्षमतांचा वापर करण्यास सक्षम करण्याचा प्रयत्न करत आहे. या क्षेत्रातील कंपनीचा नवीनतम उपक्रम म्हणजे GAIA नावाचा एक ओपन-सोर्स प्रकल्प आहे, ज्याचे पूर्ण रूप ‘Generative AI Is Awesome’ असे आहे.

स्थानिकीकृत AI प्रक्रियेच्या युगाची सुरुवात

जनरेटिव्ह AI मॉडेल्स स्थानिक पातळीवर चालवण्याचे आकर्षण अनेक पटींनी आहे. प्रथम, ते वाढत्या गोपनीयतेच्या चिंतांचे निराकरण करते. जेव्हा वापरकर्त्याच्या स्वतःच्या डिव्हाइसवर डेटा प्रक्रिया केली जाते, तेव्हा संभाव्य संवेदनशील माहिती तृतीय-पक्ष सर्व्हरवर पाठवण्याची गरज नाहीशी होते, ज्यामुळे एक स्वाभाविकपणे अधिक सुरक्षित ऑपरेशनल पॅराडाइम (operational paradigm) मिळते. दुसरे म्हणजे, स्थानिक अंमलबजावणीमुळे लेटन्सी लक्षणीयरीत्या कमी होऊ शकते; जेव्हा संगणकीय प्रक्रिया वापरकर्ता इंटरफेसपासून काही मिलिमीटर अंतरावर होते, तेव्हा इनपुट आणि आउटपुटमधील विलंब कमी होतो, जो संभाव्यतः खंड ओलांडून प्रवास करण्याऐवजी होतो. तिसरे म्हणजे, ते प्रवेशाचे लोकशाहीकरण करते. क्लाउड-आधारित AI मध्ये अनेकदा सबस्क्रिप्शन शुल्क किंवा वापराच्या मर्यादांचा समावेश असतो, तर डिव्हाइसवरील प्रक्रिया वापरकर्त्याच्या मालकीचे हार्डवेअर वापरते, ज्यामुळे AI साधनांसह प्रयोग करण्यासाठी आणि वापरण्यासाठी प्रवेशाचा अडथळा संभाव्यतः कमी होतो.

ही क्षमता ओळखून, AMD ने आपल्या प्रोसेसर आर्किटेक्चरमध्ये AI वर्कलोडसाठी विशेषतः डिझाइन केलेले विशेष प्रोसेसिंग कोर (specialized processing cores) धोरणात्मकरीत्या समाकलित केले आहेत. या प्रयत्नांचा कळस त्यांच्या नवीनतम Ryzen AI 300 सिरीज प्रोसेसर्समध्ये दिसून येतो, ज्यात वर्धित न्यूरल प्रोसेसिंग युनिट्स (Neural Processing Units - NPUs) आहेत. हे NPUs मशीन लर्निंग कार्यांमध्ये प्रचलित असलेल्या विशिष्ट प्रकारच्या गणितीय क्रिया हाताळण्यासाठी तयार केले गेले आहेत, आणि ते पारंपरिक CPU कोरच्या तुलनेत वेग आणि वीज वापर या दोन्ही बाबतीत लक्षणीयरीत्या अधिक कार्यक्षमतेने करतात. AMD चा उद्देश नेमका हाच समर्पित हार्डवेअर मुख्य प्रवाहातील वापरकर्त्यांसाठी त्याच्या GAIA प्रकल्पाद्वारे अनलॉक करणे आहे. AMD च्या AI डेव्हलपर एनेबलमेंट मॅनेजर, Victoria Godsoe यांनी या ध्येयावर जोर दिला, असे सांगून की GAIA ‘खाजगी आणि स्थानिक मोठे भाषा मॉडेल्स (LLMs) चालवण्यासाठी Ryzen AI न्यूरल प्रोसेसिंग युनिट (NPU) च्या सामर्थ्याचा फायदा घेते.’ त्यांनी पुढे फायद्यांवर प्रकाश टाकला: ‘हे एकत्रीकरण जलद, अधिक कार्यक्षम प्रक्रियेस - म्हणजे कमी वीज वापरात - अनुमती देते, तसेच तुमचा डेटा स्थानिक आणि सुरक्षित ठेवते.’

GAIA ची ओळख: डिव्हाइसवरील LLM उपयोजन सुलभ करणे

GAIA हे AMD चे त्या प्रश्नाचे उत्तर म्हणून उदयास आले आहे: वापरकर्ते अत्याधुनिक AI मॉडेल्स चालवण्यासाठी त्यांच्या नवीन Ryzen AI-सक्षम मशीनच्या NPU क्षमतांचा सहजपणे कसा वापर करू शकतात? एक ओपन-सोर्स ॲप्लिकेशन म्हणून सादर केलेले, GAIA विशेषतः Windows PCs वर नवीनतम AMD हार्डवेअरसह सुसज्ज असलेल्या लहान-प्रमाणातील LLMs तैनात करण्यासाठी आणि त्यांच्याशी संवाद साधण्यासाठी एक सुव्यवस्थित इंटरफेस प्रदान करते. हा प्रकल्प जाणीवपूर्वक विद्यमान ओपन-सोर्स फ्रेमवर्कवर आधारित आहे, विशेषतः Lemonade चा पाया म्हणून उल्लेख करत, व्यापक विकास समुदायामध्ये सहकार्याची भावना दर्शवितो.

GAIA चे मुख्य कार्य LLMs सेट अप आणि चालवण्याशी संबंधित बहुतेक गुंतागुंत दूर करणे आहे. वापरकर्त्यांना अधिक सुलभ वातावरण सादर केले जाते, जे AMD च्या Ryzen AI आर्किटेक्चरसाठी सुरुवातीपासून ऑप्टिमाइझ केलेले आहे. हे ऑप्टिमायझेशन महत्त्वपूर्ण आहे; ते सुनिश्चित करते की सॉफ्टवेअर प्रभावीपणे NPU चा वापर करते, कार्यप्रदर्शन वाढवते आणि ऊर्जेचा वापर कमी करते. जरी प्राथमिक लक्ष्य Ryzen AI 300 सिरीज आणि त्याचे शक्तिशाली NPU असले तरी, AMD ने जुन्या किंवा भिन्न हार्डवेअर कॉन्फिगरेशनच्या वापरकर्त्यांना पूर्णपणे वगळलेले नाही.

हा प्रकल्प लोकप्रिय आणि तुलनेने संक्षिप्त LLM कुटुंबांना समर्थन देतो, ज्यात व्यापकपणे उपलब्ध असलेल्या Llama आणि Phi आर्किटेक्चरवर आधारित मॉडेल्सचा समावेश आहे. हे मॉडेल्स, जरी GPT-4 सारख्या दिग्गजांच्या प्रचंड प्रमाणाचे नसले तरी, विविध ऑन-डिव्हाइस कार्यांसाठी उल्लेखनीयपणे सक्षम आहेत. AMD नैसर्गिक संभाषणास सक्षम असलेल्या इंटरॅक्टिव्ह चॅटबॉट्सपासून ते अधिक जटिल तार्किक कार्यांपर्यंत संभाव्य वापराची प्रकरणे सुचवते, जे GAIA-सक्षम स्थानिक AI साठी परिकल्पित अष्टपैलुत्व दर्शवते.

GAIA च्या क्षमतांचा शोध: एजंट्स आणि हायब्रिड पॉवर

व्यावहारिक अनुप्रयोग दर्शविण्यासाठी आणि तंत्रज्ञान त्वरित उपयुक्त बनविण्यासाठी, GAIA काही पूर्वनिर्धारित ‘एजंट्स’ (agents) च्या निवडीसह येते, प्रत्येक एका विशिष्ट कार्यासाठी तयार केलेला आहे:

  • Chaty: नावाप्रमाणेच, हा एजंट संभाषणात्मक AI अनुभव प्रदान करतो, सामान्य संवाद आणि संवादासाठी चॅटबॉट म्हणून काम करतो. हे मानवासारखे मजकूर प्रतिसाद तयार करण्याच्या मूळ LLM च्या क्षमतेचा फायदा घेते.
  • Clip: हा एजंट प्रश्न-उत्तरांच्या कार्यांवर लक्ष केंद्रित करतो. विशेष म्हणजे, यात रिट्रीव्हल-ऑगमेंटेड जनरेशन (Retrieval-Augmented Generation - RAG) क्षमता समाविष्ट आहेत, ज्यामुळे ते अधिक माहितीपूर्ण किंवा संदर्भितपणे संबंधित उत्तरे देण्यासाठी YouTube ट्रान्स्क्रिप्ट्स सारख्या बाह्य स्त्रोतांकडून माहिती मिळवू शकते. ही RAG कार्यक्षमता एजंटच्या ज्ञान बेसला LLM च्या सुरुवातीच्या प्रशिक्षण डेटाच्या पलीकडे लक्षणीयरीत्या वाढवते.
  • Joker: आणखी एक RAG-आधारित एजंट, Joker विशेषतः विनोदासाठी डिझाइन केलेला आहे, ज्याचे कार्य विनोद तयार करणे आहे. हे स्थानिक LLMs च्या विशेष, सर्जनशील अनुप्रयोगांची क्षमता दर्शवते.
  • Simple Prompt Completion: हे बेस LLM ला अधिक थेट मार्ग प्रदान करते, वापरकर्त्यांना प्रॉम्प्ट्स इनपुट करण्याची आणि इतर एजंट्सच्या संभाषणात्मक किंवा कार्य-विशिष्ट स्तरांशिवाय सरळ पूर्णता (completions) प्राप्त करण्याची परवानगी देते. हे थेट मॉडेल परस्परसंवादासाठी मूलभूत इंटरफेस म्हणून काम करते.

या एजंट्सची अंमलबजावणी, विशेषतः अनुमान प्रक्रिया (inference process) जिथे मॉडेल प्रतिसाद तयार करते, प्रामुख्याने सुसंगत Ryzen AI 300 सिरीज चिप्सवरील NPU द्वारे हाताळली जाते. हे कार्यक्षम, कमी-वीज ऑपरेशन सुनिश्चित करते. तथापि, AMD ने काही समर्थित मॉडेल्ससाठी अधिक प्रगत ‘हायब्रिड’ (hybrid) मोड देखील समाविष्ट केला आहे. हा नाविन्यपूर्ण दृष्टिकोन प्रोसेसरच्या एकात्मिक ग्राफिक्स प्रोसेसिंग युनिट (integrated graphics processing unit - iGPU) ला NPU सोबत गतिशीलपणे गुंतवतो. iGPU च्या समांतर प्रक्रिया शक्तीचा (parallel processing power) फायदा घेऊन, हा हायब्रिड मोड मागणी असलेल्या AI कार्यांसाठी महत्त्वपूर्ण कार्यप्रदर्शन वाढवू शकतो, वापरकर्त्यांना केवळ NPU द्वारे प्राप्त करण्यापलीकडे अनुमान प्रक्रियेला गती देण्याचा मार्ग प्रदान करतो.

विविध हार्डवेअर परिस्थिती ओळखून, AMD एक फॉलबॅक पर्याय (fallback option) देखील प्रदान करते. GAIA चा एक प्रकार अस्तित्वात आहे जो केवळ गणनेसाठी CPU कोरवर अवलंबून असतो. NPU किंवा हायब्रिड मोडपेक्षा लक्षणीयरीत्या हळू आणि कमी वीज-कार्यक्षम असले तरी, ही CPU-ओन्ली आवृत्ती व्यापक उपलब्धता सुनिश्चित करते, ज्यामुळे नवीनतम Ryzen AI हार्डवेअर नसलेल्या वापरकर्त्यांना GAIA सह प्रयोग करण्याची परवानगी मिळते, जरी कार्यक्षमतेत घट होते.

धोरणात्मक स्थान आणि ओपन-सोर्स फायदा

GAIA चे लाँचिंग व्यापक स्पर्धात्मक सेमीकंडक्टर बाजाराच्या संदर्भात पाहिले जाऊ शकते, विशेषतः AI प्रवेग (AI acceleration) संबंधित. बऱ्याच काळापासून, NVIDIA ने AI क्षेत्रात वर्चस्व गाजवले आहे, मुख्यत्वे त्याच्या शक्तिशाली GPUs आणि परिपक्व CUDA (Compute Unified Device Architecture) सॉफ्टवेअर इकोसिस्टममुळे, जे उच्च-कार्यक्षमतेच्या मशीन लर्निंगसाठी एक वास्तविक मानक बनले आहे. ग्राहक हार्डवेअरवर मोठे मॉडेल्स कार्यक्षमतेने चालवण्यासाठी विकासक आणि उत्साही अनेकदा NVIDIA च्या ऑफरकडे वळले.

AMD चा GAIA उपक्रम, Ryzen AI चिप्समधील समर्पित NPU हार्डवेअरसह, या वर्चस्वाला आव्हान देण्यासाठी एक धोरणात्मक पाऊल दर्शवते, विशेषतः लॅपटॉप आणि डेस्कटॉपवरील ऑन-डिव्हाइस AI च्या वाढत्या बाजारपेठेत. वापरण्यास-सुलभ, ऑप्टिमाइझ केलेले आणि ओपन-सोर्स साधन प्रदान करून, AMD स्वतःच्या AI हार्डवेअर क्षमतांभोवती एक इकोसिस्टम तयार करण्याचे उद्दिष्ट ठेवते, ज्यामुळे Ryzen AI प्लॅटफॉर्म स्थानिक AI अंमलबजावणीमध्ये स्वारस्य असलेल्या विकासकांसाठी आणि अंतिम वापरकर्त्यांसाठी अधिक आकर्षक बनतात. NPU ऑप्टिमायझेशनवर स्पष्ट लक्ष केंद्रित करणे हे GPU-केंद्रित दृष्टिकोनांपेक्षा वेगळे करते आणि विशिष्ट AI कार्यांसाठी समर्पित न्यूरल प्रोसेसरमध्ये अंतर्भूत असलेल्या वीज कार्यक्षमतेच्या फायद्यांवर प्रकाश टाकते.

GAIA ला परवानगी देणाऱ्या MIT ओपन-सोर्स लायसन्स अंतर्गत प्रसिद्ध करण्याचा निर्णय देखील धोरणात्मकदृष्ट्या महत्त्वपूर्ण आहे. हे जागतिक विकासक समुदायाकडून सहकार्य आणि योगदानास आमंत्रित करते. हा दृष्टिकोन प्रकल्पाच्या विकासाला गती देऊ शकतो, नवीन वैशिष्ट्ये आणि मॉडेल्सच्या एकत्रीकरणाकडे नेऊ शकतो आणि AMD च्या AI प्लॅटफॉर्ममध्ये गुंतवणूक केलेल्या समुदायाला प्रोत्साहन देऊ शकतो. AMD बग निराकरणे आणि वैशिष्ट्य सुधारणांसाठी पुल रिक्वेस्ट्सचे (pull requests) स्पष्टपणे स्वागत करते, जे सामूहिक प्रयत्नांद्वारे GAIA विकसित करण्याच्या वचनबद्धतेचे संकेत देते. ओपन-सोर्सिंगमुळे विकासकांना प्रयोग करणे, समाकलित करणे आणि संभाव्यतः GAIA फ्रेमवर्कवर व्यावसायिक अनुप्रयोग तयार करणे सोपे होते, ज्यामुळे Ryzen AI भोवतीची इकोसिस्टम आणखी उत्तेजित होते.

सध्याची आवृत्ती ऑन-डिव्हाइस अंमलबजावणीसाठी योग्य असलेल्या लहान LLMs वर लक्ष केंद्रित करत असली तरी, GAIA ने घातलेला पाया NPU तंत्रज्ञान जसजसे प्रगत होत जाईल तसतसे अधिक जटिल मॉडेल्स आणि अनुप्रयोगांना समर्थन देण्याचा मार्ग मोकळा करू शकतो. हे AMD कडून एक स्पष्ट हेतू विधान दर्शवते: वैयक्तिक, स्थानिकीकृत कृत्रिम बुद्धिमत्तेच्या युगात एक प्रमुख शक्ती बनणे, वापरकर्त्यांच्या हातात थेट, सुरक्षितपणे आणि कार्यक्षमतेने AI क्षमता आणण्यासाठी आवश्यक हार्डवेअर आणि सुलभ सॉफ्टवेअर साधने प्रदान करणे. ‘Generative AI Is Awesome’ हे नाव, जरी कदाचित अनौपचारिक असले तरी, या वेगाने विकसित होत असलेल्या तांत्रिक क्षेत्रात कंपनीचा उत्साह आणि महत्त्वाकांक्षा अधोरेखित करते.