एआई अलायंस: विकास का पहला साल

ओपन सोर्स AI में परिवर्तनकारी बदलाव

ऐतिहासिक रूप से, ओपन-सोर्स AI विकास एक खंडित प्रयास था, जिसके परिणामस्वरूप अक्सर मॉडल उम्मीद के मुताबिक प्रदर्शन नहीं कर पाते थे। 2023 से पहले, कुछ गैर-लाभकारी संस्थाओं के पास GPT-2 के बराबर क्षमताओं वाले AI मॉडल को प्रशिक्षित करने के लिए संसाधन थे। बड़ी प्रौद्योगिकी कंपनियों का मालिकाना AI परिदृश्य पर प्रभुत्व था, जबकि ओपन-सोर्स AI काफी हद तक विशिष्ट अनुप्रयोगों तक ही सीमित था।

वर्ष 2023 एक महत्वपूर्ण मोड़ था। अनुमेय लाइसेंस के साथ कई नए बेस मॉडल जारी किए गए, जिसके बाद Microsoft के साथ साझेदारी में Meta ने अपने ओपन-सोर्स Llama 2 मॉडल को जारी किया। इस घटना ने गतिविधि की झड़ी लगा दी, छह महीनों के भीतर 10,000 से अधिक व्युत्पन्न मॉडल बनाए गए। ओपन-सोर्स AI विकास का एक नया युग शुरू हो गया था।

महत्वाकांक्षी लक्ष्य और एक प्रतिष्ठित संचालन समिति

इस पृष्ठभूमि के खिलाफ, AI एलायंस ने अपनी स्थापना से ही लक्ष्यों की एक प्रभावशाली श्रृंखला निर्धारित की। इन लक्ष्यों में शामिल हैं:

  • खुले सहयोग को बढ़ावा देना
  • AI के लिए शासन और सुरक्षा उपाय स्थापित करना
  • बेंचमार्किंग टूल और स्पष्ट नीतिगत स्थिति विकसित करना
  • व्यापक शैक्षिक पहलों को प्राथमिकता देना
  • मजबूत हार्डवेयर इकोसिस्टम का पोषण करना

एलायंस की ताकत इसकी संचालन समिति के कैलिबर से और अधिक रेखांकित होती है, जिसमें प्रसिद्ध वाणिज्यिक संगठनों और विश्वविद्यालयों की एक सूची है।

सदस्यता मानदंड: खुलेपन और सहयोग के प्रति प्रतिबद्धता

AI एलायंस का सदस्य बनने के लिए, एक संगठन को चार प्रमुख मानदंडों को पूरा करना होगा:

  1. मिशन के साथ संरेखण: संभावित सदस्य को सुरक्षा, ओपन साइंस और नवाचार को बढ़ावा देने के मिशन के साथ संरेखित होना चाहिए।
  2. परियोजनाओं के प्रति प्रतिबद्धता: सदस्यों को एलायंस के मिशन के साथ संरेखित महत्वपूर्ण परियोजनाओं पर काम करने के लिए समर्पित होना चाहिए।
  3. दृष्टिकोणों की विविधता: संभावित सदस्यों को वैश्विक सदस्यता के भीतर दृष्टिकोण और संस्कृतियों की विविधता में योगदान करने के लिए तैयार रहना चाहिए, जो वर्तमान में 140 से अधिक संगठनों से अधिक है और इसके और बढ़ने की उम्मीद है।
  4. प्रतिष्ठा: AI एलायंस AI ओपन-सोर्स समुदाय के भीतर शिक्षकों, निर्माताओं या अधिवक्ताओं के रूप में मान्यता प्राप्त प्रतिष्ठा वाले सदस्यों की तलाश करता है।

सदस्यों का वर्गीकरण: निर्माता, समर्थक और अधिवक्ता

एलायंस के सदस्य आमतौर पर तीन श्रेणियों में से एक में आते हैं:

  • निर्माता (Builders): ये सदस्य मॉडल, डेटासेट, उपकरण और एप्लिकेशन बनाने के लिए जिम्मेदार हैं जो AI का उपयोग करते हैं।
  • समर्थक (Enablers): ये सदस्य ट्यूटोरियल, उपयोग के मामलों और सामान्य सामुदायिक समर्थन के माध्यम से ओपन AI प्रौद्योगिकियों को अपनाने को बढ़ावा देते हैं।
  • अधिवक्ता (Advocates): ये सदस्य AI एलायंस इकोसिस्टम के लाभों पर जोर देते हैं और संगठनात्मक नेताओं, सामाजिक हितधारकों और नियामक निकायों के बीच सार्वजनिक विश्वास और सुरक्षा को बढ़ावा देते हैं।

छह प्रमुख फोकस क्षेत्र: AI इकोसिस्टम के लिए एक समग्र दृष्टिकोण

AI एलायंस छह प्रमुख फोकस क्षेत्रों में अपनी दीर्घकालिक प्राथमिकताओं को परिभाषित करता है। हालांकि, यह ध्यान रखना महत्वपूर्ण है कि एलायंस पूरे AI इकोसिस्टम के लिए एक समग्र दृष्टिकोण अपनाता है, समुदाय के सदस्यों और डेवलपर्स को एक या अधिक क्षेत्रों में भाग लेने और रुचियों या प्राथमिकताओं के विकसित होने पर अनुकूलन करने के लिए प्रोत्साहित करता है।

यहां छह प्रमुख फोकस क्षेत्रों पर करीब से नज़र डाली गई है:

कौशल और शिक्षा (Skills and Education)

यह क्षेत्र AI के जोखिमों का मूल्यांकन करने वाले उपभोक्ताओं और व्यावसायिक नेताओं के साथ-साथ AI एप्लिकेशन बनाने वाले छात्रों और डेवलपर्स सहित व्यापक दर्शकों को AI ज्ञान प्रदान करने के लिए समर्पित है। इसका उद्देश्य विशिष्ट क्षेत्रों में विशेषज्ञ मार्गदर्शन खोजने की प्रक्रिया को सरल बनाना है और इसमें एक मॉडल मूल्यांकन पहल शामिल है।

2024 में, एलायंस ने Guide to Essential Competencies for AI प्रकाशित किया, जो AI में प्रमुख भूमिकाओं और उन भूमिकाओं के लिए आवश्यक कौशल की पहचान करने के लिए एक व्यापक सर्वेक्षण का परिणाम है। हाल ही में प्रकाशित होने के बावजूद, गाइड में पहले ही नौ संशोधन हो चुके हैं, और प्रारंभिक सर्वेक्षण में पहचानी गई समस्याओं को दूर करने के लिए एक अनुवर्ती सर्वेक्षण की योजना बनाई गई है।

विश्वास और सुरक्षा (Trust and Safety)

यह महत्वपूर्ण क्षेत्र सभी AI अनुप्रयोगों की सफलता के लिए आवश्यक विश्वास और सुरक्षा के आवश्यक तत्वों की पड़ताल करता है। यह सुनिश्चित करने के लिए कि मॉडल और एप्लिकेशन उच्च-गुणवत्ता वाले, सुरक्षित और भरोसेमंद हैं, बेंचमार्क, उपकरण और कार्यप्रणाली का उपयोग किया जाता है। इसमें आचरण के विकसित मानकों और जोखिमों के प्रभावी प्रतिक्रियाओं का समर्थन करना शामिल है।

इस क्षेत्र में कार्य समूह विश्वास और सुरक्षा से संबंधित सर्वोत्तम-नस्ल अवधारणाओं को इकट्ठा करता है और उपयोगकर्ताओं को उनकी ज़रूरत के विशेषज्ञता से जोड़ता है। State of Open Source AI Trust and Safety — End of 2024 Edition सर्वेक्षण, AI एलायंस वेबसाइट पर प्रकाशित, इस डोमेन में जरूरतों और सफलताओं दोनों पर प्रकाश डाला गया। कई AI एलायंस सदस्यों द्वारा अनुसंधान और विकास प्रयासों के माध्यम से अनुसंधान और पर्यावरणीय अंतरालों को संबोधित किया जा रहा है।

एप्लिकेशन और उपकरण (Applications and Tools)

यह समूह कुशल और मजबूत AI-सक्षम एप्लिकेशन बनाने के लिए उपकरणों और तकनीकों की खोज पर केंद्रित है। यह नवाचार में तेजी लाने, AI अनुप्रयोगों के प्रयोग और परीक्षण की सुविधा के लिए एक AI लैब भी विकसित कर रहा है।

हार्डवेयर सक्षमता (Hardware Enablement)

यह क्षेत्र यह सुनिश्चित करके एक मजबूत AI हार्डवेयर त्वरक इकोसिस्टम को बढ़ावा देने के लिए समर्पित है कि AI सॉफ्टवेयर स्टैक हार्डवेयर-अज्ञेयवादी है। MLIR और Triton जैसी प्रौद्योगिकियां उच्च-प्रदर्शन हार्डवेयर पोर्टेबिलिटी प्राप्त करने के लिए महत्वपूर्ण सॉफ्टवेयर उपकरण हैं। ये उपकरण संगठनों को अपने पसंदीदा हार्डवेयर का लाभ उठाने, लचीलापन और प्रदर्शन बढ़ाने और मालिकाना प्रणालियों पर निर्भरता कम करने का अधिकार देते हैं।

फाउंडेशन मॉडल और डेटासेट (Foundation Models and Datasets)

यह क्षेत्र कम सेवा वाले क्षेत्रों के लिए मॉडल पर ध्यान केंद्रित करता है, जिसमें बहुभाषी, मल्टीमॉडल, टाइम सीरीज़, विज्ञान और अन्य डोमेन शामिल हैं। उदाहरण के लिए, विज्ञान और डोमेन-विशिष्ट मॉडल जलवायु परिवर्तन, आणविक खोज और अर्धचालक उद्योग को लक्षित करते हैं।

प्रभावी मॉडल और AI एप्लिकेशन आर्किटेक्चर को स्पष्ट शासन और उपयोग अधिकारों के साथ उपयोगी डेटासेट की आवश्यकता होती है। Open Trusted Data Initiative ऐसे डेटासेट के लिए आवश्यकताओं को स्पष्ट कर रहा है और अनुपालन डेटासेट की सूची बना रहा है। यह प्रयास कानूनी, कॉपीराइट और गोपनीयता मुद्दों के बारे में चिंताओं को काफी हद तक समाप्त करने का लक्ष्य रखता है।

वकालत (Advocacy)

एक स्वस्थ और खुले AI इकोसिस्टम बनाने के लिए नियामक नीतियों की वकालत आवश्यक है। सभी AI नीतियों और विनियमों को संतुलित, पक्षपाती नहीं, दृष्टिकोण का प्रतिनिधित्व करना चाहिए।

विश्वास और सुरक्षा में एक गहरी डुबकी: 2025 पहल

ट्रस्ट एंड सेफ्टी AI एलायंस के भीतर एक महत्वपूर्ण और विस्तृत क्षेत्र है, जिसमें कई विशेषज्ञ अभद्र भाषा, पूर्वाग्रह और अन्य हानिकारक सामग्री का पता लगाने और उसे कम करने के लिए उपकरणों पर काम कर रहे हैं। Trust and Safety Evaluation Initiative 2025 के लिए एक प्रमुख उपक्रम है, जो मूल्यांकन के पूरे स्पेक्ट्रम का एक एकीकृत दृश्य प्रदान करता है - न केवल सुरक्षा के लिए, बल्कि प्रदर्शन और अन्य क्षेत्रों के लिए भी जहां AI मॉडल और अनुप्रयोगों की प्रभावशीलता का आकलन करना महत्वपूर्ण है। एक उप-परियोजना विशिष्ट सुरक्षा प्राथमिकताओं की खोज कर रही है, जैसे स्वास्थ्य, कानून और वित्त।

2025 के मध्य में, AI एलायंस एक Hugging Face लीडरबोर्ड जारी करने की योजना बना रहा है जो डेवलपर्स को सक्षम करेगा:

  • उन मूल्यांकनों की खोज करें जो उनकी आवश्यकताओं के लिए सबसे उपयुक्त हों
  • तुलना करें कि ओपन मॉडल उन मूल्यांकनों के विरुद्ध कैसा प्रदर्शन करते हैं
  • उन मूल्यांकनों को डाउनलोड करें और तैनात करें ताकि वे अपने स्वयं के निजी मॉडल और AI अनुप्रयोगों की जांच कर सकें

यह पहल विभिन्न उपयोग के मामलों के महत्वपूर्ण सुरक्षा और अनुपालन पहलुओं पर मार्गदर्शन भी प्रदान करेगी।

ऑन-प्रिमाइसेस AI का समर्थन: हार्डवेयर-अज्ञेयवादी सॉफ्टवेयर स्टैक

सभी AI मॉडल इनवोकेशन होस्टेड वाणिज्यिक सेवाओं पर निर्भर नहीं होंगे। कुछ स्थितियों में एयर-गैप्ड समाधानों की आवश्यकता होती है। AI-सक्षम स्मार्ट एज डिवाइस ऑन-प्रिमाइसेस पर नए, छोटे और शक्तिशाली मॉडल की तैनाती को चला रहे हैं, अक्सर इंटरनेट कनेक्शन के बिना। इन उपयोग के मामलों का समर्थन करने और लचीले हार्डवेयर कॉन्फ़िगरेशन के साथ बड़े पैमाने पर मॉडल सेवा की सुविधा के लिए, AI एलायंस हार्डवेयर-अज्ञेयवादी सॉफ्टवेयर स्टैक विकसित कर रहा है।

सहयोग के वास्तविक दुनिया के उदाहरण: सेमीकॉन्ग और DANA

दो उदाहरण इस बात पर प्रकाश डालते हैं कि कैसे एलायंस के सदस्यों के बीच खुला सहयोग सभी के लिए महत्वपूर्ण लाभ दे रहा है:

सेमीकॉन्ग (SemiKong)

सेमीकॉन्ग तीन एलायंस सदस्यों के बीच एक सहयोगी प्रयास है। उन्होंने विशेष रूप से अर्धचालक विनिर्माण प्रक्रिया डोमेन के लिए एक ओपन-सोर्स लार्ज लैंग्वेज मॉडल बनाया। निर्माता नए उपकरणों और प्रक्रियाओं के विकास में तेजी लाने के लिए इस मॉडल का लाभ उठा सकते हैं। सेमीकॉन्ग के पास अर्धचालक उपकरणों के भौतिकी और रसायन विज्ञान के बारे में विशेष ज्ञान है। केवल छह महीनों में, सेमीकॉन्ग ने वैश्विक अर्धचालक उद्योग का ध्यान आकर्षित किया।

सेमीकॉन्ग को टोक्यो इलेक्ट्रॉन द्वारा क्यूरेट किए गए डेटासेट का उपयोग करके Llama 3 बेस मॉडल को फाइन-ट्यून करके विकसित किया गया था। इस ट्यूनिंग प्रक्रिया के परिणामस्वरूप एक उद्योग-विशिष्ट जनरेटिव AI मॉडल हुआ, जिसमें सामान्य बेस मॉडल की तुलना में अर्धचालक नक़्क़ाशी प्रक्रियाओं का बेहतर ज्ञान था। सेमीकॉन्ग पर एक तकनीकी रिपोर्ट उपलब्ध है।

DANA (डोमेन-अवेयर न्यूरोसिम्बोलिक एजेंट्स)

DANA, एटोमैटिक इंक (सिलिकॉन वैली में स्थित) और फेनरिर इंक (जापान में स्थित) का एक संयुक्त विकास है। यह अब-लोकप्रिय एजेंट आर्किटेक्चर का एक प्रारंभिक उदाहरण प्रस्तुत करता है, जहां मॉडल को पूरक क्षमताएं प्रदान करने के लिए अन्य उपकरणों के साथ एकीकृत किया जाता है। जबकि अकेले मॉडल प्रभावशाली परिणाम प्राप्त कर सकते हैं, कई अध्ययनों से पता चला है कि LLM अक्सर गलत उत्तर उत्पन्न करते हैं। सेमीकॉन्ग पेपर में उद्धृत 2023 के एक अध्ययन ने विशिष्ट LLM त्रुटियों को 50% पर मापा, जबकि DANA के तर्क और नियोजन उपकरणों के पूरक उपयोग ने लक्षित अनुप्रयोगों के लिए सटीकता को 90% तक बढ़ा दिया।

DANA न्यूरोसिम्बोलिक एजेंटों को नियोजित करता है जो प्रतीकात्मक तर्क के साथ तंत्रिका नेटवर्क की पैटर्न पहचान क्षमताओं को जोड़ते हैं, कठोर तर्क और नियम-आधारित समस्या-समाधान को सक्षम करते हैं। तार्किक तर्क, नियोजन के लिए उपकरणों के साथ संयुक्त (जैसे असेंबली-लाइन प्रक्रियाओं को डिजाइन करना), सटीक और विश्वसनीय परिणाम उत्पन्न करता है जो औद्योगिक गुणवत्ता नियंत्रण प्रणालियों और स्वचालित नियोजन और शेड्यूलिंग के लिए आवश्यक हैं।

DANA की बहुमुखी प्रतिभा कई डोमेन तक फैली हुई है। उदाहरण के लिए, वित्तीय पूर्वानुमान और निर्णय लेने में, DANA बाजार के रुझानों को समझ सकता है और संरचित और असंरचित डेटा दोनों का उपयोग करते हुए जटिल सिद्धांतों के आधार पर भविष्यवाणियां कर सकता है। इसी क्षमता को चिकित्सा साहित्य और अनुसंधान जानकारी को पुनः प्राप्त करने और मूल्यांकन करने के लिए लागू किया जा सकता है, यह सुनिश्चित करते हुए कि निदान और उपचार स्थापित चिकित्सा प्रोटोकॉल और प्रथाओं का पालन करते हैं। संक्षेप में, DANA रोगी के परिणामों में सुधार कर सकता है और महत्वपूर्ण रोगी अनुप्रयोगों में त्रुटियों को कम कर सकता है।

निरंतर विकास के लिए एक मजबूत नींव

AI एलायंस ने 2025 की शुरुआत एक मजबूत स्थिति में की, जिसमें 23 देशों में फैले सदस्य और प्रमुख AI चुनौतियों पर केंद्रित कई कार्य समूह शामिल हैं। एलायंस 90 से अधिक सक्रिय परियोजनाओं में लगे 1,200 से अधिक कार्य-समूह सहयोगियों का दावा करता है। अंतरराष्ट्रीय स्तर पर, AI एलायंस ने 10 देशों में आयोजित कार्यक्रमों में भाग लिया है, 20,000 से अधिक लोगों तक पहुंचा है, और AI के महत्वपूर्ण विषयों पर पांच कैसे-कैसे मार्गदर्शिकाएं प्रकाशित की हैं ताकि शोधकर्ताओं और डेवलपर्स को AI बनाने और उपयोग करने में सहायता मिल सके।

AI एलायंस ने IBM के ग्रेनाइट परिवार और Meta के Llama मॉडल जैसे मॉडल पर AI का उपयोग करने के उदाहरण प्रकाशित किए हैं। इसका “व्यंजनों” का बढ़ता संग्रह RAG, नॉलेज ग्राफ़, न्यूरोसिम्बोलिक सिस्टम और उभरते एजेंट नियोजन और तर्क आर्किटेक्चर सहित सामान्य एप्लिकेशन पैटर्न के लिए सबसे लोकप्रिय ओपन लाइब्रेरी और मॉडल का लाभ उठाता है।

स्केलिंग अप: 2025 और उसके बाद के लिए महत्वाकांक्षी योजनाएं

2025 में, AI एलायंस अपनी पहुंच और प्रभाव को दस गुना बढ़ाने के लिए प्रतिबद्ध है। इसकी दो नई प्रमुख पहल, जिन पर पहले चर्चा की गई थी, Open Trusted Data Initiative और Trust and Safety Evaluation Initiative हैं। AI एलायंस AI एप्लिकेशन प्रौद्योगिकियों के विकास और परीक्षण के लिए एक उद्योग-मानक सामुदायिक प्रयोगशाला स्थापित करने की भी योजना बना रहा है। इसकी डोमेन-विशिष्ट मॉडल पहल विकसित होती रहेगी। उदाहरण के लिए, नया जलवायु और स्थिरता कार्य समूह जलवायु परिवर्तन और इसके शमन में प्रमुख चुनौतियों का समाधान करने के लिए मल्टीमॉडल फाउंडेशन मॉडल और ओपन-सोर्स सॉफ्टवेयर टूलिंग विकसित करने की योजना बना रहा है।

2030 तक, AI के वैश्विक अर्थव्यवस्था में अनुमानित $20 ट्रिलियन का योगदान करने का अनुमान है। तब तक, यह अनुमान लगाया गया है कि 70% औद्योगिक AI एप्लिकेशन ओपन-सोर्स AI पर चलेंगे। AI पेशेवरों की कमी भी आज की तुलना में और अधिक तीव्र होने की उम्मीद है। AI एलायंस के सदस्य विविध विशेषज्ञता और संसाधन साझाकरण तक पहुंच प्राप्त करने के लिए अन्य सदस्यों के साथ सहयोग करके इस चुनौती को कम करने में सक्षम हो सकते हैं।

AI एलायंस अन्य सफल ओपन-सोर्स संगठनों, जैसे कि लिनक्स फाउंडेशन, अपाचे सॉफ्टवेयर फाउंडेशन और ओपन सोर्स इनिशिएटिव के समान विकास पथ का अनुसरण कर रहा है। इसमे शामिल है:

  • व्यापक AI शिक्षा और कौशल कार्यक्रम
  • जिम्मेदार AI के लिए वैश्विक वकालत
  • AI सुरक्षा और विश्वसनीयता सुनिश्चित करने के लिए उपकरण बनाना, साथ ही विकास और उपयोग में आसानी
  • शैक्षणिक संस्थानों के साथ सहयोगी अनुसंधान

AI एलायंस का नेतृत्व डेवलपर्स और शोधकर्ताओं के साथ-साथ व्यापार और सरकारी नेताओं को आकर्षित करना जारी रखेगा। AI एलायंस के नेतृत्व ने 2025 के लिए अपने व्यापक मिशन के रूप में वैश्विक सहयोग को बढ़ाना स्थापित किया है। सभी बातों पर विचार करते हुए, AI एलायंस के पास एक प्रमुख वैश्विक शक्ति बनने की नींव है जो कृत्रिम बुद्धिमत्ता के भविष्य को आकार देती है, सुधारती है और नया करती है।