खुलेपन का क्षरण: क्यों 'ओपन सोर्स' AI अक्सर नहीं होता

‘ओपन सोर्स’ शब्द प्रौद्योगिकी की दुनिया में एक शक्तिशाली गूंज रखता है। यह सहयोगात्मक नवाचार, साझा ज्ञान और पारदर्शिता में एक मौलिक विश्वास की छवियों को उजागर करता है। इस भावना को आधी सदी पहले Menlo Park, California में Homebrew Computer Club के गठन के साथ स्पष्ट रूप से मूर्त रूप दिया गया था। उत्साही और टिंकरर्स के इस समूह ने सिर्फ मशीनें नहीं बनाईं; उन्होंने स्वतंत्र रूप से विचारों और सॉफ्टवेयर के आदान-प्रदान पर आधारित एक संस्कृति का निर्माण किया, जिसने ओपन-सोर्स आंदोलन के लिए आधारशिला रखी जो कंप्यूटिंग में क्रांति लाएगा। फिर भी, आज, यह कड़ी मेहनत से अर्जित विरासत और खुलेपन की परिभाषा एक सूक्ष्म लेकिन महत्वपूर्ण चुनौती का सामना कर रही है, खासकर आर्टिफिशियल इंटेलिजेंस के तेजी से बढ़ते डोमेन के भीतर। परिष्कृत AI मॉडल विकसित करने वाली कंपनियों की बढ़ती संख्या उत्सुकता से अपनी रचनाओं को ‘ओपन सोर्स’ के रूप में ब्रांड कर रही है, लेकिन करीब से देखने पर पता चलता है कि यह लेबल अक्सर सतही रूप से लागू किया जाता है, एक ऐसी वास्तविकता को छुपाता है जो आंदोलन के मूल सिद्धांतों से कम है। अर्थ का यह कमजोर पड़ना केवल एक शब्दार्थ संबंधी विवाद नहीं है; यह पारदर्शिता और पुनरुत्पादन क्षमता के सिद्धांतों के लिए एक वास्तविक खतरा है जो विशेष रूप से वैज्ञानिक समुदाय के भीतर सर्वोपरि हैं।

वास्तविक खुले सहयोग की भावना को समझना

वर्तमान दुर्दशा को समझने के लिए, पहले यह समझना होगा कि ‘ओपन सोर्स’ वास्तव में क्या दर्शाता है। यह सिर्फ मुफ्त सॉफ्टवेयर से कहीं बढ़कर है; यह सामूहिक प्रगति और सत्यापन योग्य विश्वास में निहित एक दर्शन है। इस दर्शन का आधार चार आवश्यक स्वतंत्रताओं पर टिका है:

  1. किसी भी उद्देश्य के लिए प्रोग्राम चलाने की स्वतंत्रता
  2. प्रोग्राम कैसे काम करता है इसका अध्ययन करने और इसे बदलने की स्वतंत्रता ताकि यह आपकी कंप्यूटिंग को आपकी इच्छानुसार करे। सोर्स कोड तक पहुंच इसके लिए एक पूर्व शर्त है।
  3. प्रतियों को पुनर्वितरित करने की स्वतंत्रता ताकि आप दूसरों की मदद कर सकें।
  4. अपने संशोधित संस्करणों की प्रतियों को दूसरों को वितरित करने की स्वतंत्रता। ऐसा करके आप पूरे समुदाय को अपने परिवर्तनों से लाभ उठाने का मौका दे सकते हैं। सोर्स कोड तक पहुंच इसके लिए एक पूर्व शर्त है।

ये स्वतंत्रताएं, आमतौर पर GNU General Public License (GPL), MIT License, या Apache License जैसे लाइसेंसों में निहित होती हैं, ऐतिहासिक रूप से सोर्स कोड पर केंद्रित रही हैं। सोर्स कोड - प्रोग्रामर द्वारा लिखे गए मानव-पठनीय निर्देश - पारंपरिक सॉफ्टवेयर का खाका है। इस कोड को खुले तौर पर उपलब्ध कराने से कोई भी इसका निरीक्षण कर सकता है, इसके तर्क को समझ सकता है, संभावित खामियों की पहचान कर सकता है, इसे नई जरूरतों के अनुकूल बना सकता है और उन सुधारों को साझा कर सकता है।

यह मॉडल नवाचार और वैज्ञानिक उन्नति के लिए एक असाधारण उत्प्रेरक रहा है। दुनिया भर के शोधकर्ताओं के लिए आसानी से उपलब्ध उपकरणों के प्रभाव पर विचार करें:

  • सांख्यिकीय विश्लेषण: R Studio जैसा सॉफ्टवेयर सांख्यिकीय कंप्यूटिंग और ग्राफिक्स के लिए एक शक्तिशाली, पारदर्शी और विस्तार योग्य वातावरण प्रदान करता है, जो अनगिनत वैज्ञानिक क्षेत्रों में डेटा विश्लेषण का आधार बन गया है। इसकी खुलापन विधियों की सहकर्मी समीक्षा और विशेष पैकेजों के विकास की अनुमति देता है।
  • कम्प्यूटेशनल फ्लुइड डायनेमिक्स: OpenFOAM द्रव प्रवाह के अनुकरण के लिए एक परिष्कृत पुस्तकालय प्रदान करता है, जो एयरोस्पेस इंजीनियरिंग से लेकर पर्यावरण विज्ञान तक के क्षेत्रों में महत्वपूर्ण है। इसकी खुली प्रकृति जटिल सिमुलेशन के अनुकूलन और सत्यापन को सक्षम बनाती है।
  • ऑपरेटिंग सिस्टम: Linux और अन्य ओपन-सोर्स ऑपरेटिंग सिस्टम दुनिया के अधिकांश कंप्यूटिंग बुनियादी ढांचे की रीढ़ बनाते हैं, जिसमें वैज्ञानिक उच्च-प्रदर्शन कंप्यूटिंग क्लस्टर शामिल हैं, जिन्हें उनकी स्थिरता, लचीलेपन और पारदर्शिता के लिए महत्व दिया जाता है।

लाभ केवल लागत बचत से कहीं आगे तक फैले हुए हैं। ओपन सोर्स पुनरुत्पादन क्षमता को बढ़ावा देता है, जो वैज्ञानिक पद्धति का एक आधार है। जब अनुसंधान में उपयोग किए जाने वाले उपकरण और कोड खुले होते हैं, तो अन्य वैज्ञानिक प्रयोगों को दोहरा सकते हैं, निष्कर्षों को सत्यापित कर सकते हैं, और विश्वास के साथ काम पर निर्माण कर सकते हैं। यह वैश्विक सहयोग को बढ़ावा देता है, बाधाओं को तोड़ता है और विविध पृष्ठभूमि और संस्थानों के शोधकर्ताओं को साझा चुनौतियों में योगदान करने की अनुमति देता है। यह दीर्घायु सुनिश्चित करता है और वेंडर लॉक-इन से बचाता है, मालिकाना सॉफ्टवेयर कंपनियों की सनक से अनुसंधान निवेश की रक्षा करता है। यह नए विचारों और तकनीकों के तेजी से प्रसार और पुनरावृत्ति की अनुमति देकर खोज को तेज करता है। ओपन-सोर्स लोकाचार मौलिक रूप से पारदर्शिता, जांच और साझा प्रगति के माध्यम से ज्ञान की वैज्ञानिक खोज के साथ संरेखित है।

आर्टिफिशियल इंटेलिजेंस: एक पूरी तरह से अलग जानवर

स्थापित ओपन-सोर्स प्रतिमान, जो सोर्स कोड की पहुंच के आसपास सुरक्षित रूप से बनाया गया है, आर्टिफिशियल इंटेलिजेंस के दायरे में लागू होने पर महत्वपूर्ण अशांति का सामना करता है, विशेष रूप से बड़े पैमाने पर मॉडल जैसे मूलभूत बड़े भाषा मॉडल (LLMs)। जबकि इन AI प्रणालियों में निश्चित रूप से कोड शामिल होता है, उनकी कार्यक्षमता और व्यवहार कहीं अधिक जटिल और अक्सर अपारदर्शी तत्वों द्वारा आकार लेते हैं। केवल एक न्यूरल नेटवर्क के लिए आर्किटेक्चरल कोड जारी करना वास्तविक खुलेपन के बराबर नहीं है जैसा कि यह पारंपरिक सॉफ्टवेयर के लिए करता है।

एक AI मॉडल, विशेष रूप से एक डीप लर्निंग मॉडल, आमतौर पर कई प्रमुख अवयवों से बना होता है:

  1. मॉडल आर्किटेक्चर: यह न्यूरल नेटवर्क का संरचनात्मक डिजाइन है - परतों, न्यूरॉन्स और कनेक्शन की व्यवस्था। कंपनियां अक्सर इस जानकारी को जारी करती हैं, इसे खुलेपन के सबूत के रूप में प्रस्तुत करती हैं। यह एक इंजन के खाके को साझा करने के समान है।
  2. मॉडल वेट्स (पैरामीटर्स): ये नेटवर्क के भीतर संख्यात्मक मान हैं, अक्सर अरबों की संख्या में, जिन्हें प्रशिक्षण प्रक्रिया के दौरान समायोजित किया गया है। वे प्रशिक्षण डेटा से निकाले गए सीखे गए पैटर्न और ज्ञान का प्रतिनिधित्व करते हैं। वेट्स जारी करने से दूसरों को पूर्व-प्रशिक्षित मॉडल का उपयोग करने की अनुमति मिलती है। यह पूरी तरह से इकट्ठे इंजन को प्रदान करने जैसा है, जो चलने के लिए तैयार है।
  3. ट्रेनिंग डेटा: यह शायद सबसे महत्वपूर्ण और सबसे अधिक बार अस्पष्ट घटक है। मूलभूत मॉडल विशाल डेटासेट पर प्रशिक्षित होते हैं, जिन्हें अक्सर इंटरनेट से स्क्रैप किया जाता है या मालिकाना या निजी संग्रह (जैसे मेडिकल रिकॉर्ड, जो महत्वपूर्ण गोपनीयता चिंताएं उठाते हैं) से प्राप्त किया जाता है। इस डेटा के भीतर संरचना, क्यूरेशन, फ़िल्टरिंग और संभावित पूर्वाग्रह मॉडल की क्षमताओं, सीमाओं और नैतिक व्यवहार को गहराई से प्रभावित करते हैं। प्रशिक्षण डेटा के बारे में विस्तृत जानकारी के बिना, यह समझना कि क्यों एक मॉडल जिस तरह से व्यवहार करता है, या विशिष्ट अनुप्रयोगों के लिए इसकी उपयुक्तता और सुरक्षा का आकलन करना अविश्वसनीय रूप से कठिन हो जाता है। यह गुप्त ईंधन मिश्रण और सटीक स्थितियां हैं जिनके तहत इंजन को चलाया गया था।
  4. ट्रेनिंग कोड और प्रक्रिया: इसमें प्रशिक्षण के लिए उपयोग किए जाने वाले विशिष्ट एल्गोरिदम, अनुकूलन तकनीकें, चुने हुए हाइपरपैरामीटर (सेटिंग्स जो सीखने की प्रक्रिया को नियंत्रित करते हैं), नियोजित कम्प्यूटेशनल इन्फ्रास्ट्रक्चर और खपत की गई महत्वपूर्ण ऊर्जा शामिल हैं। प्रशिक्षण प्रक्रिया में मामूली बदलाव अलग-अलग मॉडल व्यवहारों को जन्म दे सकते हैं, जिससे पुनरुत्पादन क्षमता चुनौतीपूर्ण हो जाती है, भले ही वास्तुकला और डेटा ज्ञात हों। यह इंजन बनाने और ट्यून करने के लिए उपयोग किए जाने वाले विस्तृत इंजीनियरिंग विनिर्देशों, टूलिंग और फ़ैक्टरी स्थितियों का प्रतिनिधित्व करता है।

वर्तमान में ‘ओपन सोर्स’ AI के रूप में विपणन की जाने वाली कई प्रणालियाँ मुख्य रूप से मॉडल आर्किटेक्चर और पूर्व-प्रशिक्षित वेट्स तक पहुँच प्रदान करती हैं। जबकि यह उपयोगकर्ताओं को मॉडल चलाने और शायद इसे छोटे डेटासेट पर फाइन-ट्यून करने की अनुमति देता है, यह प्रशिक्षण डेटा और प्रक्रिया के संबंध में आवश्यक पारदर्शिता प्रदान करने में गंभीर रूप से विफल रहता है। यह मॉडल के मौलिक गुणों का सही मायने में अध्ययन करने या इसे गहरे सार्थक तरीकों से संशोधित करने की क्षमता को गंभीर रूप से कम करता है जिसके लिए रीट्रेनिंग या इसकी उत्पत्ति को समझने की आवश्यकता होती है। अध्ययन और संशोधन की स्वतंत्रता, जो ओपन-सोर्स परिभाषा के केंद्र में है, महत्वपूर्ण रूप से बाधित होती है जब डेटा और प्रशिक्षण पद्धति के महत्वपूर्ण तत्व छिपे रहते हैं। मॉडल के निर्माण को खरोंच से दोहराना - वैज्ञानिक समझ और सत्यापन का एक प्रमुख परीक्षण - वस्तुतः असंभव हो जाता है।

AI में ‘ओपनवॉशिंग’ का चिंताजनक चलन

लेबल और वास्तविकता के बीच इस अंतर ने ‘ओपनवॉशिंग’ नामक एक प्रथा को जन्म दिया है। यह शब्द कंपनियों द्वारा विपणन और रणनीतिक लाभ के लिए ‘ओपन सोर्स’ की सकारात्मक प्रतिष्ठा और कथित लाभों का लाभ उठाने के कार्य का वर्णन करता है, जबकि साथ ही विस्तृत प्रशिक्षण डेटा जानकारी या प्रशिक्षण के लिए उपयोग किए जाने वाले कोड जैसे महत्वपूर्ण घटकों तक पहुंच को रोकते हैं। वे पारदर्शिता और सामुदायिक पहुंच के अपने मांग वाले सिद्धांतों को पूरी तरह से अपनाए बिना खुलेपन की भाषा में अपनी प्रणालियों को ढक लेते हैं।

कई प्रमुख AI मॉडल, व्यापक रूप से उपयोग किए जाने और कभी-कभी ‘ओपन’ पदनाम ले जाने के बावजूद, Open Source Initiative (OSI) जैसे संगठनों द्वारा समर्थित ओपन सोर्स की व्यापक परिभाषा के मुकाबले कम पड़ते हैं। OSI द्वारा एक विश्लेषण, जो 2022 से AI संदर्भ में ओपन सोर्स के अर्थ को स्पष्ट करने के लिए लगन से काम कर रहा है, ने कई लोकप्रिय मॉडलों के साथ चिंताओं को उजागर किया:

  • Llama 2 & Llama 3.x (Meta): जबकि मॉडल वेट्स और आर्किटेक्चर उपलब्ध हैं, उपयोग पर प्रतिबंध और पूर्ण प्रशिक्षण डेटासेट और प्रक्रिया के संबंध में अधूरी पारदर्शिता पारंपरिक ओपन-सोर्स मूल्यों के साथ उनके संरेखण को सीमित करती है।
  • Grok (X): इसी तरह, उपलब्ध कराए जाने के बावजूद, इसके प्रशिक्षण डेटा और कार्यप्रणाली के बारे में व्यापक जानकारी की कमी इसकी वास्तविक खुलेपन पर सवाल उठाती है।
  • Phi-2 (Microsoft): अक्सर ‘ओपन मॉडल’ के रूप में वर्णित, इसकी निर्माण प्रक्रिया और डेटा के संबंध में पूर्ण पारदर्शिता सीमित बनी हुई है।
  • Mixtral (Mistral AI): यद्यपि कुछ हिस्से जारी किए गए हैं, यह अध्ययन और संशोधन के लिए सभी आवश्यक घटकों तक पहुंच में सीमाओं के कारण ओपन सोर्स के पूर्ण मानदंडों को पूरा नहीं करता है।

ये उदाहरण उन प्रयासों के विपरीत हैं जो ओपन-सोर्स सिद्धांतों के अधिक पालन के लिए प्रयास करते हैं:

  • OLMo (Allen Institute for AI): एक गैर-लाभकारी अनुसंधान संस्थान द्वारा विकसित, OLMo को स्पष्ट रूप से खुलेपन को ध्यान में रखकर डिजाइन किया गया था, जिसमें न केवल वेट्स बल्कि प्रशिक्षण कोड और उपयोग किए गए डेटा के बारे में विवरण भी जारी किए गए थे।
  • LLM360’s CrystalCoder: एक समुदाय-संचालित परियोजना जिसका लक्ष्य मॉडल के जीवनचक्र में पूर्ण पारदर्शिता है, जिसमें डेटा, प्रशिक्षण प्रक्रियाएं और मूल्यांकन मेट्रिक्स शामिल हैं।

ओपनवॉशिंग में क्यों संलग्न हों? प्रेरणाएँ बहुआयामी हैं:

  1. विपणन और धारणा: ‘ओपन सोर्स’ लेबल महत्वपूर्ण सद्भावना रखता है। यह सहयोग, नैतिक प्रथाओं और व्यापक समुदाय के प्रति प्रतिबद्धता का सुझाव देता है, जो उपयोगकर्ताओं, डेवलपर्स और सकारात्मक प्रेस को आकर्षित कर सकता है।
  2. पारिस्थितिकी तंत्र निर्माण: पूर्ण पारदर्शिता के बिना भी मॉडल वेट्स जारी करना, डेवलपर्स को AI सिस्टम के शीर्ष पर एप्लिकेशन बनाने के लिए प्रोत्साहित करता है, संभावित रूप से एक आश्रित पारिस्थितिकी तंत्र बनाता है जो मूल कंपनी को लाभान्वित करता है।
  3. नियामक मध्यस्थता: यह एक विशेष रूप से चिंताजनक चालक है। आगामी नियम, जैसे कि European Union’s AI Act (2024), से कुछ उच्च-जोखिम वाली AI प्रणालियों पर सख्त आवश्यकताएं लागू करने की उम्मीद है। हालांकि, ‘फ्री और ओपन-सोर्स सॉफ्टवेयर’ के लिए अक्सर छूट या हल्की जांच का प्रस्ताव दिया जाता है। ‘ओपन सोर्स’ लेबल लागू करके - भले ही स्थापित परिभाषाओं के अनुसार गलत तरीके से - कंपनियां इन नियमों को अधिक आसानी से नेविगेट करने की उम्मीद कर सकती हैं, मालिकाना, उच्च-जोखिम प्रणालियों से जुड़े संभावित रूप से महंगे अनुपालन बोझ से बच सकती हैं। यह रणनीतिक लेबलिंग एक संभावित खामी का फायदा उठाती है, सुरक्षा और पारदर्शिता सुनिश्चित करने के लिए विनियमन के इरादे को कमजोर करती है।

यह प्रथा अंततः ‘ओपन सोर्स’ शब्द का अवमूल्यन करती है और भ्रम पैदा करती है, जिससे उपयोगकर्ताओं, डेवलपर्स और शोधकर्ताओं के लिए यह समझना मुश्किल हो जाता है कि कौन सी AI प्रणालियाँ वास्तव में पारदर्शिता और स्वतंत्रता प्रदान करती हैं जिसका लेबल तात्पर्य है।

विज्ञान के लिए सच्ची खुलापन क्यों तत्काल मायने रखता है

वैज्ञानिक समुदाय के लिए, इस बहस में दांव असाधारण रूप से ऊंचे हैं। विज्ञान पारदर्शिता, पुनरुत्पादन क्षमता और स्वतंत्र सत्यापन की क्षमता पर पनपता है। अनुसंधान में AI का बढ़ता एकीकरण - जीनोमिक डेटा का विश्लेषण करने और जलवायु परिवर्तन का मॉडलिंग करने से लेकर नई सामग्रियों की खोज करने और जटिल जैविक प्रणालियों को समझने तक - इन AI उपकरणों की प्रकृति को गंभीर रूप से महत्वपूर्ण बनाता है। ‘ब्लैक बॉक्स’ AI सिस्टम पर निर्भर रहना, या उन पर जो वास्तविक पारदर्शिता प्रदान किए बिना खुले होने का दिखावा करते हैं, गहन जोखिम पेश करते हैं:

  • बिगड़ा हुआ पुनरुत्पादन क्षमता: यदि शोधकर्ता किसी अध्ययन में उपयोग किए गए AI मॉडल के पीछे प्रशिक्षण डेटा और कार्यप्रणाली तक नहीं पहुंच सकते हैं या समझ नहीं सकते हैं, तो परिणामों को दोहराना असंभव हो जाता है। यह मौलिक रूप से वैज्ञानिक पद्धति के एक मुख्य स्तंभ को कमजोर करता है। निष्कर्षों पर कैसे भरोसा किया जा सकता है या उन पर निर्माण किया जा सकता है यदि उन्हें स्वतंत्र रूप से सत्यापित नहीं किया जा सकता है?
  • छिपे हुए पूर्वाग्रह और सीमाएँ: सभी AI मॉडल अपने प्रशिक्षण डेटा और डिजाइन विकल्पों से पूर्वाग्रह प्राप्त करते हैं। पारदर्शिता के बिना, शोधकर्ता इन पूर्वाग्रहों का पर्याप्त रूप से आकलन नहीं कर सकते हैं या मॉडल की सीमाओं को नहीं समझ सकते हैं। अनजाने में एक पक्षपाती मॉडल का उपयोग करने से विषम परिणाम, त्रुटिपूर्ण निष्कर्ष और संभावित रूप से हानिकारक वास्तविक दुनिया के परिणाम हो सकते हैं, खासकर चिकित्सा अनुसंधान या सामाजिक विज्ञान जैसे संवेदनशील क्षेत्रों में।
  • जांच का अभाव: अपारदर्शी मॉडल कठोर सहकर्मी समीक्षा से बचते हैं। वैज्ञानिक समुदाय मॉडल के आंतरिक कामकाज की पूरी तरह से पूछताछ नहीं कर सकता है, इसके तर्क में संभावित त्रुटियों की पहचान नहीं कर सकता है, या इसकी भविष्यवाणियों से जुड़ी अनिश्चितताओं को नहीं समझ सकता है। यह वैज्ञानिक जांच की आत्म-सुधार प्रकृति में बाधा डालता है।
  • कॉर्पोरेट सिस्टम पर निर्भरता: निगमों द्वारा नियंत्रित बंद या अर्ध-बंद AI सिस्टम पर निर्भरता निर्भरता पैदा करती है। अनुसंधान एजेंडा उपलब्ध कॉर्पोरेट उपकरणों की क्षमताओं और सीमाओं से सूक्ष्म रूप से प्रभावित हो सकते हैं, और पहुंच प्रतिबंधित हो सकती है या महंगी हो सकती है, संभावित रूप से स्वतंत्र अनुसंधान दिशाओं को दबा सकती है और अच्छी तरह से वित्त पोषित संस्थानों और अन्य के बीच की खाई को चौड़ा कर सकती है।
  • रुका हुआ नवाचार: सच्चा ओपन सोर्स शोधकर्ताओं को न केवल उपकरणों का उपयोग करने की अनुमति देता है, बल्कि उन्हें विच्छेदित करने, संशोधित करने, सुधारने और पुन: उपयोग करने की भी अनुमति देता है। यदि AI मॉडल के प्रमुख घटक दुर्गम रहते हैं, तो नवाचार के लिए यह महत्वपूर्ण मार्ग अवरुद्ध हो जाता है। वैज्ञानिकों को उपन्यास प्रशिक्षण तकनीकों के साथ प्रयोग करने, विभिन्न डेटा संयोजनों की खोज करने, या विशिष्ट, सूक्ष्म अनुसंधान प्रश्नों के लिए मॉडल को अनुकूलित करने से रोका जाता है जिनकी मूल डेवलपर्स ने उम्मीद नहीं की थी।

वैज्ञानिक समुदाय ‘ओपन सोर्स’ शब्द के कमजोर पड़ने को निष्क्रिय रूप से स्वीकार नहीं कर सकता है। इसे सक्रिय रूप से स्पष्टता की वकालत करनी चाहिए और AI डेवलपर्स से वास्तविक पारदर्शिता की मांग करनी चाहिए, खासकर जब इन उपकरणों का उपयोग अनुसंधान संदर्भों में किया जाता है। इसमें शामिल है:

  • स्पष्ट मानकों को बढ़ावा देना: OSI जैसे प्रयासों का समर्थन करना, ‘ओपन-सोर्स AI’ का गठन करने के लिए स्पष्ट, कठोर परिभाषाएँ स्थापित करना, ऐसी परिभाषाएँ जिनमें आर्किटेक्चर, वेट्स, प्रशिक्षण डेटा और प्रशिक्षण प्रक्रियाओं के संबंध में पारदर्शिता शामिल हो।
  • सत्यापन योग्य उपकरणों को प्राथमिकता देना: उन AI मॉडलों और प्लेटफार्मों के उपयोग का पक्ष लेना जो पारदर्शिता के इन उच्च मानकों को पूरा करते हैं, भले ही वे शुरू में कम प्रदर्शन करने वाले हों या आसानी से उपलब्ध अपारदर्शी विकल्पों की तुलना में अधिक प्रयास की आवश्यकता हो।
  • पारदर्शिता की मांग करना: इस बात पर जोर देना कि AI से जुड़े प्रकाशनों में उपयोग किए गए मॉडलों के बारे में विस्तृत खुलासे शामिल हों, जिसमें प्रशिक्षण डेटा प्रोवेनेंस, प्रसंस्करण और संभावित पूर्वाग्रहों के साथ-साथ प्रशिक्षण पद्धतियों के बारे में व्यापक जानकारी शामिल हो।
  • वास्तव में खुली परियोजनाओं का समर्थन करना: AI विकास में वास्तविक खुलेपन के लिए प्रतिबद्ध संस्थानों से समुदाय-संचालित परियोजनाओं और पहलों में योगदान करना और उनका उपयोग करना।

Homebrew Computer Club की भावना - साझा ज्ञान और सहयोगात्मक निर्माण में से एक - AI युग की जटिलताओं को जिम्मेदारी से नेविगेट करने के लिए आवश्यक है। आर्टिफिशियल इंटेलिजेंस के लिए ‘ओपन सोर्स’ के सही अर्थ को पुनः प्राप्त करना और उसका बचाव करना केवल शब्दावली शुद्धता के बारे में नहीं है; यह तेजी से AI-संचालित दुनिया में विज्ञान की अखंडता, पुनरुत्पादन क्षमता और निरंतर प्रगति की सुरक्षा के बारे में है। आगे का मार्ग सतर्कता और यह सुनिश्चित करने के लिए एक सामूहिक प्रतिबद्धता की मांग करता है कि AI के शक्तिशाली उपकरणों को खुली जांच के सिद्धांतों के अनुरूप विकसित और तैनात किया जाए जिन्होंने सदियों से विज्ञान की इतनी अच्छी सेवा की है।