‘ओपन सोर्स’ या शब्दाला तंत्रज्ञानाच्या जगात एक शक्तिशाली प्रतिध्वनी आहे. हे सहयोगी नवकल्पना, सामायिक ज्ञान आणि पारदर्शकतेवरील मूलभूत विश्वासाची प्रतिमा जागृत करते. अर्धशतकापूर्वी कॅलिफोर्नियातील Menlo Park येथे Homebrew Computer Club च्या स्थापनेतून ही भावना स्पष्टपणे दिसून आली. उत्साही आणि प्रयोग करणाऱ्यांच्या या समूहाने केवळ यंत्रेच तयार केली नाहीत; त्यांनी कल्पना आणि सॉफ्टवेअरची मुक्तपणे देवाणघेवाण करण्यावर आधारित संस्कृती तयार केली, ज्यामुळे संगणकीय क्षेत्रात क्रांती घडवणाऱ्या ओपन-सोर्स चळवळीचा पाया घातला गेला. तरीही, आज हा कष्टाने मिळवलेला वारसा आणि मोकळेपणाची व्याख्या एका सूक्ष्म पण महत्त्वपूर्ण आव्हानाला सामोरे जात आहे, विशेषतः कृत्रिम बुद्धिमत्तेच्या (artificial intelligence) वेगाने विस्तारणाऱ्या क्षेत्रात. अत्याधुनिक AI मॉडेल्स विकसित करणाऱ्या अनेक कंपन्या त्यांच्या निर्मितीला ‘ओपन सोर्स’ म्हणून उत्सुकतेने ब्रँड करत आहेत, परंतु बारकाईने पाहिल्यास हे लेबल अनेकदा वरवरचे असल्याचे दिसून येते, जे चळवळीच्या मूळ तत्त्वांपेक्षा कमी असलेल्या वास्तवाला लपवते. अर्थाची ही घट केवळ शब्दार्थाचा वाद नाही; हे पारदर्शकता आणि पुनरुत्पादकतेच्या तत्त्वांना खरा धोका निर्माण करते, जे विशेषतः वैज्ञानिक समुदायामध्ये अत्यंत महत्त्वाचे आहेत.
खऱ्या खुल्या सहकार्याची भावना समजून घेणे
सध्याची बिकट परिस्थिती समजून घेण्यासाठी, ‘ओपन सोर्स’ चा खरा अर्थ काय आहे हे प्रथम समजून घेणे आवश्यक आहे. हे केवळ विनामूल्य सॉफ्टवेअरपेक्षा अधिक आहे; हे सामूहिक प्रगती आणि सत्यापित विश्वासावर आधारित एक तत्त्वज्ञान आहे. या तत्त्वज्ञानाचा आधार चार अत्यावश्यक स्वातंत्र्यांवर अवलंबून आहे:
- कोणत्याही हेतूसाठी प्रोग्राम चालवण्याचे स्वातंत्र्य.
- प्रोग्राम कसा कार्य करतो याचा अभ्यास करण्याचे स्वातंत्र्य आणि आपल्या इच्छेनुसार संगणकीय कार्य करण्यासाठी त्यात बदल करण्याचे स्वातंत्र्य. यासाठी सोर्स कोडमध्ये प्रवेश असणे पूर्वअट आहे.
- प्रतींचे पुनर्वितरण करण्याचे स्वातंत्र्य जेणेकरून आपण इतरांना मदत करू शकाल.
- आपल्या सुधारित आवृत्त्यांच्या प्रती इतरांना वितरित करण्याचे स्वातंत्र्य. असे केल्याने आपण संपूर्ण समुदायाला आपल्या बदलांचा फायदा घेण्याची संधी देऊ शकता. यासाठी सोर्स कोडमध्ये प्रवेश असणे पूर्वअट आहे.
ही स्वातंत्र्यं, सामान्यतः GNU General Public License (GPL), MIT License, किंवा Apache License सारख्या परवान्यांमध्ये समाविष्ट केलेली असतात, ऐतिहासिकदृष्ट्या सोर्स कोडवर केंद्रित आहेत. सोर्स कोड - प्रोग्रामर्सनी लिहिलेल्या मानवी-वाचनीय सूचना - पारंपारिक सॉफ्टवेअरचा आराखडा आहे. हा कोड उघडपणे उपलब्ध केल्याने कोणालाही त्याची तपासणी करता येते, त्याचे तर्कशास्त्र समजून घेता येते, संभाव्य त्रुटी ओळखता येतात, नवीन गरजांनुसार त्यात बदल करता येतात आणि त्या सुधारणा सामायिक करता येतात.
हे मॉडेल नवकल्पना आणि वैज्ञानिक प्रगतीसाठी एक विलक्षण उत्प्रेरक ठरले आहे. जगभरातील संशोधकांना सहज उपलब्ध असलेल्या साधनांच्या प्रभावाचा विचार करा:
- सांख्यिकीय विश्लेषण: R Studio सारखे सॉफ्टवेअर सांख्यिकीय संगणन आणि ग्राफिक्ससाठी एक शक्तिशाली, पारदर्शक आणि विस्तारणीय वातावरण प्रदान करते, जे असंख्य वैज्ञानिक क्षेत्रांमध्ये डेटा विश्लेषणाचा आधारस्तंभ बनले आहे. त्याची मोकळीक पद्धतींचे समवयस्क पुनरावलोकन आणि विशेष पॅकेजेसच्या विकासास अनुमती देते.
- संगणकीय द्रव गतिशीलता: OpenFOAM द्रव प्रवाहांचे अनुकरण करण्यासाठी एक अत्याधुनिक लायब्ररी प्रदान करते, जी एरोस्पेस अभियांत्रिकीपासून पर्यावरण विज्ञानापर्यंतच्या क्षेत्रांमध्ये महत्त्वपूर्ण आहे. त्याचे खुले स्वरूप जटिल अनुकरणांचे सानुकूलन आणि सत्यापन सक्षम करते.
- ऑपरेटिंग सिस्टम: Linux आणि इतर ओपन-सोर्स ऑपरेटिंग सिस्टम जगातील बहुतेक संगणकीय पायाभूत सुविधांचा कणा बनवतात, ज्यात वैज्ञानिक उच्च-कार्यक्षमता संगणकीय क्लस्टर्सचा समावेश आहे, ज्यांचे मूल्य स्थिरता, लवचिकता आणि पारदर्शकतेसाठी आहे.
फायदे केवळ खर्चाच्या बचतीपलीकडे आहेत. ओपन सोर्स पुनरुत्पादकतेला प्रोत्साहन देते, जी वैज्ञानिक पद्धतीचा आधारस्तंभ आहे. जेव्हा संशोधनात वापरलेली साधने आणि कोड खुले असतात, तेव्हा इतर शास्त्रज्ञ प्रयोगांची प्रतिकृती करू शकतात, निष्कर्षांची पडताळणी करू शकतात आणि आत्मविश्वासाने कामावर आधारित प्रगती करू शकतात. हे जागतिक सहकार्याला प्रोत्साहन देते, अडथळे दूर करते आणि विविध पार्श्वभूमी आणि संस्थांमधील संशोधकांना सामायिक आव्हानांमध्ये योगदान देण्यास अनुमती देते. हे दीर्घायुष्य सुनिश्चित करते आणि विक्रेता लॉक-इन टाळते, मालकी सॉफ्टवेअर कंपन्यांच्या लहरींपासून संशोधन गुंतवणुकीचे संरक्षण करते. हे नवीन कल्पना आणि तंत्रांच्या जलद प्रसारास आणि पुनरावृत्तीस अनुमती देऊन शोधाला गती देते. ओपन-सोर्सची नीतिमत्ता मूलतः पारदर्शकता, छाननी आणि सामायिक प्रगतीद्वारे ज्ञानाच्या वैज्ञानिक शोधाशी जुळलेली आहे.
कृत्रिम बुद्धिमत्ता: एक पूर्णपणे वेगळा प्रकार
सोर्स कोडच्या उपलब्धतेभोवती सुरक्षितपणे तयार केलेली प्रस्थापित ओपन-सोर्स पद्धत, कृत्रिम बुद्धिमत्तेच्या क्षेत्रात, विशेषतः फाउंडेशनल लार्ज लँग्वेज मॉडेल्स (LLMs) सारख्या मोठ्या प्रमाणावरील मॉडेल्सवर लागू केल्यावर महत्त्वपूर्ण अडचणींचा सामना करते. जरी या AI प्रणालींमध्ये निश्चितपणे कोडचा समावेश असला तरी, त्यांची कार्यक्षमता आणि वर्तन अधिक जटिल आणि अनेकदा अपारदर्शक घटकांद्वारे आकारले जाते. न्यूरल नेटवर्कसाठी केवळ आर्किटेक्चरल कोड जारी करणे हे पारंपारिक सॉफ्टवेअरसाठी जसे होते तसे खऱ्या अर्थाने मोकळेपणाचे प्रतीक नाही.
एक AI मॉडेल, विशेषतः डीप लर्निंग मॉडेल, सामान्यतः अनेक मुख्य घटकांनी बनलेले असते:
- मॉडेल आर्किटेक्चर: ही न्यूरल नेटवर्कची संरचनात्मक रचना आहे - स्तरांची, न्यूरॉन्सची आणि जोडण्यांची मांडणी. कंपन्या अनेकदा ही माहिती जारी करतात, ती मोकळेपणाचा पुरावा म्हणून सादर करतात. हे इंजिनच्या ब्लू प्रिंट शेअर करण्यासारखे आहे.
- मॉडेल वेट्स (पॅरामीटर्स): ही नेटवर्कमधील संख्यात्मक मूल्ये आहेत, अनेकदा अब्जावधी, जी प्रशिक्षण प्रक्रियेदरम्यान समायोजित केली गेली आहेत. ते प्रशिक्षण डेटामधून काढलेले शिकलेले नमुने आणि ज्ञान दर्शवतात. वेट्स जारी केल्याने इतरांना पूर्व-प्रशिक्षित मॉडेल वापरण्याची परवानगी मिळते. हे पूर्णपणे एकत्र केलेले इंजिन प्रदान करण्यासारखे आहे, चालविण्यासाठी तयार.
- प्रशिक्षण डेटा: हा कदाचित सर्वात महत्त्वाचा आणि सर्वात वारंवार अस्पष्ट केलेला घटक आहे. फाउंडेशनल मॉडेल्स प्रचंड डेटासेटवर प्रशिक्षित केले जातात, जे अनेकदा इंटरनेटवरून स्क्रॅप केले जातात किंवा मालकीच्या किंवा खाजगी संग्रहांमधून (जसे की वैद्यकीय नोंदी, ज्यामुळे महत्त्वपूर्ण गोपनीयता चिंता निर्माण होतात) मिळवले जातात. या डेटामधील रचना, क्युरेशन, फिल्टरिंग आणि संभाव्य पूर्वाग्रह मॉडेलची क्षमता, मर्यादा आणि नैतिक वर्तनावर खोलवर परिणाम करतात. प्रशिक्षण डेटाबद्दल तपशीलवार माहितीशिवाय, मॉडेल का असे वागते हे समजून घेणे, किंवा विशिष्ट अनुप्रयोगांसाठी त्याची योग्यता आणि सुरक्षितता तपासणे अत्यंत कठीण होते. हे गुप्त इंधन मिश्रण आणि अचूक परिस्थिती आहे ज्या अंतर्गत इंजिन चालवले गेले.
- प्रशिक्षण कोड आणि प्रक्रिया: यात प्रशिक्षणासाठी वापरलेले विशिष्ट अल्गोरिदम, ऑप्टिमायझेशन तंत्र, निवडलेले हायपरपॅरामीटर्स (शिकण्याच्या प्रक्रियेवर नियंत्रण ठेवणारी सेटिंग्ज), वापरलेली संगणकीय पायाभूत सुविधा आणि वापरलेली महत्त्वपूर्ण ऊर्जा यांचा समावेश होतो. प्रशिक्षण प्रक्रियेतील किरकोळ बदल भिन्न मॉडेल वर्तनांना कारणीभूत ठरू शकतात, ज्यामुळे आर्किटेक्चर आणि डेटा ज्ञात असले तरीही पुनरुत्पादकता आव्हानात्मक बनते. हे इंजिन तयार करण्यासाठी आणि ट्यून करण्यासाठी वापरलेले तपशीलवार अभियांत्रिकी तपशील, साधने आणि फॅक्टरी परिस्थिती दर्शवते.
सध्या ‘ओपन सोर्स’ AI म्हणून विपणन केलेल्या अनेक प्रणाली प्रामुख्याने मॉडेल आर्किटेक्चर आणि पूर्व-प्रशिक्षित वेट्समध्ये प्रवेश देतात. जरी हे वापरकर्त्यांना मॉडेल चालवण्यास आणि कदाचित लहान डेटासेटवर फाइन-ट्यून करण्यास अनुमती देत असले तरी, ते प्रशिक्षण डेटा आणि प्रक्रियेसंदर्भात आवश्यक पारदर्शकता प्रदान करण्यात गंभीरपणे अयशस्वी ठरते. यामुळे मॉडेलच्या मूलभूत गुणधर्मांचा खऱ्या अर्थाने अभ्यास करण्याची किंवा त्याला पुन्हा प्रशिक्षण किंवा त्याचे मूळ समजून घेण्याची आवश्यकता असलेल्या खोल अर्थपूर्ण मार्गांनी सुधारित करण्याची क्षमता गंभीरपणे कमी होते. ओपन-सोर्स व्याख्येसाठी केंद्रीय असलेले अभ्यास आणि सुधारणा करण्याचे स्वातंत्र्य, जेव्हा डेटा आणि प्रशिक्षण पद्धतीचे महत्त्वपूर्ण घटक लपलेले राहतात तेव्हा लक्षणीयरीत्या बाधित होते. मॉडेलची निर्मिती सुरवातीपासून पुन्हा करणे - वैज्ञानिक समज आणि पडताळणीची एक महत्त्वाची चाचणी - अक्षरशः अशक्य होते.
AI मधील ‘ओपनवॉशिंग’चा त्रासदायक ट्रेंड
लेबल आणि वास्तव यांच्यातील या दरीमुळे ‘ओपनवॉशिंग’ म्हणून ओळखल्या जाणाऱ्या प्रथेला जन्म दिला आहे. हा शब्द कंपन्यांनी ‘ओपन सोर्स’ची सकारात्मक प्रतिष्ठा आणि कथित फायद्यांचा विपणन आणि धोरणात्मक फायद्यासाठी वापर करण्याच्या कृतीचे वर्णन करतो, त्याच वेळी तपशीलवार प्रशिक्षण डेटा माहिती किंवा प्रशिक्षणासाठी वापरलेला कोड यांसारख्या महत्त्वपूर्ण घटकांमध्ये प्रवेश रोखून धरतो. ते त्यांच्या प्रणालींना मोकळेपणाच्या भाषेत लपेटतात, परंतु पारदर्शकता आणि समुदाय प्रवेशाच्या मागणीच्या तत्त्वांना पूर्णपणे स्वीकारत नाहीत.
अनेक प्रमुख AI मॉडेल्स, जरी मोठ्या प्रमाणावर वापरले जात असले आणि कधीकधी ‘ओपन’ पदनाम धारण करत असले तरी, Open Source Initiative (OSI) सारख्या संस्थांनी पुरस्कृत केलेल्या ओपन सोर्सच्या व्यापक व्याख्येनुसार मोजले असता कमी पडतात. OSI ने केलेल्या एका विश्लेषणात, जे 2022 पासून AI संदर्भात ओपन सोर्सचा अर्थ स्पष्ट करण्यासाठी परिश्रमपूर्वक काम करत आहे, अनेक लोकप्रिय मॉडेल्सबद्दल चिंता व्यक्त केली:
- Llama 2 & Llama 3.x (Meta): जरी मॉडेल वेट्स आणि आर्किटेक्चर उपलब्ध असले तरी, वापरावरील निर्बंध आणि संपूर्ण प्रशिक्षण डेटासेट आणि प्रक्रियेसंदर्भात अपूर्ण पारदर्शकता पारंपारिक ओपन-सोर्स मूल्यांशी त्यांचे संरेखन मर्यादित करते.
- Grok (X): त्याचप्रमाणे, जरी उपलब्ध केले असले तरी, त्याच्या प्रशिक्षण डेटा आणि पद्धतीबद्दलच्या व्यापक माहितीचा अभाव त्याच्या खऱ्या मोकळेपणाबद्दल प्रश्न निर्माण करतो.
- Phi-2 (Microsoft): अनेकदा ‘ओपन मॉडेल’ म्हणून वर्णन केले जात असले तरी, त्याच्या निर्मिती प्रक्रिया आणि डेटा संदर्भात पूर्ण पारदर्शकता मर्यादित आहे.
- Mixtral (Mistral AI): जरी काही भाग जारी केले असले तरी, अभ्यास आणि सुधारणेसाठी आवश्यक असलेल्या सर्व घटकांमध्ये प्रवेशाच्या मर्यादांमुळे ते ओपन सोर्ससाठी पूर्ण निकष पूर्ण करत नाही.
ही उदाहरणे ओपन-सोर्स तत्त्वांचे अधिक पालन करण्याचा प्रयत्न करणाऱ्या प्रयत्नांच्या विरोधात आहेत:
- OLMo (Allen Institute for AI): एका ना-नफा संशोधन संस्थेने विकसित केलेले, OLMo विशेषतः मोकळेपणा लक्षात घेऊन डिझाइन केले गेले होते, केवळ वेट्सच नव्हे तर प्रशिक्षण कोड आणि वापरलेल्या डेटाबद्दल तपशील देखील जारी केले.
- LLM360’s CrystalCoder: डेटा, प्रशिक्षण प्रक्रिया आणि मूल्यांकन मेट्रिक्ससह मॉडेलच्या जीवनचक्रात संपूर्ण पारदर्शकतेसाठी लक्ष्य ठेवणारा समुदाय-चालित प्रकल्प.
ओपनवॉशिंग का करावे? प्रेरणा बहुआयामी आहेत:
- विपणन आणि समज: ‘ओपन सोर्स’ लेबल महत्त्वपूर्ण सद्भावना आणते. हे सहकार्य, नैतिक पद्धती आणि व्यापक समुदायाप्रती वचनबद्धता सूचित करते, जे वापरकर्ते, विकासक आणि सकारात्मक प्रसिद्धी आकर्षित करू शकते.
- इकोसिस्टम बिल्डिंग: पूर्ण पारदर्शकतेशिवाय मॉडेल वेट्स जारी करणे, विकासकांना AI प्रणालीवर आधारित अनुप्रयोग तयार करण्यास प्रोत्साहित करते, संभाव्यतः एक अवलंबून इकोसिस्टम तयार करते जी मूळ कंपनीला फायदा देते.
- नियामक लवाद (Regulatory Arbitrage): हा एक विशेषतः चिंताजनक चालक आहे. आगामी नियम, जसे की European Union’s AI Act (2024), काही उच्च-जोखीम AI प्रणालींवर कठोर आवश्यकता लादण्याची अपेक्षा आहे. तथापि, ‘विनामूल्य आणि ओपन-सोर्स सॉफ्टवेअर’ साठी सूट किंवा हलकी छाननी अनेकदा प्रस्तावित केली जाते. ‘ओपन सोर्स’ लेबल लागू करून - जरी स्थापित व्याख्यांनुसार चुकीचे असले तरी - कंपन्या या नियमांमध्ये अधिक सहजपणे नेव्हिगेट करण्याची आशा करू शकतात, मालकीच्या, उच्च-जोखीम प्रणालींशी संबंधित संभाव्य महाग अनुपालन ओझे टाळून. हे धोरणात्मक लेबलिंग संभाव्य पळवाट शोधते, सुरक्षितता आणि पारदर्शकता सुनिश्चित करण्याच्या नियमांच्या हेतूवर घाला घालते.
ही प्रथा शेवटी ‘ओपन सोर्स’ या शब्दाचे अवमूल्यन करते आणि गोंधळ निर्माण करते, ज्यामुळे वापरकर्ते, विकासक आणि संशोधकांना हे ओळखणे कठीण होते की कोणती AI प्रणाली खऱ्या अर्थाने लेबल सूचित करणारी पारदर्शकता आणि स्वातंत्र्य देते.
विज्ञानासाठी खऱ्या मोकळेपणाचे तातडीचे महत्त्व
वैज्ञानिक समुदायासाठी, या चर्चेतील धोका अत्यंत जास्त आहे. विज्ञान पारदर्शकता, पुनरुत्पादकता आणि स्वतंत्र पडताळणीच्या क्षमतेवर भरभराट करते. जीनोमिक डेटाचे विश्लेषण करणे आणि हवामान बदलाचे मॉडेलिंग करणे ते नवीन सामग्री शोधणे आणि जटिल जैविक प्रणाली समजून घेणे यासारख्या संशोधनात AI चे वाढते एकत्रीकरण, या AI साधनांचे स्वरूप गंभीरपणे महत्त्वाचे बनवते. ‘ब्लॅक बॉक्स’ AI प्रणालींवर अवलंबून राहणे, किंवा खरी पारदर्शकता प्रदान न करता मोकळेपणाचा आव आणणाऱ्या प्रणालींवर अवलंबून राहणे, गंभीर धोके निर्माण करते:
- अशक्त पुनरुत्पादकता: जर संशोधकांना अभ्यासात वापरलेल्या AI मॉडेलमागील प्रशिक्षण डेटा आणि पद्धतीमध्ये प्रवेश करता येत नसेल किंवा ते समजू शकत नसेल, तर परिणामांची प्रतिकृती करणे अशक्य होते. हे मूलतः वैज्ञानिक पद्धतीच्या मुख्य स्तंभाला कमजोर करते. जर निष्कर्ष स्वतंत्रपणे सत्यापित केले जाऊ शकत नसतील तर त्यावर विश्वास कसा ठेवता येईल किंवा त्यावर आधारित प्रगती कशी करता येईल?
- लपलेले पूर्वाग्रह आणि मर्यादा: सर्व AI मॉडेल्स त्यांच्या प्रशिक्षण डेटा आणि डिझाइन निवडींमधून पूर्वाग्रह वारशाने घेतात. पारदर्शकतेशिवाय, संशोधक या पूर्वाग्रहांचे पुरेसे मूल्यांकन करू शकत नाहीत किंवा मॉडेलच्या मर्यादा समजू शकत नाहीत. नकळतपणे पक्षपाती मॉडेल वापरल्याने चुकीचे परिणाम, सदोष निष्कर्ष आणि संभाव्यतः हानिकारक वास्तविक-जगातील परिणाम होऊ शकतात, विशेषतः वैद्यकीय संशोधन किंवा सामाजिक विज्ञान यांसारख्या संवेदनशील क्षेत्रांमध्ये.
- छाननीचा अभाव: अपारदर्शक मॉडेल्स कठोर समवयस्क पुनरावलोकनापासून बचावतात. वैज्ञानिक समुदाय मॉडेलच्या अंतर्गत कार्याची पूर्णपणे चौकशी करू शकत नाही, त्याच्या तर्कातील संभाव्य त्रुटी ओळखू शकत नाही किंवा त्याच्या अंदाजांशी संबंधित अनिश्चितता समजू शकत नाही. हे वैज्ञानिक चौकशीच्या स्व-सुધારक स्वरूपाला अडथळा आणते.
- कॉर्पोरेट प्रणालींवर अवलंबित्व: कॉर्पोरेशन्सद्वारे नियंत्रित बंद किंवा अर्ध-बंद AI प्रणालींवर अवलंबून राहिल्याने अवलंबित्व निर्माण होते. उपलब्ध कॉर्पोरेट साधनांच्या क्षमता आणि मर्यादांमुळे संशोधन अजेंडा सूक्ष्मपणे प्रभावित होऊ शकतो आणि प्रवेश प्रतिबंधित केला जाऊ शकतो किंवा महाग होऊ शकतो, संभाव्यतः स्वतंत्र संशोधन दिशांना दडपून टाकू शकतो आणि चांगल्या-अनुदानित संस्था आणि इतरांमधील दरी वाढवू शकतो.
- नवकल्पना दडपणे: खरा ओपन सोर्स संशोधकांना केवळ साधने वापरण्याचीच नव्हे तर त्यांचे विच्छेदन, सुधारणा, सुधारणा आणि पुनरुद्देश करण्याची परवानगी देतो. जर AI मॉडेल्सचे मुख्य घटक दुर्गम राहिले, तर नवकल्पनेचा हा महत्त्वपूर्ण मार्ग अवरोधित होतो. शास्त्रज्ञांना नवीन प्रशिक्षण तंत्रांसह प्रयोग करण्यापासून, भिन्न डेटा संयोजनांचे अन्वेषण करण्यापासून किंवा मूळ विकासकांनी अपेक्षित नसलेल्या विशिष्ट, सूक्ष्म संशोधन प्रश्नांसाठी मॉडेल्स स्वीकारण्यापासून प्रतिबंधित केले जाते.
वैज्ञानिक समुदाय ‘ओपन सोर्स’ या शब्दाची घट निष्क्रियपणे स्वीकारू शकत नाही. त्याने सक्रियपणे स्पष्टतेसाठी वकिली केली पाहिजे आणि AI विकासकांकडून, विशेषतः जेव्हा ही साधने संशोधन संदर्भात वापरली जातात तेव्हा, खऱ्या पारदर्शकतेची मागणी केली पाहिजे. यात समाविष्ट आहे:
- स्पष्ट मानकांना प्रोत्साहन देणे: OSI सारख्या प्रयत्नांना समर्थन देणे, जे ‘ओपन-सोर्स AI’ म्हणजे काय यासाठी स्पष्ट, कठोर व्याख्या स्थापित करतात, अशा व्याख्या ज्या आर्किटेक्चर, वेट्स, प्रशिक्षण डेटा आणि प्रशिक्षण प्रक्रियेसंदर्भात पारदर्शकता समाविष्ट करतात.
- सत्यापित साधनांना प्राधान्य देणे: पारदर्शकतेच्या या उच्च मानकांची पूर्तता करणाऱ्या AI मॉडेल्स आणि प्लॅटफॉर्मच्या वापरास प्राधान्य देणे, जरी ते सुरुवातीला कमी कार्यक्षम असले किंवा सहज उपलब्ध अपारदर्शक पर्यायांपेक्षा अधिक प्रयत्नांची आवश्यकता असली तरीही.
- पारदर्शकतेची मागणी करणे: AI चा समावेश असलेल्या प्रकाशनांमध्ये वापरलेल्या मॉडेल्सबद्दल तपशीलवार खुलासे समाविष्ट करण्याचा आग्रह धरणे, ज्यात प्रशिक्षण डेटा स्रोत, प्रक्रिया आणि संभाव्य पूर्वाग्रहांबद्दल व्यापक माहिती, तसेच प्रशिक्षण पद्धतींचा समावेश आहे.
- खऱ्या अर्थाने खुल्या प्रकल्पांना समर्थन देणे: AI विकासात खऱ्या मोकळेपणासाठी वचनबद्ध असलेल्या संस्थांकडून समुदाय-चालित प्रकल्प आणि उपक्रमांमध्ये योगदान देणे आणि त्यांचा वापर करणे.
Homebrew Computer Club ची भावना - सामायिक ज्ञान आणि सहयोगी निर्मितीची - AI युगाच्या गुंतागुंतीतून जबाबदारीने मार्गक्रमण करण्यासाठी आवश्यक आहे. कृत्रिम बुद्धिमत्तेसाठी ‘ओपन सोर्स’चा खरा अर्थ पुन्हा मिळवणे आणि त्याचे रक्षण करणे हे केवळ शब्दांच्या शुद्धतेबद्दल नाही; हे वाढत्या AI-चालित जगात विज्ञानाची अखंडता, पुनरुत्पादकता आणि सतत प्रगतीचे संरक्षण करण्याबद्दल आहे. पुढील मार्गासाठी दक्षता आणि AI ची शक्तिशाली साधने खुल्या चौकशीच्या तत्त्वांनुसार विकसित आणि तैनात केली जातील याची खात्री करण्यासाठी सामूहिक वचनबद्धतेची आवश्यकता आहे, ज्या तत्त्वांनी शतकानुशतके विज्ञानाची चांगली सेवा केली आहे.