தொழில்நுட்ப உலகில் ‘திறந்த மூலம்’ (open source) என்ற சொல் ஒரு சக்திவாய்ந்த தாக்கத்தை ஏற்படுத்துகிறது. இது கூட்டு கண்டுபிடிப்பு, பகிரப்பட்ட அறிவு மற்றும் வெளிப்படைத்தன்மையில் ஒரு அடிப்படை நம்பிக்கை ஆகியவற்றின் பிம்பங்களை எழுப்புகிறது. இந்த உணர்வு அரை நூற்றாண்டுக்கு முன்பு கலிபோர்னியாவின் Menlo Park-ல் Homebrew Computer Club உருவானபோது தெளிவாக வெளிப்பட்டது. இந்த ஆர்வலர்கள் மற்றும் கண்டுபிடிப்பாளர்களின் குழு இயந்திரங்களை மட்டும் உருவாக்கவில்லை; அவர்கள் கருத்துக்களையும் மென்பொருளையும் சுதந்திரமாகப் பரிமாறிக்கொள்ளும் ஒரு கலாச்சாரத்தை உருவாக்கினர், இது கணினியியலில் புரட்சியை ஏற்படுத்திய திறந்த மூல இயக்கத்திற்கான அடித்தளக் கற்களை அமைத்தது. ஆயினும், இன்று, இந்த கடினமாக வென்ற மரபு மற்றும் திறந்த தன்மையின் வரையறையே ஒரு நுட்பமான ஆனால் குறிப்பிடத்தக்க சவாலை எதிர்கொள்கிறது, குறிப்பாக செயற்கை நுண்ணறிவின் (AI) வேகமாக விரிவடையும் களத்தில். அதிநவீன AI மாதிரிகளை உருவாக்கும் பல நிறுவனங்கள் தங்கள் படைப்புகளை ‘திறந்த மூலம்’ என்று ஆர்வத்துடன் முத்திரை குத்துகின்றன, ஆனால் ஒரு நெருக்கமான பார்வை இந்த லேபிள் பெரும்பாலும் மேலோட்டமாகப் பயன்படுத்தப்படுவதை வெளிப்படுத்துகிறது, இது இயக்கத்தின் முக்கிய கொள்கைகளுக்குக் குறைவான யதார்த்தத்தை மறைக்கிறது. இந்த அர்த்தத்தின் நீர்த்துப்போதல் வெறும் சொற்பொருள் சார்ந்த விவாதம் அல்ல; இது வெளிப்படைத்தன்மை மற்றும் மறுஉருவாக்கம் ஆகியவற்றின் கொள்கைகளுக்கு உண்மையான அச்சுறுத்தலை ஏற்படுத்துகிறது, குறிப்பாக அறிவியல் சமூகத்திற்குள் இது மிக முக்கியமானது.
உண்மையான திறந்த ஒத்துழைப்பின் உணர்வைப் புரிந்துகொள்வது
தற்போதைய இக்கட்டான நிலையைப் புரிந்துகொள்ள, ஒருவர் முதலில் ‘திறந்த மூலம்’ உண்மையில் எதைக் குறிக்கிறது என்பதைப் பாராட்ட வேண்டும். இது வெறும் இலவச மென்பொருளை விட மேலானது; இது கூட்டு முன்னேற்றம் மற்றும் சரிபார்க்கக்கூடிய நம்பிக்கையில் வேரூன்றிய ஒரு தத்துவம். இந்த தத்துவத்தின் அடித்தளம் நான்கு அத்தியாவசிய சுதந்திரங்களில் தங்கியுள்ளது:
- எந்த நோக்கத்திற்காகவும் நிரலை இயக்கும் சுதந்திரம்.
- நிரல் எவ்வாறு செயல்படுகிறது என்பதைப் படிக்கும் சுதந்திரம் மற்றும் அதை மாற்றுவதன் மூலம் உங்கள் கணினி தேவைகளை பூர்த்தி செய்தல். மூலக் குறியீட்டிற்கான அணுகல் இதற்கு ஒரு முன்நிபந்தனையாகும்.
- நகல்களை மறுவிநியோகம் செய்யும் சுதந்திரம் அதனால் நீங்கள் மற்றவர்களுக்கு உதவ முடியும்.
- உங்கள் மாற்றியமைக்கப்பட்ட பதிப்புகளின் நகல்களை மற்றவர்களுக்கு விநியோகிக்கும் சுதந்திரம். இதைச் செய்வதன் மூலம் உங்கள் மாற்றங்களிலிருந்து முழு சமூகமும் பயனடைய ஒரு வாய்ப்பை வழங்க முடியும். மூலக் குறியீட்டிற்கான அணுகல் இதற்கு ஒரு முன்நிபந்தனையாகும்.
இந்த சுதந்திரங்கள், பொதுவாக GNU General Public License (GPL), MIT License, அல்லது Apache License போன்ற உரிமங்களில் பொறிக்கப்பட்டுள்ளன, வரலாற்று ரீதியாக மூலக் குறியீட்டை (source code) மையமாகக் கொண்டுள்ளன. மூலக் குறியீடு – புரோகிராமர்களால் எழுதப்பட்ட மனிதனால் படிக்கக்கூடிய வழிமுறைகள் – பாரம்பரிய மென்பொருளின் வரைபடமாகும். இந்தக் குறியீட்டைத் திறந்த நிலையில் கிடைக்கச் செய்வது, எவரும் அதை ஆய்வு செய்யவும், அதன் தர்க்கத்தைப் புரிந்துகொள்ளவும், சாத்தியமான குறைபாடுகளைக் கண்டறியவும், புதிய தேவைகளுக்கு ஏற்ப மாற்றியமைக்கவும், அந்த மேம்பாடுகளைப் பகிரவும் அனுமதிக்கிறது.
இந்த மாதிரி கண்டுபிடிப்பு மற்றும் அறிவியல் முன்னேற்றத்திற்கு ஒரு அசாதாரண ஊக்கியாக இருந்துள்ளது. உலகெங்கிலும் உள்ள ஆராய்ச்சியாளர்களுக்கு உடனடியாகக் கிடைக்கும் கருவிகளின் தாக்கத்தைக் கவனியுங்கள்:
- புள்ளியியல் பகுப்பாய்வு: R Studio போன்ற மென்பொருள் புள்ளியியல் கணினி மற்றும் கிராபிக்ஸ் ஆகியவற்றிற்கு ஒரு சக்திவாய்ந்த, வெளிப்படையான மற்றும் விரிவாக்கக்கூடிய சூழலை வழங்குகிறது, இது எண்ணற்ற அறிவியல் துறைகளில் தரவு பகுப்பாய்வின் ஒரு மூலக்கல்லாக மாறியுள்ளது. அதன் திறந்த தன்மை முறைகளின் சக மதிப்பாய்வு மற்றும் சிறப்பு தொகுப்புகளின் வளர்ச்சிக்கு அனுமதிக்கிறது.
- கணினி திரவ இயக்கவியல்: OpenFOAM திரவ ஓட்டங்களை உருவகப்படுத்துவதற்கான ஒரு அதிநவீன நூலகத்தை வழங்குகிறது, இது விண்வெளி பொறியியல் முதல் சுற்றுச்சூழல் அறிவியல் வரையிலான துறைகளில் முக்கியமானது. அதன் திறந்த தன்மை சிக்கலான உருவகப்படுத்துதல்களின் தனிப்பயனாக்கம் மற்றும் சரிபார்ப்பை செயல்படுத்துகிறது.
- இயக்க முறைமைகள்: Linux மற்றும் பிற திறந்த மூல இயக்க முறைமைகள் உலகின் கணினி உள்கட்டமைப்பின் பெரும்பகுதிக்கு முதுகெலும்பாக அமைகின்றன, இதில் அறிவியல் உயர் செயல்திறன் கணினி தொகுப்புகள் அடங்கும், அவற்றின் நிலைத்தன்மை, நெகிழ்வுத்தன்மை மற்றும் வெளிப்படைத்தன்மைக்காக மதிக்கப்படுகின்றன.
நன்மைகள் வெறும் செலவு சேமிப்பிற்கு அப்பாற்பட்டவை. திறந்த மூலம் மறுஉருவாக்கத்தை (reproducibility) வளர்க்கிறது, இது அறிவியல் முறையின் ஒரு மூலக்கல்லாகும். ஆராய்ச்சியில் பயன்படுத்தப்படும் கருவிகள் மற்றும் குறியீடு திறந்திருக்கும்போது, மற்ற விஞ்ஞானிகள் சோதனைகளை மீண்டும் செய்யவும், கண்டுபிடிப்புகளை சரிபார்க்கவும், நம்பிக்கையுடன் வேலையை உருவாக்கவும் முடியும். இது உலகளாவிய ஒத்துழைப்பை ஊக்குவிக்கிறது, தடைகளை உடைத்து, பல்வேறு பின்னணிகள் மற்றும் நிறுவனங்களைச் சேர்ந்த ஆராய்ச்சியாளர்கள் பகிரப்பட்ட சவால்களுக்கு பங்களிக்க அனுமதிக்கிறது. இது நீண்ட ஆயுளையும் விற்பனையாளர் பூட்டப்படுவதையும் தவிர்க்கிறது (vendor lock-in), தனியுரிம மென்பொருள் நிறுவனங்களின் விருப்பங்களிலிருந்து ஆராய்ச்சி முதலீடுகளைப் பாதுகாக்கிறது. புதிய யோசனைகள் மற்றும் நுட்பங்களின் விரைவான பரவல் மற்றும் மறு செய்கையை அனுமதிப்பதன் மூலம் இது கண்டுபிடிப்பை துரிதப்படுத்துகிறது. திறந்த மூல நெறிமுறை அடிப்படையில் வெளிப்படைத்தன்மை, ஆய்வு மற்றும் பகிரப்பட்ட முன்னேற்றம் மூலம் அறிவைத் தேடும் அறிவியல் நோக்கத்துடன் ஒத்துப்போகிறது.
செயற்கை நுண்ணறிவு: முற்றிலும் வேறுபட்ட ஒரு மிருகம்
மூலக் குறியீட்டின் அணுகலைச் சுற்றிப் பாதுகாப்பாகக் கட்டமைக்கப்பட்ட நிறுவப்பட்ட திறந்த மூல முன்னுதாரணம், செயற்கை நுண்ணறிவுத் துறைக்கு, குறிப்பாக அடிப்படை பெரிய மொழி மாதிரிகள் (LLMs) போன்ற பெரிய அளவிலான மாதிரிகளுக்குப் பயன்படுத்தும்போது குறிப்பிடத்தக்க கொந்தளிப்பை எதிர்கொள்கிறது. இந்த AI அமைப்புகள் நிச்சயமாக குறியீட்டை உள்ளடக்கியிருந்தாலும், அவற்றின் செயல்பாடு மற்றும் நடத்தை மிகவும் சிக்கலான மற்றும் பெரும்பாலும் ஒளிபுகா கூறுகளால் வடிவமைக்கப்படுகின்றன. ஒரு நரம்பியல் வலையமைப்பிற்கான கட்டடக்கலைக் குறியீட்டை வெளியிடுவது, பாரம்பரிய மென்பொருளுக்குச் செய்வது போல உண்மையான திறந்த தன்மைக்குச் சமமாகாது.
ஒரு AI மாதிரி, குறிப்பாக ஒரு ஆழ் கற்றல் மாதிரி, பொதுவாக பல முக்கிய கூறுகளால் ஆனது:
- மாதிரி கட்டமைப்பு (Model Architecture): இது நரம்பியல் வலையமைப்பின் கட்டமைப்பு வடிவமைப்பு – அடுக்குகளின், நியூரான்களின் மற்றும் இணைப்புகளின் ஏற்பாடு. நிறுவனங்கள் பெரும்பாலும் இந்தத் தகவலை வெளியிடுகின்றன, அதைத் திறந்த தன்மைக்கான சான்றாக முன்வைக்கின்றன. இது ஒரு இயந்திரத்தின் வரைபடத்தைப் பகிர்வதைப் போன்றது.
- மாதிரி எடைகள் (Parameters): இவை வலையமைப்பிற்குள் உள்ள எண் மதிப்புகள், பெரும்பாலும் பில்லியன்களில், பயிற்சி செயல்முறையின் போது சரிசெய்யப்பட்டவை. அவை பயிற்சித் தரவிலிருந்து பிரித்தெடுக்கப்பட்ட கற்றறிந்த வடிவங்களையும் அறிவையும் குறிக்கின்றன. எடைகளை வெளியிடுவது மற்றவர்கள் முன் பயிற்சி பெற்ற மாதிரியைப் பயன்படுத்த அனுமதிக்கிறது. இது முழுமையாக அசெம்பிள் செய்யப்பட்ட, இயக்கத் தயாராக உள்ள இயந்திரத்தை வழங்குவதைப் போன்றது.
- பயிற்சித் தரவு (Training Data): இது ஒருவேளை மிக முக்கியமான மற்றும் அடிக்கடி மறைக்கப்படும் கூறு ஆகும். அடிப்படை மாதிரிகள் பிரம்மாண்டமான தரவுத்தொகுப்புகளில் பயிற்சி அளிக்கப்படுகின்றன, அவை பெரும்பாலும் இணையத்திலிருந்து எடுக்கப்பட்டவை அல்லது தனியுரிம அல்லது தனிப்பட்ட சேகரிப்புகளிலிருந்து (மருத்துவ பதிவுகள் போன்றவை, குறிப்பிடத்தக்க தனியுரிமை கவலைகளை எழுப்புகின்றன) பெறப்பட்டவை. இந்தத் தரவின் கலவை, க்யூரேஷன், வடிகட்டுதல் மற்றும் சாத்தியமான சார்புகள் மாதிரியின் திறன்கள், வரம்புகள் மற்றும் நெறிமுறை நடத்தை ஆகியவற்றை ஆழமாகப் பாதிக்கின்றன. பயிற்சித் தரவு பற்றிய விரிவான தகவல்கள் இல்லாமல், ஒரு மாதிரி ஏன் அது போல் செயல்படுகிறது என்பதைப் புரிந்துகொள்வது, அல்லது குறிப்பிட்ட பயன்பாடுகளுக்கான அதன் பொருத்தம் மற்றும் பாதுகாப்பை மதிப்பிடுவது நம்பமுடியாத அளவிற்கு கடினமாகிறது. இது இரகசிய எரிபொருள் கலவை மற்றும் இயந்திரம் இயக்கப்பட்ட துல்லியமான நிலைமைகள் ஆகும்.
- பயிற்சிக் குறியீடு மற்றும் செயல்முறை (Training Code and Process): இதில் பயிற்சிக்காகப் பயன்படுத்தப்படும் குறிப்பிட்ட வழிமுறைகள், தேர்வுமுறை நுட்பங்கள், தேர்ந்தெடுக்கப்பட்ட ஹைப்பர்பராமீட்டர்கள் (கற்றல் செயல்முறையைக் கட்டுப்படுத்தும் அமைப்புகள்), பயன்படுத்தப்பட்ட கணினி உள்கட்டமைப்பு மற்றும் நுகரப்படும் குறிப்பிடத்தக்க ஆற்றல் ஆகியவை அடங்கும். பயிற்சி செயல்முறையில் சிறிய வேறுபாடுகள் வெவ்வேறு மாதிரி நடத்தைகளுக்கு வழிவகுக்கும், கட்டமைப்பு மற்றும் தரவு அறியப்பட்டாலும் கூட மறுஉருவாக்கம் சவாலானது. இது இயந்திரத்தை உருவாக்க மற்றும் சரிசெய்யப் பயன்படுத்தப்படும் விரிவான பொறியியல் விவரக்குறிப்புகள், கருவிகள் மற்றும் தொழிற்சாலை நிலைமைகளைக் குறிக்கிறது.
தற்போது ‘திறந்த மூலம்’ AI என சந்தைப்படுத்தப்படும் பல அமைப்புகள் முதன்மையாக மாதிரி கட்டமைப்பு மற்றும் முன் பயிற்சி பெற்ற எடைகளுக்கான அணுகலை வழங்குகின்றன. இது பயனர்கள் மாதிரியை இயக்கவும், ஒருவேளை சிறிய தரவுத்தொகுப்புகளில் அதைச் சரிசெய்யவும் அனுமதிக்கும் அதே வேளையில், பயிற்சித் தரவு மற்றும் செயல்முறை தொடர்பான தேவையான வெளிப்படைத்தன்மையை வழங்குவதில் இது கடுமையாகத் தவறுகிறது. இது மாதிரியின் அடிப்படைப் பண்புகளை உண்மையாகப் படிக்க அல்லது அதன் தோற்றத்தைப் புரிந்துகொள்ள அல்லது மறுபயிற்சி தேவைப்படும் ஆழமான அர்த்தமுள்ள வழிகளில் அதை மாற்ற திறனைக் கடுமையாகக் குறைக்கிறது. திறந்த மூல வரையறைக்கு மையமான படிப்பதற்கும் மாற்றுவதற்கும் உள்ள சுதந்திரங்கள், தரவு மற்றும் பயிற்சி முறையின் முக்கியமான கூறுகள் மறைந்திருக்கும்போது கணிசமாகத் தடுக்கப்படுகின்றன. மாதிரியின் உருவாக்கத்தை புதிதாக மீண்டும் உருவாக்குவது – அறிவியல் புரிதல் மற்றும் சரிபார்ப்பின் ஒரு முக்கிய சோதனை – கிட்டத்தட்ட சாத்தியமற்றதாகிறது.
AI-ல் ‘Openwashing’-ன் கவலைக்குரிய போக்கு
லேபிளுக்கும் யதார்த்தத்திற்கும் இடையிலான இந்த இடைவெளி ‘openwashing’ எனப்படும் ஒரு நடைமுறைக்கு வழிவகுத்துள்ளது. இந்த சொல், நிறுவனங்கள் ‘திறந்த மூலத்தின்’ நேர்மறையான நற்பெயர் மற்றும் உணரப்பட்ட நன்மைகளை சந்தைப்படுத்தல் மற்றும் மூலோபாய நன்மைக்காகப் பயன்படுத்தும் செயலை விவரிக்கிறது, அதே நேரத்தில் விரிவான பயிற்சித் தரவுத் தகவல் அல்லது பயிற்சிக்காகப் பயன்படுத்தப்படும் குறியீடு போன்ற முக்கியமான கூறுகளுக்கான அணுகலைத் தடுக்கிறது. அவர்கள் தங்கள் அமைப்புகளைத் திறந்த மொழியில் மறைக்கிறார்கள், அதன் வெளிப்படைத்தன்மை மற்றும் சமூக அணுகலின் கோரும் கொள்கைகளை முழுமையாக ஏற்றுக்கொள்ளாமல்.
பல முக்கிய AI மாதிரிகள், பரவலாகப் பயன்படுத்தப்பட்டாலும் மற்றும் சில சமயங்களில் ‘திறந்த’ குறியீட்டைக் கொண்டிருந்தாலும், Open Source Initiative (OSI) போன்ற அமைப்புகளால் ஆதரிக்கப்படும் திறந்த மூலத்தின் விரிவான வரையறைக்குஎதிராக அளவிடப்படும்போது குறைகின்றன. OSI-ன் ஒரு பகுப்பாய்வு, 2022 முதல் AI சூழலில் திறந்த மூலத்தின் அர்த்தத்தைத் தெளிவுபடுத்த விடாமுயற்சியுடன் செயல்பட்டு வருகிறது, இது பல பிரபலமான மாதிரிகளுடன் கவலைகளை எடுத்துக்காட்டியது:
- Llama 2 & Llama 3.x (Meta): மாதிரி எடைகள் மற்றும் கட்டமைப்பு கிடைத்தாலும், பயன்பாட்டின் மீதான கட்டுப்பாடுகள் மற்றும் முழு பயிற்சித் தரவுத்தொகுப்பு மற்றும் செயல்முறை தொடர்பான முழுமையற்ற வெளிப்படைத்தன்மை ஆகியவை பாரம்பரிய திறந்த மூல மதிப்புகளுடன் அவற்றின் சீரமைப்பைக் கட்டுப்படுத்துகின்றன.
- Grok (X): இதேபோல், கிடைக்கப்பெற்றாலும், அதன் பயிற்சித் தரவு மற்றும் முறை பற்றிய விரிவான தகவல்களின் பற்றாக்குறை அதன் உண்மையான திறந்த தன்மை குறித்து கேள்விகளை எழுப்புகிறது.
- Phi-2 (Microsoft): பெரும்பாலும் ‘திறந்த மாதிரி’ என்று விவரிக்கப்பட்டாலும், அதன் உருவாக்க செயல்முறை மற்றும் தரவு தொடர்பான முழு வெளிப்படைத்தன்மை குறைவாகவே உள்ளது.
- Mixtral (Mistral AI): பாகங்கள் வெளியிடப்பட்டாலும், ஆய்வு மற்றும் மாற்றத்திற்கான அனைத்து தேவையான கூறுகளுக்கான அணுகலில் உள்ள வரம்புகள் காரணமாக இது திறந்த மூலத்திற்கான முழு அளவுகோல்களை பூர்த்தி செய்யவில்லை.
இந்த எடுத்துக்காட்டுகள் திறந்த மூலக் கொள்கைகளுக்கு அதிக இணக்கத்திற்காக பாடுபடும் முயற்சிகளுக்கு மாறாக நிற்கின்றன:
- OLMo (Allen Institute for AI): ஒரு இலாப நோக்கற்ற ஆராய்ச்சி நிறுவனத்தால் உருவாக்கப்பட்டது, OLMo வெளிப்படையாக திறந்த தன்மையை மனதில் கொண்டு வடிவமைக்கப்பட்டது, எடைகளை மட்டுமல்ல, பயிற்சி குறியீடு மற்றும் பயன்படுத்தப்பட்ட தரவு பற்றிய விவரங்களையும் வெளியிட்டது.
- LLM360’s CrystalCoder: தரவு, பயிற்சி நடைமுறைகள் மற்றும் மதிப்பீட்டு அளவீடுகள் உட்பட மாதிரியின் வாழ்க்கைச் சுழற்சி முழுவதும் முழு வெளிப்படைத்தன்மையை நோக்கமாகக் கொண்ட ஒரு சமூகத்தால் இயக்கப்படும் திட்டம்.
ஏன் openwashing-ல் ஈடுபட வேண்டும்? உந்துதல்கள் பன்முகத்தன்மை கொண்டவை:
- சந்தைப்படுத்தல் மற்றும் கருத்து: ‘திறந்த மூலம்’ லேபிள் குறிப்பிடத்தக்க நல்லெண்ணத்தைக் கொண்டுள்ளது. இது ஒத்துழைப்பு, நெறிமுறை நடைமுறைகள் மற்றும் பரந்த சமூகத்திற்கான அர்ப்பணிப்பு ஆகியவற்றைக் குறிக்கிறது, இது பயனர்கள், டெவலப்பர்கள் மற்றும் நேர்மறையான பத்திரிகைகளை ஈர்க்கும்.
- சுற்றுச்சூழல் அமைப்பு உருவாக்கம்: முழு வெளிப்படைத்தன்மை இல்லாவிட்டாலும், மாதிரி எடைகளை வெளியிடுவது, டெவலப்பர்களை AI அமைப்பின் மேல் பயன்பாடுகளை உருவாக்க ஊக்குவிக்கிறது, இது தோற்றுவிக்கும் நிறுவனத்திற்கு பயனளிக்கும் ஒரு சார்பு சுற்றுச்சூழல் அமைப்பை உருவாக்கக்கூடும்.
- ஒழுங்குமுறை நடுவர்: இது குறிப்பாக கவலைக்குரிய ஒரு இயக்கி. ஐரோப்பிய ஒன்றியத்தின் AI சட்டம் (2024) (European Union’s AI Act (2024)) போன்ற வரவிருக்கும் விதிமுறைகள், சில உயர்-ஆபத்து AI அமைப்புகளில் கடுமையான தேவைகளை விதிக்கும் என்று எதிர்பார்க்கப்படுகிறது. இருப்பினும், ‘இலவச மற்றும் திறந்த மூல மென்பொருளுக்கு’ விலக்குகள் அல்லது இலகுவான ஆய்வு பெரும்பாலும் முன்மொழியப்படுகிறது. ‘திறந்த மூலம்’ லேபிளைப் பயன்படுத்துவதன் மூலம் – நிறுவப்பட்ட வரையறைகளின்படி தவறாக இருந்தாலும் – நிறுவனங்கள் இந்த விதிமுறைகளை எளிதாக வழிநடத்த நம்பலாம், தனியுரிம, உயர்-ஆபத்து அமைப்புகளுடன் தொடர்புடைய சாத்தியமான விலையுயர்ந்த இணக்க சுமைகளைத் தவிர்க்கலாம். இந்த மூலோபாய லேபிளிங் ஒரு சாத்தியமான ஓட்டையைச் சுரண்டுகிறது, பாதுகாப்பு மற்றும் வெளிப்படைத்தன்மையை உறுதி செய்வதற்கான ஒழுங்குமுறையின் நோக்கத்தை குறைமதிப்பிற்கு உட்படுத்துகிறது.
இந்த நடைமுறை இறுதியில் ‘திறந்த மூலம்’ என்ற சொல்லை மதிப்பிழக்கச் செய்கிறது மற்றும் குழப்பத்தை உருவாக்குகிறது, பயனர்கள், டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்கள் எந்த AI அமைப்புகள் லேபிள் குறிக்கும் வெளிப்படைத்தன்மை மற்றும் சுதந்திரங்களை உண்மையாக வழங்குகின்றன என்பதைப் புரிந்துகொள்வதை கடினமாக்குகிறது.
அறிவியலுக்கு உண்மையான திறந்த தன்மை ஏன் அவசரமாக முக்கியமானது
அறிவியல் சமூகத்திற்கு, இந்த விவாதத்தில் உள்ள பங்குகள் விதிவிலக்காக உயர்ந்தவை. அறிவியல் வெளிப்படைத்தன்மை, மறுஉருவாக்கம் மற்றும் சுயாதீன சரிபார்ப்புக்கான திறன் ஆகியவற்றில் செழித்து வளர்கிறது. மரபணுத் தரவைப் பகுப்பாய்வு செய்தல் மற்றும் காலநிலை மாற்றத்தை மாதிரியாக்குதல் முதல் புதிய பொருட்களைக் கண்டுபிடிப்பது மற்றும் சிக்கலான உயிரியல் அமைப்புகளைப் புரிந்துகொள்வது வரை – ஆராய்ச்சியில் AI-ன் அதிகரித்து வரும் ஒருங்கிணைப்பு – இந்த AI கருவிகளின் தன்மையை மிக முக்கியமானதாக ஆக்குகிறது. ‘கருப்பு பெட்டி’ (black box) AI அமைப்புகளை நம்பியிருப்பது, அல்லது உண்மையான வெளிப்படைத்தன்மையை வழங்காமல் திறந்ததாகக் காட்டிக்கொள்பவை, ஆழமான அபாயங்களை அறிமுகப்படுத்துகின்றன:
- குறைபாடுள்ள மறுஉருவாக்கம்: ஒரு ஆய்வில் பயன்படுத்தப்படும் AI மாதிரியின் பின்னணியில் உள்ள பயிற்சித் தரவு மற்றும் முறையை ஆராய்ச்சியாளர்கள் அணுகவோ அல்லது புரிந்து கொள்ளவோ முடியாவிட்டால், முடிவுகளை மீண்டும் உருவாக்குவது சாத்தியமற்றதாகிறது. இது அடிப்படையில் அறிவியல் முறையின் ஒரு முக்கிய தூணைக் குறைமதிப்பிற்கு உட்படுத்துகிறது. கண்டுபிடிப்புகள் சுயாதீனமாக சரிபார்க்கப்பட முடியாவிட்டால் அவற்றை எப்படி நம்புவது அல்லது அவற்றின் மீது கட்டமைப்பது?
- மறைக்கப்பட்ட சார்புகள் மற்றும் வரம்புகள்: அனைத்து AI மாதிரிகளும் அவற்றின் பயிற்சித் தரவு மற்றும் வடிவமைப்புத் தேர்வுகளிலிருந்து சார்புகளைப் பெறுகின்றன. வெளிப்படைத்தன்மை இல்லாமல், ஆராய்ச்சியாளர்கள் இந்த சார்புகளைப் போதுமான அளவு மதிப்பிடவோ அல்லது மாதிரியின் வரம்புகளைப் புரிந்து கொள்ளவோ முடியாது. ஒரு சார்புடைய மாதிரியை அறியாமல் பயன்படுத்துவது, குறிப்பாக மருத்துவ ஆராய்ச்சி அல்லது சமூக அறிவியல் போன்ற முக்கியமான பகுதிகளில், சிதைந்த முடிவுகள், குறைபாடுள்ள முடிவுகள் மற்றும் தீங்கு விளைவிக்கும் நிஜ உலக விளைவுகளுக்கு வழிவகுக்கும்.
- ஆய்வு இல்லாமை: ஒளிபுகா மாதிரிகள் கடுமையான சக மதிப்பாய்வைத் தவிர்க்கின்றன. அறிவியல் சமூகம் மாதிரியின் உள் செயல்பாடுகளை முழுமையாக விசாரிக்கவோ, அதன் தர்க்கத்தில் சாத்தியமான பிழைகளைக் கண்டறியவோ, அல்லது அதன் கணிப்புகளுடன் தொடர்புடைய நிச்சயமற்ற தன்மைகளைப் புரிந்து கொள்ளவோ முடியாது. இது அறிவியல் விசாரணையின் சுய-சரிசெய்தல் தன்மையைத் தடுக்கிறது.
- கார்ப்பரேட் அமைப்புகளைச் சார்ந்திருத்தல்: பெருநிறுவனங்களால் கட்டுப்படுத்தப்படும் மூடிய அல்லது அரை-மூடிய AI அமைப்புகளை நம்பியிருப்பது சார்புகளை உருவாக்குகிறது. கிடைக்கக்கூடிய கார்ப்பரேட் கருவிகளின் திறன்கள் மற்றும் வரம்புகளால் ஆராய்ச்சி நிகழ்ச்சி நிரல்கள் நுட்பமாகப் பாதிக்கப்படலாம், மேலும் அணுகல் கட்டுப்படுத்தப்படலாம் அல்லது செலவு மிக்கதாக மாறலாம், இது சுயாதீன ஆராய்ச்சி திசைகளைத் தடுக்கலாம் மற்றும் நன்கு நிதியளிக்கப்பட்ட நிறுவனங்களுக்கும் மற்றவர்களுக்கும் இடையிலான இடைவெளியை விரிவுபடுத்தலாம்.
- தடுக்கப்பட்ட கண்டுபிடிப்பு: உண்மையான திறந்த மூலம் ஆராய்ச்சியாளர்களை கருவிகளைப் பயன்படுத்த அனுமதிப்பது மட்டுமல்லாமல், அவற்றைப் பிரித்தெடுக்கவும், மாற்றவும், மேம்படுத்தவும், மறுபயன்படுத்தவும் அனுமதிக்கிறது. AI மாதிரிகளின் முக்கிய கூறுகள் அணுக முடியாததாக இருந்தால், கண்டுபிடிப்புக்கான இந்த முக்கியமான வழி தடுக்கப்படுகிறது. விஞ்ஞானிகள் புதிய பயிற்சி நுட்பங்களுடன் பரிசோதனை செய்வதிலிருந்தும், வெவ்வேறு தரவு சேர்க்கைகளை ஆராய்வதிலிருந்தும், அல்லது அசல் டெவலப்பர்கள் எதிர்பார்க்காத குறிப்பிட்ட, நுணுக்கமான ஆராய்ச்சி கேள்விகளுக்கு மாதிரிகளை மாற்றியமைப்பதிலிருந்தும் தடுக்கப்படுகிறார்கள்.
அறிவியல் சமூகம் ‘திறந்த மூலம்’ என்ற சொல்லின் நீர்த்துப்போதலை செயலற்ற முறையில் ஏற்றுக்கொள்ள முடியாது. இது தெளிவுக்காக தீவிரமாக வாதிட வேண்டும் மற்றும் AI டெவலப்பர்களிடமிருந்து உண்மையான வெளிப்படைத்தன்மையைக் கோர வேண்டும், குறிப்பாக இந்த கருவிகள் ஆராய்ச்சி சூழல்களில் பயன்படுத்தப்படும்போது. இதில் அடங்குபவை:
- தெளிவான தரங்களை ஊக்குவித்தல்: OSI போன்ற முயற்சிகளை ஆதரித்தல், ‘திறந்த மூல AI’ என்றால் என்ன என்பதற்கான தெளிவான, கடுமையான வரையறைகளை நிறுவுதல், கட்டமைப்பு, எடைகள், பயிற்சித் தரவு மற்றும் பயிற்சி செயல்முறைகள் தொடர்பான வெளிப்படைத்தன்மையை உள்ளடக்கிய வரையறைகள்.
- சரிபார்க்கக்கூடிய கருவிகளுக்கு முன்னுரிமை அளித்தல்: இந்த உயர் வெளிப்படைத்தன்மை தரங்களை பூர்த்தி செய்யும் AI மாதிரிகள் மற்றும் தளங்களின் பயன்பாட்டிற்கு ஆதரவளித்தல், அவை ஆரம்பத்தில் குறைந்த செயல்திறன் கொண்டவையாக இருந்தாலும் அல்லது உடனடியாகக் கிடைக்கும் ஒளிபுகா மாற்றுகளை விட அதிக முயற்சி தேவைப்பட்டாலும் கூட.
- வெளிப்படைத்தன்மையைக் கோருதல்: AI சம்பந்தப்பட்ட வெளியீடுகள் பயன்படுத்தப்படும் மாதிரிகள் பற்றிய விரிவான வெளிப்பாடுகளை உள்ளடக்கியிருக்க வேண்டும் என்று வலியுறுத்துதல், பயிற்சித் தரவு ஆதாரம், செயலாக்கம் மற்றும் சாத்தியமான சார்புகள் பற்றிய விரிவான தகவல்கள், அத்துடன் பயிற்சி முறைகள் உட்பட.
- உண்மையிலேயே திறந்த திட்டங்களை ஆதரித்தல்: AI வளர்ச்சியில் உண்மையான திறந்த தன்மைக்கு உறுதியளித்த நிறுவனங்களின் சமூகத்தால் இயக்கப்படும் திட்டங்கள் மற்றும் முயற்சிகளுக்கு பங்களித்தல் மற்றும் பயன்படுத்துதல்.
Homebrew Computer Club-ன் உணர்வு – பகிரப்பட்ட அறிவு மற்றும் கூட்டு உருவாக்கம் – AI சகாப்தத்தின் சிக்கல்களைப் பொறுப்புடன் வழிநடத்துவதற்கு அவசியம். செயற்கை நுண்ணறிவிற்கான ‘திறந்த மூலத்தின்’ உண்மையான அர்த்தத்தை மீட்டெடுப்பதும் பாதுகாப்பதும் வெறும் சொற்பொருள் தூய்மை பற்றியது அல்ல; இது ஒரு பெருகிய முறையில் AI-இயக்கப்படும் உலகில் அறிவியலின் ஒருமைப்பாடு, மறுஉருவாக்கம் மற்றும் தொடர்ச்சியான முன்னேற்றத்தைப் பாதுகாப்பது பற்றியது. முன்னோக்கி செல்லும் பாதைக்கு விழிப்புணர்வும், AI-ன் சக்திவாய்ந்த கருவிகள் பல நூற்றாண்டுகளாக அறிவியலுக்குச் சிறப்பாகச் சேவை செய்த திறந்த விசாரணைக் கொள்கைகளுடன் ஒத்துப்போகும் வகையில் உருவாக்கப்பட்டு பயன்படுத்தப்படுவதை உறுதிசெய்ய ஒரு கூட்டு அர்ப்பணிப்பும் தேவை.