செயற்கை நுண்ணறிவு உலகம் தற்போது கடுமையான முரண்பாடுகளின் அரங்கமாக உள்ளது. ஒரு மேடையில், பிரம்மாண்டமான தொழில்நுட்ப நிறுவனங்களுக்குள் திகைப்பூட்டும் தொகைகள் செலுத்தப்படுகின்றன, இது முன்னோடியில்லாத அறிவாற்றல் சக்தியின் அபிலாஷைகளைத் தூண்டுகிறது மற்றும் வரவிருக்கும் முதலீட்டுக் குமிழி பற்றிய விவாதங்களைத் தூண்டுகிறது. பல பில்லியன் டாலர் மதிப்பீடுகள் சாதாரணமாகி வருகின்றன, வானியல் புள்ளிவிவரங்களை எட்டும் நிதிச் சுற்றுகள் பற்றிய கிசுகிசுக்கள் உள்ளன. ஆயினும்கூட, அமைதியான, இணையான மேடையில், கல்வி வட்டாரங்கள் மற்றும் திறந்த மூல சமூகங்களுக்குள் ஒரு புரட்சி உருவாகி வருகிறது. இங்கே, ஆராய்ச்சியாளர்கள் குறிப்பிடத்தக்க புத்தி கூர்மையைக் காட்டுகிறார்கள், பில்லியன்களால் அல்ல, சில சமயங்களில் வெறும் சில்லறைக் காசுகளால் திறமையான உருவாக்கும் AI மாதிரிகளை உருவாக்குகிறார்கள், செயற்கை நுண்ணறிவு மேலாதிக்கத்திற்கான பந்தயத்தில் பெரியது எப்போதும் சிறந்தது என்ற மேலோங்கிய கருத்தை அடிப்படையில் சவால் செய்கிறார்கள்.
இந்த வேறுபாடு பெருகிய முறையில் தெளிவாகத் தெரிகிறது. ChatGPT-யின் பின்னணியில் உள்ள சக்திவாய்ந்த நிறுவனமான OpenAI-யைக் கவனியுங்கள், இது அதன் மதிப்பீட்டை $300 பில்லியன் என்ற வியக்க வைக்கும் அளவிற்கு உயர்த்தக்கூடிய மேலும் முதலீட்டைத் தேடுவதாகக் கூறப்படுகிறது. இத்தகைய புள்ளிவிவரங்கள், வேகமாக அதிகரித்து வரும் வருவாய் கணிப்புகளுடன், கட்டுப்பாடற்ற நம்பிக்கை மற்றும் அதிவேக வளர்ச்சியின் படத்தை வரைகின்றன. அதே நேரத்தில், எச்சரிக்கையின் நடுக்கங்கள் இந்த AI உற்சாகத்தின் அடித்தளங்களை உலுக்குகின்றன. நீண்ட காலமாக சந்தையின் செல்லப்பிள்ளைகளாக இருந்த, பெரும்பாலும் அவற்றின் AI திறனுக்காக அறியப்பட்ட ‘Magnificent 7’ தொழில்நுட்பப் பங்குகள், குறிப்பிடத்தக்க குறைவான செயல்திறன் காலங்களை அனுபவித்துள்ளன, இது முதலீட்டாளர் கவலை ஊடுருவுவதைக் குறிக்கிறது. இந்த அமைதியின்மை, Alibaba இணை நிறுவனர் Joe Tsai போன்ற அனுபவமுள்ள தொழில் வல்லுநர்களின் எச்சரிக்கைகளால் பெருக்கப்படுகிறது, அவர் சமீபத்தில் ஒரு சாத்தியமான AI குமிழி உருவாகும் கவலைக்குரிய அறிகுறிகளை சுட்டிக்காட்டினார், குறிப்பாக US சந்தையில். தேவைப்படும் முதலீட்டின் அளவு, குறிப்பாக இந்த சிக்கலான மாதிரிகளை இயக்கும் பாரிய தரவு மையங்களுக்கு, தீவிர ஆய்வுக்கு உட்பட்டுள்ளது. தற்போதைய செலவு நிலைகள் நீடித்தவையா, அல்லது அவை குறுகிய கால யதார்த்தங்களிலிருந்து துண்டிக்கப்பட்ட பகுத்தறிவற்ற உற்சாகத்தைக் குறிக்கின்றனவா?
AI குமிழியின் அச்சம் சூழ்ந்துள்ளது
AI குமிழி பற்றிய கவலைகள் வெறும் சுருக்கமான நிதி கவலைகள் அல்ல; அவை AI வளர்ச்சியின் வேகம் மற்றும் திசை பற்றிய ஆழமான கேள்விகளைப் பிரதிபலிக்கின்றன. பெரிய மொழி மாதிரிகளை (LLMs) உருவாக்க பில்லியன்களை முதலீடு செய்யும் சில முக்கிய நிறுவனங்களால் இந்த விவரிப்பு பெரும்பாலும் ஆதிக்கம் செலுத்தப்பட்டுள்ளது. இது சந்தைத் தலைமை ஆழமான பைகளில் மற்றும் மிகவும் விரிவான கணினி உள்கட்டமைப்பைக் கொண்டிருப்பதில் முன்னறிவிக்கப்பட்டதாகத் தோன்றும் ஒரு சூழலை உருவாக்கியுள்ளது.
- மதிப்பீட்டு தலைச்சுற்றல்: OpenAI-யின் சாத்தியமான $300 பில்லியன் மதிப்பீடு, சில முதலீட்டாளர்களிடமிருந்து மகத்தான நம்பிக்கையைப் பிரதிபலிக்கும் அதே வேளையில், புருவங்களையும் உயர்த்துகிறது. இந்த எண்ணிக்கை தற்போதைய திறன்கள் மற்றும் வருவாய் நீரோடைகளால் நியாயப்படுத்தப்படுகிறதா, அல்லது எதிர்கால, ஒருவேளை நிச்சயமற்ற, முன்னேற்றங்களுக்கு பெரிதும் எடைபோடப்படுகிறதா? டாட்-காம் சகாப்தம் போன்ற முந்தைய தொழில்நுட்ப ஏற்றங்கள் மற்றும் வீழ்ச்சிகளுடனான வரலாற்று இணைகள் தவிர்க்க முடியாமல் வெளிவருகின்றன, இது எச்சரிக்கையைத் தூண்டுகிறது.
- உள்கட்டமைப்பு முதலீட்டு ஆய்வு: AI-குறிப்பிட்ட தரவு மையங்கள் மற்றும் உயர்நிலை GPU-கள் போன்ற சிறப்பு வன்பொருள்களில் கொட்டப்படும் பில்லியன்கள், பிரம்மாண்டமான மூலதனச் செலவுகளைக் குறிக்கின்றன. Joe Tsai-யின் எச்சரிக்கை, இத்தகைய பாரிய முன்பண முதலீடுகளுடன் தொடர்புடைய ஆபத்தை எடுத்துக்காட்டுகிறது, குறிப்பாக பணமாக்குதலுக்கான பாதை எதிர்பார்த்ததை விட நீண்டதாகவோ அல்லது சிக்கலானதாகவோ நிரூபிக்கப்பட்டால். இந்த முதலீடுகளின் செயல்திறன் மற்றும் வருமானம் முக்கியமான விவாதப் புள்ளிகளாக மாறி வருகின்றன.
- சந்தை சமிக்ஞைகள்: AI-யில் பெரிதும் முதலீடு செய்துள்ள தொழில்நுட்ப ஜாம்பவான்களின் ஏற்ற இறக்கமான செயல்திறன், சந்தை சந்தேகத்தின் அளவைக் குறிக்கிறது. நீண்ட கால சாத்தியம் ஒரு வலுவான ஈர்ப்பாக இருந்தாலும், குறுகிய கால ஏற்ற இறக்கம் முதலீட்டாளர்கள் ஆபத்தை தீவிரமாக மறுமதிப்பீடு செய்வதையும் தற்போதைய வளர்ச்சிப் பாதைகளின் நிலைத்தன்மையைக் கேள்விக்குள்ளாக்குவதையும் குறிக்கிறது. AI சிப் நிபுணர் CoreWeave-இன் எதிர்பார்க்கப்படும் வெளியீடு போன்ற AI துறையில் வரவிருக்கும் IPO-களின் விதி, சந்தை உணர்வின் அளவுகோலாக உன்னிப்பாகக் கவனிக்கப்படுகிறது. இது உற்சாகத்தை மீண்டும் தூண்டுமா அல்லது அடிப்படை நடுக்கங்களை உறுதிப்படுத்துமா?
- புவிசார் அரசியல் பரிமாணங்கள்: AI பந்தயம் குறிப்பிடத்தக்க புவிசார் அரசியல் பின்னணிகளையும் கொண்டுள்ளது, குறிப்பாக US மற்றும் சீனா இடையே. US-இல் உள்ள மகத்தான செலவினம் ஓரளவு போட்டித்தன்மையை பராமரிக்கும் விருப்பத்தால் இயக்கப்படுகிறது. இது மேம்பட்ட குறைக்கடத்தி தொழில்நுட்பத்தின் மீதான கடுமையான ஏற்றுமதி கட்டுப்பாடுகளுக்கான அழைப்புகள் உட்பட சிக்கலான கொள்கை விவாதங்களுக்கு வழிவகுத்தது, இது சீனாவின் முன்னேற்றத்தை மெதுவாக்கக்கூடும். மாறாக, துணிகர மூலதனம் சீன AI ஸ்டார்ட்அப்களுக்கு தொடர்ந்து பாய்கிறது, இது தொழில்நுட்ப வலிமை மற்றும் பொருளாதார உத்தி இறுக்கமாகப் பின்னிப் பிணைந்துள்ள உலகளாவிய போட்டியைக் குறிக்கிறது.
இந்த உயர்-பங்கு, உயர்-செலவு சூழல் நிறுவப்பட்ட ஒழுங்கை சவால் செய்யும் சீர்குலைக்கும் கண்டுபிடிப்புகளுக்கு களம் அமைக்கிறது. கணிசமாக மலிவான மாற்றுகளின் தோற்றம், முரட்டுத்தனமான கணக்கீடு மற்றும் பாரிய அளவு ஆகியவை முன்னோக்கிச் செல்வதற்கான ஒரே பாதைகள் தானா என்பதை மறுமதிப்பீடு செய்ய கட்டாயப்படுத்துகிறது.
DeepSeek-இன் சீர்குலைக்கும் கூற்று மற்றும் அதன் சிற்றலை விளைவுகள்
பிரம்மாண்டமான செலவினம் மற்றும் வளர்ந்து வரும் கவலையின் இந்த நிலப்பரப்பில், சீனா சார்ந்த நிறுவனமான DeepSeek நுழைந்தது, அது ஒரு வியக்க வைக்கும் கூற்றை வெளியிட்டது: அது அதன் R1 உருவாக்கும் AI பெரிய மொழி மாதிரியை வெறும் $6 மில்லியனுக்கு உருவாக்கியுள்ளது. இந்த எண்ணிக்கை, மேற்கத்திய சகாக்களின் கருதப்படும் பல பில்லியன் டாலர் முதலீடுகளை விட பல மடங்கு குறைவாக இருப்பதால், உடனடியாக தொழில்துறையில் சிற்றலைகளை அனுப்பியது.
$6 மில்லியன் கணக்கீடு குறித்த சந்தேகம் நீடித்தாலும் - என்ன செலவுகள் சேர்க்கப்பட்டன மற்றும் விலக்கப்பட்டன என்று கேள்வி எழுப்பப்பட்டது - அறிவிப்பின் தாக்கம் மறுக்க முடியாதது. இது ஒரு சக்திவாய்ந்த ஊக்கியாக செயல்பட்டது, சந்தைத் தலைவர்களால் பயன்படுத்தப்படும் செலவுக் கட்டமைப்புகள் மற்றும் மேம்பாட்டு முறைகள் பற்றிய விமர்சனப் பரிசோதனையை கட்டாயப்படுத்தியது. ஒரு நியாயமான திறமையான மாதிரியை உண்மையில் பில்லியன்களுக்குப் பதிலாக மில்லியன்களுக்கு உருவாக்க முடிந்தால், தற்போதைய அணுகுமுறைகளின் செயல்திறனைப் பற்றி அது என்ன குறிக்கிறது?
- கதையை சவால் செய்தல்: DeepSeek-இன் கூற்று, துல்லியமானதோ இல்லையோ, அதிநவீன AI மேம்பாடு என்பது வரம்பற்ற வளங்களைக் கொண்ட டிரில்லியன் டாலர் நிறுவனங்களின் களமாக மட்டுமே இருந்தது என்ற மேலோங்கிய கதையைத் துளைத்தது. இது மிகவும் ஜனநாயகப்படுத்தப்பட்ட வளர்ச்சி நிலப்பரப்பின் சாத்தியத்தை அறிமுகப்படுத்தியது.
- ஆய்வைத் தூண்டுதல்: Microsoft ஆதரவு பெற்ற OpenAI போன்ற நிறுவனங்களின் பாரிய செலவினங்கள் மீது ஏற்கனவே விழுந்து கொண்டிருந்த ஆய்வை இது தீவிரப்படுத்தியது. முதலீட்டாளர்கள், ஆய்வாளர்கள் மற்றும் போட்டியாளர்கள் இந்த மூலதன-தீவிர திட்டங்களுக்கான வள ஒதுக்கீடு மற்றும் முதலீட்டின் மீதான வருமானம் குறித்து கடினமான கேள்விகளைக் கேட்கத் தொடங்கினர்.
- புவிசார் அரசியல் அதிர்வு: இந்த கூற்று US-சீனா தொழில்நுட்பப் போட்டி சூழலிலும் எதிரொலித்தது. AI திறனுக்கான மாற்று, சாத்தியமான அதிக வள-திறனுள்ள பாதைகள் இருக்கலாம் என்று அது பரிந்துரைத்தது, தொழில்நுட்பத் தலைமை மற்றும் மூலோபாயப் போட்டி பற்றிய விவாதங்களுக்கு மற்றொரு சிக்கலான அடுக்கைச் சேர்த்தது. இது சிப் தடைகள் போன்ற கொள்கைகள் மீதான மேலும் விவாதத்தைத் தூண்டியது, அதே நேரத்தில் துணிகர முதலீட்டாளர்களை சீனாவில் வளர்ந்து வரும் வீரர்களை உன்னிப்பாகப் பார்க்க ஊக்குவித்தது, அவர்கள் மெலிதான வளர்ச்சி மாதிரிகளைக் கொண்டிருக்கலாம்.
சந்தேகங்கள் இருந்தபோதிலும், DeepSeek R1-இன் வெளியீடு, குறிப்பாக அதன் அதனுடன் இணைந்த திறந்த ஆராய்ச்சி கூறுகள், மற்றவர்களுக்கு ஊக்கமளிக்கும் முக்கியமான நுண்ணறிவுகளை வழங்கின. இது கூறப்பட்ட செலவு மட்டுமல்ல, சாத்தியமான வழிமுறைகள் சுட்டிக்காட்டப்பட்டதும், மற்ற இடங்களில், குறிப்பாக முற்றிலும் மாறுபட்ட நிதி கட்டுப்பாடுகளின் கீழ் செயல்படும் கல்வி ஆய்வகங்களில் ஆர்வத்தையும் புதுமையையும் தூண்டியது.
மிக மெலிதான AI-யின் எழுச்சி: ஒரு பல்கலைக்கழகப் புரட்சி
பெருநிறுவன ஜாம்பவான்கள் பில்லியன் டாலர் வரவு செலவுத் திட்டங்கள் மற்றும் சந்தை அழுத்தங்களுடன் மல்யுத்தம் செய்துகொண்டிருந்தபோது, கல்வித்துறையின் அரங்குகளில் வேறு வகையான AI புரட்சி அமைதியாக வடிவம் பெற்றுக்கொண்டிருந்தது. உடனடி வணிகமயமாக்கல் கோரிக்கைகளால் சுமையற்ற ஆனால் நிதியுதவியால் கடுமையாக வரையறுக்கப்பட்ட ஆராய்ச்சியாளர்கள், மேம்பட்ட AI-யின் பின்னணியில் உள்ள கொள்கைகளை குறைந்தபட்ச வளங்களைப் பயன்படுத்தி, அதன் அளவை இல்லாவிட்டாலும், பிரதிபலிக்க வழிகளை ஆராயத் தொடங்கினர். கலிபோர்னியா பல்கலைக்கழகம், பெர்க்லியில் இருந்து ஒரு சிறந்த உதாரணம் வெளிப்பட்டது.
பெர்க்லியில் உள்ள ஒரு குழு, சமீபத்திய முன்னேற்றங்களால் ஈர்க்கப்பட்டாலும், தொழில் ஆய்வகங்களின் மகத்தான மூலதனம் இல்லாததால், TinyZero என்ற திட்டத்தைத் தொடங்கியது. அவர்களின் குறிக்கோள் தைரியமானது: மாதிரிகள் பதிலளிப்பதற்கு முன் ‘சிந்திக்க’ அனுமதிக்கும் அதிநவீன AI நடத்தைகளை, குறிப்பாக அந்த வகையான பகுத்தறிவை, வியத்தகு அளவில் குறைக்கப்பட்ட மாதிரி மற்றும் பட்ஜெட்டைப் பயன்படுத்தி அவர்களால் நிரூபிக்க முடியுமா? பதில் ஒரு உறுதியான ஆம் என்று நிரூபிக்கப்பட்டது. OpenAI மற்றும் DeepSeek ஆகிய இரண்டாலும் ஆராயப்பட்ட பகுத்தறிவு முன்னுதாரணத்தின் முக்கிய அம்சங்களை அவர்கள் வியக்கத்தக்க குறைந்த செலவில் வெற்றிகரமாக மீண்டும் உருவாக்கினர் - சுமார் $30.
இது GPT-4 க்கு நேரடி போட்டியாளரை உருவாக்குவதன் மூலம் அடையப்படவில்லை, ஆனால் மாதிரி மற்றும் பணியின் சிக்கலான தன்மை இரண்டையும் புத்திசாலித்தனமாக குறைப்பதன் மூலம் அடையப்பட்டது.
- $30 பரிசோதனை: இந்த எண்ணிக்கை முதன்மையாக தேவையான பயிற்சி நேரத்திற்கு பொது கிளவுட் தளத்தில் இரண்டு Nvidia H200 GPU-களை வாடகைக்கு எடுப்பதற்கான செலவைக் குறிக்கிறது. இது பாரிய முன்பண வன்பொருள் முதலீடு இல்லாமல் அதிநவீன ஆராய்ச்சிக்காக தற்போதுள்ள கிளவுட் உள்கட்டமைப்பைப் பயன்படுத்துவதன் திறனைக் காட்டியது.
- மாதிரி அளவிடுதல்: TinyZero திட்டம் ஒரு ‘3B’ மாதிரியைப் பயன்படுத்தியது, இது தோராயமாக மூன்று பில்லியன் அளவுருக்களைக் குறிக்கிறது. இது மிகப்பெரிய LLM-களை விட கணிசமாக சிறியது, அவை நூற்றுக்கணக்கான பில்லியன் அல்லது டிரில்லியன் கணக்கான அளவுருக்களைக் கொண்டிருக்கலாம். முக்கிய நுண்ணறிவு என்னவென்றால், பணி பொருத்தமாக வடிவமைக்கப்பட்டால் சிறிய மாதிரிகளிலும் சிக்கலான நடத்தைகள் வெளிப்படலாம்.
- ஜாம்பவான்கள் மற்றும் சவால்களிடமிருந்து உத்வேகம்: TinyZero திட்டத் தலைவர் Jiayi Pan, OpenAI-யின் முன்னேற்றங்கள், குறிப்பாக பதிலளிப்பதற்கு முன் அதிக நேரம் செயலாக்கும் மாதிரிகள் பற்றிய கருத்துக்கள், ஒரு முக்கிய உத்வேகமாக இருந்தன என்று குறிப்பிட்டார். இருப்பினும், DeepSeek R1-இன் திறந்த ஆராய்ச்சிதான் இந்த மேம்பட்ட பகுத்தறிவு திறனை எப்படி அடைவது என்பதற்கான சாத்தியமான வரைபடத்தை வழங்கியது, DeepSeek-இன் அறிவிக்கப்பட்ட $6 மில்லியன் பயிற்சி செலவு இன்னும் பல்கலைக்கழகக் குழுவின் வரம்பிற்கு அப்பாற்பட்டதாக இருந்தாலும் கூட.
பெர்க்லி குழு, மாதிரி அளவு மற்றும் அது தீர்க்க வேண்டிய சிக்கலின் சிக்கலான தன்மை இரண்டையும் குறைப்பதன் மூலம், அவர்கள் விரும்பிய ‘வெளிப்படும் பகுத்தறிவு நடத்தையை’ இன்னும் கவனிக்க முடியும் என்று கருதுகோள் செய்தனர். இந்த குறைப்புவாத அணுகுமுறை, மதிப்புமிக்க அறிவியல் அவதானிப்பை இன்னும் செயல்படுத்தும் அதே வேளையில், செலவுகளை வியத்தகு முறையில் குறைப்பதில் முக்கியமானது.
‘ஆஹா தருணத்தை’ டிகோட் செய்தல்: பட்ஜெட்டில் பகுத்தறிவு
TinyZero திட்டம் மற்றும் இதேபோன்ற குறைந்த-செலவு முயற்சிகளின் முக்கிய சாதனை, ஆராய்ச்சியாளர்கள் பெரும்பாலும் ‘ஆஹா தருணம்’ என்று அழைப்பதை நிரூபிப்பதில் உள்ளது - ஒரு AI மாதிரி உண்மையான பகுத்தறிவு மற்றும் சிக்கல் தீர்க்கும் திறன்களை வெளிப்படுத்தத் தொடங்கும் புள்ளி, வெறும் வடிவப் பொருத்தம் அல்லது சேமிக்கப்பட்ட தகவலை மீட்டெடுப்பதற்குப் பதிலாக. இந்த வெளிப்படும் நடத்தை மிகப்பெரிய மாதிரிகளின் டெவலப்பர்களுக்கும் கூட ஒரு முக்கிய குறிக்கோளாகும்.
அவர்களின் கருதுகோளைச் சோதிக்கவும், இந்த நடத்தையை ஒரு சிறிய அளவில் வெளிக்கொணரவும், பெர்க்லி குழு ஒரு குறிப்பிட்ட, கட்டுப்படுத்தப்பட்ட பணியைப் பயன்படுத்தியது: ‘Countdown’ என்ற கணித விளையாட்டு.
- Countdown விளையாட்டு: இந்த விளையாட்டு AI-யை கொடுக்கப்பட்ட தொடக்க எண்கள் மற்றும் அடிப்படை எண்கணித செயல்பாடுகளை (கூட்டல், கழித்தல், பெருக்கல், வகுத்தல்) பயன்படுத்தி ஒரு இலக்கு எண்ணை அடைய வேண்டும். முக்கியமாக, Countdown-இல் வெற்றி என்பது பரந்த அளவிலான முன்-இருக்கும் கணித அறிவை நினைவுபடுத்துவதை விட, மூலோபாய பகுத்தறிவு மற்றும் திட்டமிடல் - வெவ்வேறு சேர்க்கைகள் மற்றும் செயல்பாடுகளின் வரிசைகளை ஆராய்வது - மீது அதிக அளவில் தங்கியுள்ளது.
- விளையாட்டின் மூலம் கற்றல்: ஆரம்பத்தில், TinyZero மாதிரி விளையாட்டை தோராயமாக அணுகியது, சேர்க்கைகளை கிட்டத்தட்ட தாறுமாறாக முயற்சித்தது. இருப்பினும், வலுவூட்டல் கற்றல் (சோதனை மற்றும் பிழை மற்றும் வெகுமதிகளிலிருந்து கற்றல்) செயல்முறை மூலம், அது வடிவங்களையும் உத்திகளையும் கண்டறியத் தொடங்கியது. இது அதன் அணுகுமுறையை சரிசெய்யவும், திறமையற்ற பாதைகளை நிராகரிக்கவும், சரியான தீர்வுகளில் விரைவாக ஒன்றிணையவும் கற்றுக்கொண்டது. இது அடிப்படையில் விளையாட்டின் வரையறுக்கப்பட்ட விதிகளுக்குள் எப்படி பகுத்தறிவது என்பதைக் கற்றுக்கொண்டது.
- சுய சரிபார்ப்பு வெளிப்படுகிறது: குறிப்பிடத்தக்க வகையில், பயிற்சி பெற்ற மாதிரி சுய சரிபார்ப்பின் அறிகுறிகளைக் காட்டத் தொடங்கியது - அதன் சொந்த இடைநிலை படிகள் மற்றும் சாத்தியமான தீர்வுகளை மதிப்பீடு செய்து அவை இலக்கு எண்ணை நோக்கி இட்டுச் செல்கின்றனவா என்பதைத் தீர்மானிக்கிறது. உள்நாட்டில் மதிப்பிடுவதற்கும் சரிசெய்வதற்கும் இந்த திறன் மிகவும் மேம்பட்ட பகுத்தறிவின் ஒரு அடையாளமாகும்.
Jiayi Pan விளக்கியது போல், “3B போன்ற சிறிய மாதிரியுடன், அது எளிய சிக்கல்களைப் பற்றி பகுத்தறிய கற்றுக்கொள்ள முடியும் மற்றும் சுய சரிபார்க்கவும் சிறந்த தீர்வுகளைத் தேடவும் கற்றுக்கொள்ளத் தொடங்குகிறது என்பதை நாங்கள் காட்டுகிறோம்.” இது பகுத்தறிவு மற்றும் ‘ஆஹா தருணம்’ ஆகியவற்றின் அடிப்படை வழிமுறைகள், முன்பு பிரம்மாண்டமான, விலையுயர்ந்த மாதிரிகளுடன் முக்கியமாக தொடர்புடையவை, மிகவும் வளம்-கட்டுப்படுத்தப்பட்ட சூழலில் பிரதிபலிக்கப்பட்டு ஆய்வு செய்யப்படலாம் என்பதை நிரூபித்தது. TinyZero-வின் வெற்றி, முன்னணி AI கருத்துக்கள் தொழில்நுட்ப ஜாம்பவான்களின் களமாக மட்டும் இல்லை, ஆனால் வரையறுக்கப்பட்ட வரவு செலவுத் திட்டங்களைக் கொண்ட ஆராய்ச்சியாளர்கள், பொறியாளர்கள் மற்றும் பொழுதுபோக்காளர்களுக்கும் அணுகக்கூடியதாக மாற்றப்படலாம் என்பதை நிரூபித்தது, AI ஆய்வுக்கான மிகவும் உள்ளடக்கிய சுற்றுச்சூழல் அமைப்பை வளர்த்தது. குழுவின் கண்டுபிடிப்புகளை வெளிப்படையாகப் பகிர்வதற்கான முடிவு, குறிப்பாக GitHub போன்ற தளங்கள் வழியாக, மற்றவர்கள் பரிசோதனைகளை மீண்டும் செய்யவும், இந்த ‘ஆஹா தருணத்தை’ சில பீட்சாக்களின் விலையை விடக் குறைவாக நேரடியாக அனுபவிக்கவும் அனுமதித்தது.
Stanford களத்தில் இணைகிறது: குறைந்த-செலவு கற்றலை சரிபார்த்தல்
TinyZero-வால் உருவாக்கப்பட்ட சிற்றலைகள் கல்வி AI சமூகத்தில் விரைவாகப் பரவின. Stanford பல்கலைக்கழக ஆராய்ச்சியாளர்கள், ஏற்கனவே இதேபோன்ற கருத்துக்களை ஆராய்ந்து கொண்டிருந்தவர்கள் மற்றும் Countdown விளையாட்டை முன்பு ஒரு ஆராய்ச்சிப் பணியாக அறிமுகப்படுத்தியவர்கள் கூட, பெர்க்லி குழுவின் பணியை மிகவும் பொருத்தமானதாகவும் சரிபார்ப்பதாகவும் கண்டறிந்தனர்.
Kanishk Gandhi தலைமையில், Stanford குழு ஒரு தொடர்புடைய, அடிப்படைக் கேள்வியை ஆராய்ந்து கொண்டிருந்தது: சில LLM-கள் பயிற்சியின் போது அவற்றின் பகுத்தறிவு திறன்களில் வியத்தகு, கிட்டத்தட்ட திடீர் முன்னேற்றங்களைக் காட்டுகின்றன, மற்றவை தேக்கமடைவது போல் தெரிகிறது? திறனில் இந்த பாய்ச்சல்களை இயக்கும் அடிப்படை வழிமுறைகளைப் புரிந்துகொள்வது மிகவும் பயனுள்ள மற்றும் நம்பகமான AI-யை உருவாக்குவதற்கு முக்கியமானது.
- பகிரப்பட்ட தளத்தில் கட்டமைத்தல்: Gandhi, TinyZero-வின் மதிப்பை ஒப்புக்கொண்டார், அது ‘சிறப்பானது’ என்று கூறினார், ஏனெனில் அது தனது சொந்த குழு ஆய்வு செய்து கொண்டிருந்த Countdown பணியை வெற்றிகரமாகப் பயன்படுத்தியது. இந்த ஒருங்கிணைப்பு வெவ்வேறு ஆராய்ச்சிக் குழுக்களிடையே யோசனைகளை விரைவாக சரிபார்க்கவும் மறு செய்கை செய்யவும் அனுமதித்தது.
- பொறியியல் தடைகளைத் தாண்டுதல்: Stanford ஆராய்ச்சியாளர்கள் தங்கள் முன்னேற்றம் முன்பு பொறியியல் சவால்களால் எவ்வாறு தடைபட்டது என்பதையும் எடுத்துக்காட்டினர். இந்த தடைகளைத் தாண்டுவதில் திறந்த மூல கருவிகளின் கிடைக்கும் தன்மை கருவியாக மாறியது.
- திறந்த மூல கருவிகளின் சக்தி: குறிப்பாக, Gandhi, ByteDance (TikTok-இன் தாய் நிறுவனம்) உருவாக்கிய திறந்த மூல திட்டமான Volcano Engine Reinforcement Learning system (VERL)-ஐ ‘எங்கள் பரிசோதனைகளை நடத்துவதற்கு அவசியமானது’ என்று பாராட்டினார். VERL-இன் திறன்களுக்கும் Stanford குழுவின் சோதனைத் தேவைகளுக்கும் இடையிலான சீரமைப்பு அவர்களின் ஆராய்ச்சி சுழற்சிகளை கணிசமாக துரிதப்படுத்தியது.
திறந்த மூல கூறுகள் மீதான இந்த சார்பு குறைந்த-செலவு AI இயக்கத்தின் ஒரு முக்கியமான அம்சத்தை அடிக்கோடிட்டுக் காட்டுகிறது. முன்னேற்றம் பெரும்பாலும் சமூகத்திற்குள் சுதந்திரமாகப் பகிரப்படும் கருவிகள் மற்றும் நுண்ணறிவுகளைப் பயன்படுத்தி, கூட்டாகக் கட்டமைக்கப்படுகிறது. Gandhi மேலும் கருத்துத் தெரிவிக்கையில், LLM பகுத்தறிவு மற்றும் நுண்ணறிவைப் புரிந்துகொள்வதில் உள்ள முக்கிய அறிவியல் முன்னேற்றங்கள் இனி பெரிய, நன்கு நிதியளிக்கப்பட்ட தொழில்துறை ஆய்வகங்களிலிருந்து மட்டுமே வர வேண்டிய அவசியமில்லை. ‘தற்போதைய LLM-களின் அறிவியல் புரிதல் பெரிய ஆய்வகங்களுக்குள்ளும் கூட இல்லை’ என்று அவர் வாதிட்டார், இது ‘DIY AI, திறந்த மூலம் மற்றும் கல்வித்துறை’ ஆகியவற்றிலிருந்து பங்களிப்புகளுக்கு குறிப்பிடத்தக்க இடத்தை விட்டுச்செல்கிறது. இந்த சிறிய, அதிக சுறுசுறுப்பான திட்டங்கள் குறிப்பிட்ட நிகழ்வுகளை ஆழமாக ஆராயலாம், முழுத் துறைக்கும் பயனளிக்கும் நுண்ணறிவுகளை உருவாக்கலாம்.
பாடப்படாத நாயகன்: திறந்த மூல அடித்தளங்கள்
TinyZero போன்ற திட்டங்களின் குறிப்பிடத்தக்க சாதனைகள், பல்லாயிரக்கணக்கான டாலர்களுக்கு அதிநவீன AI நடத்தைகளை நிரூபிக்கின்றன, இது ஒரு முக்கியமான, பெரும்பாலும் பாராட்டப்படாத உறுப்பு மீது பெரிதும் தங்கியுள்ளது: திறந்த மூல மற்றும் திறந்த-எடை AI மாதிரிகள் மற்றும் கருவிகளின் பரந்த சுற்றுச்சூழல் அமைப்பு. ஒரு குறிப்பிட்ட பரிசோதனையின் விளிம்புச் செலவு குறைவாக இருக்கலாம் என்றாலும், இது பெரும்பாலும் மில்லியன் கணக்கான, பில்லியன் கணக்கான டாலர்கள் இல்லையென்றால், முந்தைய முதலீட்டைக் குறிக்கும் அடித்தளங்களில் கட்டமைக்கப்படுகிறது.
AI ஆலோசனை நிறுவனமான OneSix-இல் மூத்த முன்னணி இயந்திர கற்றல் விஞ்ஞானியான Nina Singer, முக்கியமான சூழலை வழங்கினார். TinyZero-வின் $30 பயிற்சிச் செலவு, பெர்க்லி குழுவால் நிகழ்த்தப்பட்ட குறிப்பிட்ட பணிக்கு துல்லியமாக இருந்தாலும், அது பயன்படுத்திய அடிப்படை மாதிரிகளின் ஆரம்ப வளர்ச்சிச் செலவைக் கணக்கிடவில்லை என்று அவர் சுட்டிக்காட்டினார்.
- ஜாம்பவான்களின் தோள்களில் கட்டமைத்தல்: TinyZero-வின் பயிற்சி ByteDance-இன் VERL அமைப்பை மட்டுமல்ல, Alibaba Cloud-இன் Qwen, ஒரு திறந்த மூல LLM-ஐயும் பயன்படுத்தியது. Alibaba அதன் ‘எடைகளை’ (மாதிரியின் திறன்களை வரையறுக்கும் கற்றறிந்த அளவுருக்கள்) பொதுமக்களுக்கு வெளியிடுவதற்கு முன்பு Qwen-ஐ உருவாக்குவதில் கணிசமான வளங்களை - அநேகமாக மில்லியன் கணக்கானவை - முதலீடு செய்தது.
- திறந்த எடைகளின் மதிப்பு: Singer இது TinyZero-வின் விமர்சனம் அல்ல, மாறாக திறந்த-எடை மாதிரிகளின் மகத்தான மதிப்பு மற்றும் முக்கியத்துவத்தை எடுத்துக்காட்டுகிறது என்று வலியுறுத்தினார். முழு தரவுத்தொகுப்பு மற்றும் பயிற்சி கட்டமைப்பு தனியுரிமையாக இருந்தாலும், மாதிரி அளவுருக்களை வெளியிடுவதன் மூலம், Alibaba போன்ற நிறுவனங்கள் ஆராய்ச்சியாளர்கள் மற்றும் சிறிய நிறுவனங்கள் தங்கள் வேலையை உருவாக்கவும், பரிசோதனை செய்யவும், புதுமைப்படுத்தவும் உதவுகின்றன, இது விலையுயர்ந்த ஆரம்ப பயிற்சி செயல்முறையை புதிதாக மீண்டும் செய்ய வேண்டிய அவசியமின்றி.
- நுண்ணிய சரிசெய்தலை ஜனநாயகப்படுத்துதல்: இந்த திறந்த அணுகுமுறை ‘நுண்ணிய சரிசெய்தல்’ என்ற வளர்ந்து வரும் துறையை வளர்க்கிறது, அங்கு சிறிய AI மாதிரிகள் குறிப்பிட்ட பணிகளுக்காக மாற்றியமைக்கப்படுகின்றன அல்லது சிறப்பு செய்யப்படுகின்றன. Singer குறிப்பிட்டது போல், இந்த நுண்ணிய-சரிசெய்யப்பட்ட மாதிரிகள் பெரும்பாலும் அவற்றின் நியமிக்கப்பட்ட நோக்கத்திற்காக ‘அளவு மற்றும் செலவின் ஒரு பகுதியிலேயே மிகப் பெரிய மாதிரிகளுக்கு போட்டியாக’ இருக்கலாம். எடுத்துக்காட்டுகள் ஏராளமாக உள்ளன, Sky-T1 போன்றவை, பயனர்களுக்கு சுமார் $450-க்கு ஒரு மேம்பட்ட மாதிரியின் சொந்த பதிப்பைப் பயிற்றுவிக்கும் திறனை வழங்குகிறது, அல்லது Alibaba-வின் Qwen தானே, $6 போன்ற குறைந்த செலவில் நுண்ணிய சரிசெய்தலை செயல்படுத்துகிறது.
திறந்த அடித்தளங்கள் மீதான இந்த சார்பு ஒரு மாறும் சுற்றுச்சூழல் அமைப்பை உருவாக்குகிறது, அங்கு புதுமை பல நிலைகளில் நிகழலாம். பெரிய நிறுவனங்கள் சக்திவாய்ந்த அடிப்படை மாதிரிகளை உருவாக்குவதில் பெரிதும் முதலீடு செய்கின்றன, அதே நேரத்தில் ஒரு பரந்த சமூகம் இந்த சொத்துக்களைப் பயன்படுத்தி புதிய பயன்பாடுகளை ஆராயவும், ஆராய்ச்சி நடத்தவும், சிறப்பு தீர்வுகளை மிகவும் சிக்கனமாக உருவாக்கவும் செய்கிறது. இந்த கூட்டுறவு உறவு துறையில் விரைவான முன்னேற்றம் மற்றும் ஜனநாயகமயமாக்கலை இயக்குகிறது.
‘பெரியது சிறந்தது’ முன்னுதாரணத்தை சவால் செய்தல்
TinyZero போன்ற திட்டங்களிலிருந்து வெளிவரும் வெற்றிக் கதைகள் மற்றும் பயனுள்ள, குறைந்த-செலவு நுண்ணிய சரிசெய்தலின் பரந்த போக்கு, AI-யில் முன்னேற்றம் என்பது அளவின் செயல்பாடு மட்டுமே - அதிக தரவு, அதிக அளவுருக்கள், அதிக கணினி சக்தி - என்ற நீண்டகால தொழில் நம்பிக்கைக்கு குறிப்பிடத்தக்க சவாலை ஏற்படுத்துகிறது.
Nina Singer எடுத்துக்காட்டியபடி, மிக ஆழமான தாக்கங்களில் ஒன்று என்னவென்றால், தரவுத் தரம் மற்றும் பணி-குறிப்பிட்ட பயிற்சி ஆகியவை பெரும்பாலும் வெறும் மாதிரி அளவை விட முக்கியமானதாக இருக்கலாம். TinyZero பரிசோதனை, ஒப்பீட்டளவில் சிறிய மாதிரி (3 பில்லியன் அளவுருக்கள்) கூட, நன்கு வரையறுக்கப்பட்ட பணியில் திறம்பட பயிற்சி அளிக்கப்படும்போது, சுய-திருத்தம் மற்றும் மறு செய்கை மேம்பாடு போன்ற சிக்கலான நடத்தைகளைக் கற்றுக்கொள்ள முடியும் என்பதை நிரூபித்தது.
- அளவில் குறைந்து வரும் வருமானம்?: இந்த கண்டுபிடிப்பு, OpenAI-யின் GPT தொடர் அல்லது Anthropic-இன் Claude போன்ற பாரிய மாதிரிகள் மட்டுமே, அவற்றின் நூற்றுக்கணக்கான பில்லியன் அல்லது டிரில்லியன் கணக்கான அளவுருக்களுடன், இத்தகைய அதிநவீன கற்றலுக்குத் திறன் கொண்டவை என்ற அனுமானத்தை நேரடியாகக் கேள்விக்குள்ளாக்குகிறது. Singer பரிந்துரைத்தார், “இந்த திட்டம், கூடுதல் அளவுருக்கள் குறைந்து வரும் வருமானத்தை வழங்கும் வரம்பை நாம் ஏற்கனவே கடந்துவிட்டோம் என்று கூறுகிறது - குறைந்தபட்சம் சில பணிகளுக்கு.” பெரிய மாதிரிகள் பொதுத்தன்மை மற்றும் அறிவின் அகலத்தில் நன்மைகளைத் தக்க வைத்துக் கொள்ளலாம் என்றாலும், குறிப்பிட்ட பயன்பாடுகளுக்கு, ஹைப்பர்-ஸ்கேல் செய்யப்பட்ட மாதிரிகள் செலவு மற்றும் கணக்கீட்டுத் தேவைகள் இரண்டின் அடிப்படையிலும் மிகையாக இருக்கலாம்.
- செயல்திறன் மற்றும் தனித்தன்மையை நோக்கிய நகர்வு: AI நிலப்பரப்பு ஒரு நுட்பமான ஆனால் குறிப்பிடத்தக்க மாற்றத்திற்கு உள்ளாகலாம். எப்போதும் பெரிய அடித்தள மாதிரிகளை உருவாக்குவதில் பிரத்தியேக கவனம் செலுத்துவதற்குப் பதிலாக, செயல்திறன், அணுகல்தன்மை மற்றும் இலக்கு நுண்ணறிவு ஆகியவற்றில் அதிக கவனம் செலுத்தப்படுகிறது. குறிப்பிட்ட களங்கள் அல்லது பணிகளுக்காக சிறிய, மிகவும் உகந்த மாதிரிகளை உருவாக்குவது ஒரு சாத்தியமான மற்றும் பொருளாதார ரீதியாக கவர்ச்சிகரமான மாற்றாக நிரூபிக்கப்பட்டுள்ளது.
- மூடிய மாதிரிகள் மீதான அழுத்தம்: திறந்த-எடை மாதிரிகள் மற்றும் குறைந்த-செலவு நுண்ணிய சரிசெய்தல் நுட்பங்களின் வளர்ந்து வரும் திறன் மற்றும் கிடைக்கும் தன்மை, முதன்மையாக கட்டுப்படுத்தப்பட்ட API-கள் (Application Programming Interfaces) வழியாக தங்கள் AI திறன்களை வழங்கும் நிறுவனங்கள் மீது போட்டி அழுத்தத்தை ஏற்படுத்துகிறது. Singer குறிப்பிட்டது போல், OpenAI மற்றும் Anthropic போன்ற நிறுவனங்கள் தங்கள் மூடிய சுற்றுச்சூழல் அமைப்புகளின் மதிப்பு முன்மொழிவை பெருகிய முறையில் நியாயப்படுத்த வேண்டியிருக்கலாம், குறிப்பாக ‘திறந்த மாற்றுகள் குறிப்பிட்ட களங்களில் அவற்றின் திறன்களைப் பொருத்தவோ அல்லது மீறவோ தொடங்கும் போது.’
இது பெரிய அடித்தள மாதிரிகளின் முடிவைக் குறிக்க வேண்டிய அவசியமில்லை, அவை முக்கியமான தொடக்கப் புள்ளிகளாகத் தொடர்ந்து செயல்படும். இருப்பினும், இது AI சுற்றுச்சூழல் அமைப்பு மிகவும் மாறுபட்டதாக இருக்கும் ஒரு எதிர்காலத்தைக் குறிக்கிறது, இது பாரிய பொது மாதிரிகள் மற்றும் குறிப்பிட்ட தேவைகளுக்கு ஏற்ப வடிவமைக்கப்பட்ட சிறிய, சிறப்பு வாய்ந்த மற்றும் மிகவும் திறமையான மாதிரிகளின் பெருக்கத்தின் கலவையைக் கொண்டுள்ளது.
ஜனநாயகமயமாக்கல் அலை: அதிகமான மக்களுக்கு AI?
அணுகக்கூடிய கிளவுட் கம்ப்யூட்டிங், சக்திவாய்ந்த திறந்த மூல கருவிகள் மற்றும் சிறிய, நுண்ணிய-சரிசெய்யப்பட்ட மாதிரிகளின் நிரூபிக்கப்பட்ட செயல்திறன் ஆகியவற்றின் ஒருங்கிணைப்பு AI நிலப்பரப்பு முழுவதும் ஜனநாயகமயமாக்கல் அலையைத் தூண்டுகிறது. ஒரு காலத்தில் பில்லியன் டாலர் வரவு செலவுத் திட்டங்களைக் கொண்ட உயரடுக்கு ஆராய்ச்சி ஆய்வகங்கள் மற்றும் தொழில்நுட்ப நிறுவனங்களின் பிரத்தியேக களமாக இருந்தது, பரந்த அளவிலான நடிகர்களுக்கு பெருகிய முறையில் அணுகக்கூடியதாக மாறி வருகிறது.
தனிநபர்கள், கல்வி ஆராய்ச்சியாளர்கள், ஸ்டார்ட்அப்கள் மற்றும் சிறிய நிறுவனங்கள், தடைசெய்யும் உள்கட்டமைப்பு முதலீடுகள் தேவையில்லாமல் மேம்பட்ட AI கருத்துக்கள் மற்றும் மேம்பாட்டில் அர்த்தமுள்ள வகையில் ஈடுபட முடியும் என்பதைக் கண்டறிந்துள்ளனர்.
- நுழைவதற்கான தடைகளைக் குறைத்தல்: நூற்றுக்கணக்கான அல்லது பல்லாயிரக்கணக்கான டாலர்களுக்கு ஒரு திறமையான மாதிரியை நுண்ணிய-சரிசெய்யும் திறன், திறந்த-எடை அடித்தளங்களில் கட்டமைத்தல், பரிசோதனை மற்றும் பயன்பாட்டு மேம்பாட்டிற்கான நுழைவுத் தடையை வியத்தகு முறையில் குறைக்கிறது.
- புதுமையைப் பேணுதல்: இந்த அணுகல்தன்மை ஒரு பரந்த திறமைக் குளத்தை துறையில் பங்களிக்க ஊக்குவிக்கிறது. ஆராய்ச்சியாளர்கள் புதுமையான யோசனைகளை மிகவும் எளிதாக சோதிக்க முடியும், தொழில்முனைவோர் முக்கிய AI தீர்வுகளை மிகவும் சிக்கனமாக உருவாக்க முடியும், மற்றும் பொழுதுபோக்காளர்கள் அதிநவீன தொழில்நுட்பத்தை நேரடியாக ஆராய முடியும்.
- சமூகத்தால் இயக்கப்படும் மேம்பாடு: திறந்த-எடை மாதிரிகளை மேம்படுத்துவதிலும் சிறப்பு செய்வதிலும் சமூகத்தால் இயக்கப்படும் முயற்சிகளின் வெற்றி கூட்டு வளர்ச்சியின் சக்தியை நிரூபிக்கிறது. இந்த கூட்டு நுண்ணறிவு சில நேரங்களில் குறிப்பிட்ட பணிகளுக்காக மிகவும் மூடிய பெருநிறுவன சூழல்களுக்குள் உள்ள மறு செய்கை சுழற்சிகளை மிஞ்சும்.
- ஒரு கலப்பின எதிர்காலம்?: சாத்தியமான பாதை ஒரு கலப்பின சுற்றுச்சூழல் அமைப்பை நோக்கிச் சுட்டிக்காட்டுகிறது. மாபெரும் அடித்தள மாதிரிகள் AI திறனின் முழுமையான எல்லைகளைத் தொடர்ந்து தள்ளும், தளங்களாகச் செயல்படும். அதே நேரத்தில், ஒரு மாறுபட்ட சமூகத்தால் நுண்ணிய-சரிசெய்யப்பட்ட சிறப்பு மாதிரிகளின் துடிப்பான சுற்றுச்சூழல் அமைப்பு, குறிப்பிட்ட பயன்பாடுகள் மற்றும் தொழில்களில் புதுமையை இயக்கும்.
இந்த ஜனநாயகமயமாக்கல் குறிப்பிடத்தக்க முதலீட்டின் தேவையை அகற்றாது, குறிப்பாக அடுத்த தலைமுறை அடித்தள மாதிரிகளை உருவாக்குவதில். இருப்பினும், இது புதுமை மற்றும் போட்டியின் இயக்கவியலை அடிப்படையில் மாற்றுகிறது. TinyZero திட்டம் மற்றும் பரந்த நுண்ணிய-சரிசெய்தல் இயக்கம் ஆகியவற்றால் எடுத்துக்காட்டப்பட்டபடி, ஒரு பட்ஜெட்டில் குறிப்பிடத்தக்க முடிவுகளை அடையும் திறன், செயற்கை நுண்ணறிவு மேம்பாட்டிற்கான மிகவும் அணுகக்கூடிய, திறமையான மற்றும் சாத்தியமான மிகவும் மாறுபட்ட எதிர்காலத்தை நோக்கிய மாற்றத்தைக் குறிக்கிறது. பகுத்தறிவின் ‘ஆஹா தருணம்’ இனி சிலிக்கான் கோட்டைகளுக்குள் மட்டும் அடைக்கப்படவில்லை; இது இரவு உணவின் விலையை விடக் குறைவாக அணுகக்கூடிய அனுபவமாக மாறி வருகிறது, படைப்பாற்றலைத் தூண்டுகிறது மற்றும் அடிமட்டத்திலிருந்து சாத்தியமானவற்றின் எல்லைகளைத் தள்ளுகிறது.