ஷாங்காய் கோகு டெக்னாலஜிஸ் நிறுவம், செயற்கை நுண்ணறிவு (AI) பயிற்சி முறையில் ஒரு புரட்சிகரமான அணுகுமுறையை அறிமுகப்படுத்தியுள்ளது. இது நரம்பியல் தகவல் செயலாக்க அமைப்புகளுக்கான (NeurIPS) மாநாட்டில் சமர்ப்பிக்கப்பட்டது. இந்த முறை DeepSeek மற்றும் OpenAI போன்ற முன்னணி ஆராய்ச்சி நிறுவனங்களின் AI பயிற்சி முறைகளுக்கு சவால் விடும் திறன் கொண்டது.
கோகுவின் SASR பயிற்சி கட்டமைப்பு
ஷாங்காய் கோகு டெக்னாலஜிஸ், 2015 இல் நிறுவப்பட்டது. SASR அல்லது படி-நிலை தழுவல் கலப்பின பயிற்சி (step-wise adaptive hybrid training) என்ற ஒரு புதிய AI பயிற்சி கட்டமைப்பை அறிமுகப்படுத்தியுள்ளது. மேற்பார்வையிடப்பட்ட நுண்-சரிசெய்தல் (SFT) மற்றும் வலுவூட்டல் கற்றல் (RL) போன்ற முறைகளின் வரம்புகளை இது நிவர்த்தி செய்கிறது. மனிதர்கள் பகுத்தறியும் திறன்களை வளர்ப்பதுபோல், SASR மேம்பட்ட AI மாதிரிகளை உருவாக்க ஒரு தழுவல் மற்றும் திறமையான பாதையை வழங்குகிறது என்று கோகு வாதிடுகிறது.
SFT மற்றும் RL ஆகியவை AI பயிற்சி செயல்பாட்டில் முக்கியமானவை. OpenAI மற்றும் DeepSeek போன்ற நிறுவனங்கள் இவற்றை பயன்படுத்துகின்றன. DeepSeek தனது V3 மாதிரியின் செயல்திறனை மேம்படுத்துவதில் இந்த நுட்பங்களின் முக்கியத்துவத்தை வலியுறுத்தியுள்ளது. இந்த மாதிரி டிசம்பரில் வெளியிடப்பட்டது மற்றும் தொழில்நுட்பத் துறையில் குறிப்பிடத்தக்க ஆர்வத்தைத் தூண்டியது.
ஷாங்காய் ஜியாओ டோங் பல்கலைக்கழகம் மற்றும் அதன் புதிதாக உருவாக்கப்பட்ட AI துணை நிறுவனமான ஷாங்காய் ஆல்மைண்ட் ஆர்டிபிஷியல் இன்டெலிஜென்ஸ் டெக்னாலஜியுடன் இணைந்து கோகுவின் ஆராய்ச்சியாளர்கள் எழுதிய ஆய்வறிக்கையின்படி, SASR ஆனது SFT, RL மற்றும் நிலையான கலப்பின பயிற்சி முறைகளை விட சிறந்த செயல்திறனை நிரூபிக்கிறது. “SASR, SFT, RL மற்றும் நிலையான கலப்பின பயிற்சி முறைகளை விட சிறந்தது என்று சோதனை முடிவுகள் காட்டுகின்றன,” என்று கோகு குழு தங்கள் ஆய்வறிக்கையில் கூறியுள்ளது.
கோகுவின் முன்னேற்றத்தின் தாக்கங்கள்
கோகுவின் AI பயிற்சி முறை சீனாவின் AI துறையில் தொடர்ச்சியான முன்னேற்றத்தை அடிக்கோடிட்டுக் காட்டுகிறது. வன்பொருள் கட்டுப்பாடுகள் மூலம் சீனாவின் AI முன்னேற்றத்தைத் தடுக்க அமெரிக்க அரசாங்கம் செயல்படுத்தும் தற்போதைய கொள்கைகளின் வரம்புகளை இது எடுத்துக்காட்டுகிறது. Nvidia இன் CEO Jensen Huang, இந்த கட்டுப்பாடுகளின் பயனற்ற தன்மை குறித்து சமீபத்தில் கருத்து தெரிவித்தார். “சீனாவில் உலகின் 50 சதவீத AI உருவாக்குனர்கள் உள்ளனர்” என்று அவர் கூறினார்.
ஹை-ஃப்ளையர் ஹெட்ஜ் நிதியிலிருந்து உருவான சீனாவின் AI ஸ்டார்ட்அப் நிறுவனமான DeepSeek, மேம்பட்ட algorithms மற்றும் வன்பொருள் மற்றும் மென்பொருளின் ஒருங்கிணைப்பு மூலம் சீனாவின் AI தலைமைக்கான திறனை வெளிப்படுத்தியுள்ளது.
கோகுவின் AI மூலோபாயத்தில் ஆல்மைண்டின் பங்கு
கோகுவின் ஆராய்ச்சி வெளியீட்டுடன் ஆல்மைண்ட் நிறுவப்பட்டது. இது AI ஆராய்ச்சி மற்றும் மேம்பாட்டிற்காக வளங்களை அர்ப்பணிக்கும் ஒரு மூலோபாய நகர்வை குறிக்கிறது. சீன வணிக பதிவுகளின்படி, கோகு தனது ஆராய்ச்சியை வெளியிட்ட அதே நாளில் ஆல்மைண்ட் அதிகாரப்பூர்வமாக பதிவு செய்யப்பட்டது.
கோகுவின் நிறுவனர் மற்றும் ஆல்மைண்டின் சட்டப்பூர்வ பிரதிநிதியான வாங் ஜியாओ, புதிய AI எல்லைகளை ஆராய்வதற்காகவே இந்த அமைப்பு உருவாக்கப்பட்டது என்று கூறியுள்ளார். 2023 இல் DeepSeek ஐ ஒரு தனி நிறுவனமாக நிறுவிய ஹை-ஃப்ளையரின் அணுகுமுறையை இது பிரதிபலிக்கிறது.
கடந்த ஆண்டின் இறுதியில், கோகு சுமார் 15 பில்லியன் யுவான் (சுமார் US$2.1 பில்லியன்) சொத்துக்களை நிர்வகித்தது. இது AI-உந்துதல் உத்திகளைப் பயன்படுத்தி உள்நாட்டு மற்றும் சர்வதேச சொத்துக்களை நிர்வகித்து வருகிறது என்று அதன் அதிகாரப்பூர்வ வலைத்தளத்தில் உள்ள தகவல்கள் தெரிவிக்கின்றன.
SASRஐ ஆழமாக ஆராய்தல்: ஒரு படி-நிலை தழுவல் கலப்பின பயிற்சி கட்டமைப்பு
AI மாதிரி பயிற்சியின் நிலப்பரப்பில் கோகுவின் SASR ஒரு சிறந்த மாற்றீட்டை வழங்குகிறது. அதன் சாத்தியமான தாக்கத்தை உண்மையாகப் பாராட்ட, அதன் கூறுகள் மற்றும் செயல்பாடுகளைப் பற்றி விரிவாக புரிந்து கொள்வது அவசியம்.
SASR இன் “படி-நிலை” அம்சம் பல-நிலை பயிற்சி செயல்முறையைக் குறிக்கிறது. இதில் AI மாதிரி மீண்டும் மீண்டும் செம்மைப்படுத்துதலுக்கு உட்படுகிறது. ஒவ்வொரு படியும் குறிப்பிட்ட நோக்கங்களைக் கொண்டுள்ளது மற்றும் மாதிரியில் குறிப்பிட்ட திறன்களை வளர்ப்பதற்கு தனித்துவமான பயிற்சி தரவைப் பயன்படுத்துகிறது. இந்த கட்ட அணுகுமுறை சிக்கலான மாதிரிகளை புதிதாகப் பயிற்றுவிப்பதன் சவால்களைத் தணிப்பது போன்ற நன்மைகளை வழங்குகிறது. மேலும் ஒவ்வொரு கட்டத்திலும் வடிவமைக்கப்பட்ட மேம்படுத்தலை அனுமதிக்கிறது.
“தழுவல்” உறுப்பு பயிற்சி செயல்முறை நிலையானதாக இல்லை என்பதையும் மாதிரியின் செயல்திறன் மற்றும் பண்புகளுக்கு ஏற்றவாறு மாறும் என்பதையும் குறிக்கிறது. இந்த தகவமைப்பு ஹைபர்டிராமிட்டர்களை சரிசெய்வது, பயிற்சி தரவு விநியோகத்தை மாற்றுவது அல்லது வெவ்வேறு பயிற்சி நோக்கங்களின் பங்களிப்பை மாறும் வகையில் எடைபோடுவது போன்றவற்றை உள்ளடக்கும். தழுவல் செயல்முறை AI ஐ மிகவும் திறம்பட கற்றுக் கொள்ளவும் மேம்படுத்தவும் அனுமதிக்கிறது.
SASR இன் “கலப்பின” தன்மை வெவ்வேறு பயிற்சி முறைகளின் கூறுகளை ஒருங்கிணைக்கிறது என்பதை வெளிப்படுத்துகிறது. SFT மற்றும் RL ஆகியவற்றில் பலம் மற்றும் பலவீனங்கள் இருப்பதால் இது ஒரு முக்கியமான அம்சம். முறைகளின் கலவையானது ஒவ்வொரு அணுகுமுறையின் நன்மைகளையும் பயன்படுத்தி அவற்றின் வரம்புகளை நிவர்த்தி செய்ய உதவுகிறது. இந்த மூன்று பண்புகளையும் ஒருங்கிணைப்பதன் மூலம், SARS தர்க்கம் மற்றும் பகுத்தறிவை வளர்ப்பதற்கு சிறப்பாக சரிசெய்யப்படுகிறது.
பாரம்பரிய முறைகளுடன் SASR ஐ ஒப்பிடுதல்
மேற்பார்வையிடப்பட்ட நுண்-சரிசெய்தல் (SFT) பாரம்பரியமாக ஒரு பெரிய, லேபிளிடப்பட்ட தரவுத்தொகுப்பை நம்பியுள்ளது. இதில் AI மாதிரி உள்ளீடுகளை விரும்பிய வெளியீடுகளுடன் வரைபடமாக்க கற்றுக்கொள்கிறது. வலுவூட்டல் கற்றல் (RL) ஒரு குறிப்பிட்ட நோக்கத்தை அதிகப்படுத்துவதற்காக நடவடிக்கைகளுக்கு வெகுமதி அளித்தல் அல்லது தண்டனை வழங்குதல் மூலம் முயற்சி மற்றும் பிழை மூலம் மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்குகிறது.
SASR, SFT மற்றும் RL ஆகிய முறைகளின் வரம்புகளைக் கடந்து இரண்டையும் ஒருங்கிணைக்க முயற்சிக்கிறது. உதாரணமாக, SFT லேபிளிடப்பட்ட தரவின் தரம் மற்றும் விரிவான தன்மையைப் பொறுத்தது. பல உண்மையான உலக காட்சிகளில், போதுமான, துல்லியமான தரவைப் பெறுவது நேரத்தை எடுத்துக்கொள்வதாகவும் விலை உயர்ந்ததாகவும் இருக்கும். RL, லேபிளிடப்பட்ட தரவு தேவையில்லை என்றாலும், நிலையற்றதாக இருக்கும். விரும்பத்தகாத நடத்தைகளுக்கு வழிவகுக்கும்.
கோகுவின் கட்டமைப்பு SFT மற்றும் RL ஆகியவற்றின் வரம்படுகளை சரிசெய்வதற்கான சாத்தியம் உள்ளது. நிறுவனம் வெளியிட்ட ஆய்வறிக்கையில் குறிப்பிடப்பட்டுள்ள ஆரம்ப முடிவுகளை சரிபார்க்க மேலதிக மற்றும் தொடர்ச்சியான சோதனை தேவை.
algorithm புதுமை மற்றும் வன்பொருள் தடைகள்
கோகுவின் SASR கட்டமைப்பு குறித்த செய்தி US-China தொழில்நுட்ப உறவுகளின் பின்னணியில் குறிப்பாக முக்கியத்துவம் வாய்ந்தது. சில காலமாக, அமெரிக்க அரசாங்கம் Nvidia போன்ற நிறுவனங்களிடமிருந்து மேம்பட்ட கணினி வன்பொருளுக்கான அணுகலைக் கட்டுப்படுத்துவதன் மூலம் AI துறையில் சீனாவின் வளர்ச்சியைத் தடுக்க முயன்று வருகிறது. சீனாவின் சக்திவாய்ந்த வன்பொருள் அணுகலை கட்டுப்படுத்துவது அவர்களின் AI மேம்பாட்டு முயற்சிகளை மெதுவாக்கும் என்பது இந்த கட்டுப்பாடுகளின் பின்னணியில் உள்ள எண்ணம்.
இருப்பினும், Nvidia CEO Jensen Huang கருத்துகளும், சீன AI ஆய்வகங்களில் இருந்து வெளிவரும் முன்னேற்றங்களும் இந்த கொள்கைகள் எதிர்பார்த்தபடி பயனுள்ளதாக இல்லாவிட்டால் தோன்றுகின்றன. சீனாவில் உலகின் AI உருவாக்குனர்கள் உள்ளனர் என்று Huang குறிப்பிட்டார். வன்பொருள் அணுகலைக் கட்டுப்படுத்துவது மாற்று தீர்வுகளைக் கண்டுபிடிக்க அவர்களுக்கு ஊக்கமளிக்கும் என்றும் கூறினார்.
கோகுவின் AI முன்னேற்றம், algorithm புதுமை வன்பொருள் வரம்புகளை ஈடுசெய்யும் என்று சுட்டிக்காட்டுகிறது. சீன ஆராய்ச்சியாளர்கள் மிகவும் திறமையான பயிற்சி algorithms ஐ உருவாக்க முடிந்தால், அவர்களால் சிறிய வன்பொருள்களைப் பயன்படுத்தி மேம்பட்ட AI செயல்திறனை அடைய முடியும். இது உலகளாவிய AI நிலப்பரப்பில் குறிப்பிடத்தக்க தாக்கங்களை ஏற்படுத்தும்.
வன்பொருள் பயனில்லை என்று கருதுவது தவறு. அதிநவீன AI மாதிரிகளைப் பயிற்றுவிக்க மேம்பட்ட GPU கள் இன்னும் முக்கியமானவை. சமீபத்திய வன்பொருளுக்கான அணுகல் ஒரு முக்கியமான போட்டி நன்மையை வழங்குகிறது. இருப்பினும், கோகுவின் பணி வன்பொருள் மற்றும் மென்பொருளில் முதலீடு செய்வதன் முக்கியத்துவத்தை நிரூபிக்கிறது.
சீன AI இன் உயர்வு: DeepSeek க்கு அப்பால்
AI துறையில் ஒரு முக்கிய வீரராக DeepSeek வெளிப்பட்டது ஒரு ஊக்கியாக இருந்தது. இந்த மாற்றத்தக்க தொழில்நுட்பத்தில் உலகத் தலைவராக மாறுவதற்கான சீனாவின் உறுதியை நிரூபித்தது. இருப்பினும், DeepSeek ஒரு உதாரணம் மட்டுமே. கோஸின் SASR பயிற்சி கட்டமைப்பு சீன AI செயற்கைக்கோளின் வளர்ந்து வரும் வலிமையை விளக்குகிறது.
இந்த வேகத்திற்கு பல காரணிகள் பங்களிக்கின்றன. முதலாவதாக, சீனாவிடம் ஏராளமான தரவு உள்ளது. இது AI மாதிரிகளைப் பயிற்றுவிப்பதற்கு அவசியம். பெரிய மக்கள்தொகை மற்றும் டிஜிட்டல் தொழில்நுட்பங்களை பரவலாகப் பயன்படுத்துவதால், சீன நிறுவனங்கள் தங்கள் AI algorithms ஐ உருவாக்க பயன்படுத்தும் தரவுத்தொகுப்புகளுக்கான அணுகலைப் பெற்றுள்ளன.
இரண்டாவதாக, சீனா அறிவியல் கல்விக்கு அதிக கவனம் செலுத்துகிறது. இதன் காரணமாக திறமையான பொறியாளர்கள் மற்றும் விஞ்ஞானிகள் உருவாகிறார்கள். இது AI துறையில் புதுமைகளை உருவாக்கிக்கொள்ள ஒரு திறமையான பணியாளர் கூட்டத்தை உருவாக்கியுள்ளது.
மூன்றாவதாக, சீன அரசாங்கம் AI ஐ ஒரு மூலோபாய முன்னுரிமையாக கருதி ஆராய்ச்சி மற்றும் மேம்பாட்டிற்கு கணிசமான நிதி மற்றும் ஆதரவை அளித்துள்ளது. இது AI தொடக்கங்களுக்கு ஒரு வளமான சூழலை உருவாக்கியுள்ளது. கல்வியாளர்களுக்கும் தொழில்துறைக்கும் இடையே ஒத்துழைப்பு ஊக்குவிக்கிறது.
இறுதியாக, சீன நிறுவனங்கள் புதுமைக்கு அதிக இடமளிப்பதாக கருத்துக்களை ஊக்குவிக்கின்றன. இது புதிய யோசனைகளை விரைவாக நகர்த்தவும் பரிசோதிக்கவும் அனுமதிக்கிறது.
இந்த காரணிகளின் விளைவாக, AI திறன்களில் US ஐ விட சீனா வேகமாக முன்னேறி வருகிறது. அடிப்படை ஆராய்ச்சி மற்றும் உயர்நிலை வன்பொருள் போன்ற சில பகுதிகளில் US இன்னும் ஒரு முன்னணி இடத்தில் இருந்தாலும், கணினி பார்வை, இயற்கை மொழி செயலாக்கம் மற்றும் ரோபாட்டிக்ஸ் போன்ற பகுதிகளில் சீனா குறிப்பிடத்தக்க முன்னேற்றம் அடைந்து வருகிறது.
கோகு மற்றும் DeepSeek போன்ற நிறுவனங்களின் வெளிப்பாடு எதிர்வரும் ஆண்டுகளில் AI துறையில் சீனா தனது முன்னேற்றத்தை தொடர வாய்ப்புள்ளதாக கருதுகிறோம்.
ஷாங்காய் கோகு டெக்னாலஜிஸ்: புதுமைக்கு காரணமான நிறுவனம்
ஷாங்காய் கோகு டெக்னாலஜிஸ் என்பது 2015 இல் நிறுவப்பட்ட ஒரு அளவுசார் வர்த்தக நிதி நிறுவனம் ஆகும். இது AI-உந்துதல் உத்திகளைப் பயன்படுத்தி குறிப்பிடத்தக்க சொத்துக்களை நிர்வகிக்கிறது. தொழில்நுட்பம் மற்றும் அடிப்படை பகுப்பாய்வை இணைத்து தனது வாடிக்கையாளர்களுக்கு சிறந்த வருவாயை வழங்குவதே இந்நிறுவனத்தின் நோக்கம். சொத்து மேலாண்மையில் அதன் முக்கிய வணிகத்திற்கு கூடுதலாக, AI ஆராய்ச்சியின் எல்லைகளைத் தாண்டிச் செல்வதில் கோகு அர்ப்பணிப்பை வெளிப்படுத்தியுள்ளது. ஆல்மைண்ட் ஆர்டிபிஷியல் இன்டெலிஜென்ஸ் டெக்னாலஜி, AI துணை நிறுவனம், அதன் AI ஆராய்ச்சி முயற்சிகளை முறைப்படுத்தவும் துரிதப்படுத்தவும் ஒரு மூலோபாய நகர்வை பிரதிபலிக்கிறது.
நிறுவனத்தின் உள் கட்டமைப்பு மற்றும் இயக்கவியல் பற்றிய விவரங்கள் ஒப்பீட்டளவில் குறைவாகவே உள்ளன. நிறுவனம் வெளியிட்டுள்ள தகவல்கள் மற்றும் சமீபத்திய நடவடிக்கைகள் ஒரு நுண்ணறிவாக இருக்கும் என்று நம்புகிறோம். நிறுவனத்தின் குறிக்கோள், “தர்க்கமும் உண்மையுமே நாங்கள் கீழ்ப்படியும் ஒரே கொள்கைகள்” என்பது தரவு சார்ந்த மற்றும் பகுப்பாய்வு கலாச்சாரத்தை பிரதிபலிக்கிறது. AI ஆராய்ச்சி மற்றும் மேம்பாட்டில் முதலீடு செய்வது ஒரு நீண்ட கால பார்வையை குறிக்கிறது மற்றும் நிதித் துறையில் மட்டுமல்ல, பல்வேறு தொழில்களிலும் AI இன் மாற்றும் திறனை பற்றிய விழிப்புணர்வை காட்டுகிறது. AI ஆராய்ச்சியிலிருந்து கிடைக்கும் நுண்ணறிவுகளைப் பயன்படுத்தி தனது வர்த்தக உத்திகளை மேம்படுத்தவும் சந்தையில் ஒரு போட்டி நன்மையை பெறவும் கோகு திட்டமிட்டுள்ளது.