உலகளாவிய AI வன்பொருள் பந்தயத்தில் உயர்ந்த பங்குகள்
செயற்கை நுண்ணறிவு (AI) வளர்ச்சியின் நிலப்பரப்பு, அல்காரிதம் திருப்புமுனைகளால் மட்டுமல்ல, பெரிய மாதிரிகளைப் பயிற்றுவிக்கவும் இயக்கவும் தேவைப்படும் அதிநவீன வன்பொருளுக்கான அணுகலால் மேலும் மேலும் வரையறுக்கப்படுகிறது. இந்த வன்பொருள் சமன்பாட்டின் மையத்தில் கிராபிக்ஸ் செயலாக்க அலகு (GPU) உள்ளது, இது ஆரம்பத்தில் படங்களை வழங்குவதற்காக வடிவமைக்கப்பட்ட ஒரு கூறு ஆகும், ஆனால் இப்போது AI-யின் இணை செயலாக்கத் தேவைகளுக்கு இன்றியமையாததாக உள்ளது. பல ஆண்டுகளாக, Nvidia கார்ப்பரேஷன் இந்த அரங்கில் மறுக்கமுடியாத ஜாம்பவானாக நிற்கிறது, அதன் மேம்பட்ட GPU-க்கள் தங்கத் தரமாக மாறி, Silicon Valley மற்றும் அதற்கு அப்பால் புதுமைகளை இயக்குகின்றன. இருப்பினும், இந்த ஆதிக்கம் நிறுவனத்தையும், அதன் வாடிக்கையாளர்களையும் நேரடியாக புவிசார் அரசியல் பதட்டங்களின் குறுக்கு வழியில் வைத்துள்ளது.
சீனாவின் அதிநவீன குறைக்கடத்தி தொழில்நுட்பத்திற்கான அணுகலைக் கட்டுப்படுத்தும் நோக்கில் Washington-இன் கடுமையான ஏற்றுமதி கட்டுப்பாடுகளை விதிப்பது சந்தையை அடிப்படையில் மறுவடிவமைத்துள்ளது. இந்த கட்டுப்பாடுகள் குறிப்பாக Nvidia தயாரித்தவை போன்ற உயர் செயல்திறன் கொண்ட GPU-க்களை குறிவைக்கின்றன, அவை சாத்தியமான இராணுவ பயன்பாடுகள் உட்பட மேம்பட்ட AI பயன்பாடுகளுக்கு முக்கியமானதாகக் கருதப்படுகின்றன. உடனடி விளைவு சீனாவின் வளர்ந்து வரும் தொழில்நுட்பத் துறைக்குள் ஒரு குழப்பமாக இருந்தது. AI-யில் பெரிதும் முதலீடு செய்த நிறுவனங்கள், நிறுவப்பட்ட ஜாம்பவான்கள் முதல் லட்சிய தொடக்க நிறுவனங்கள் வரை, தொழில்நுட்ப முன்னேற்றத்தின் அடுத்த அலையை இயக்கும் அத்தியாவசிய கருவிகளிலிருந்து துண்டிக்கப்படும் திடீர் வாய்ப்பை எதிர்கொண்டன. இது ஒரு அவசரத் தேவையை உருவாக்கியது: சாத்தியமான மாற்றுகளைக் கண்டறியவும் அல்லது உலகளவில் போட்டித் துறையில் பின்தங்கும் அபாயத்தை எதிர்கொள்ளவும். சவால் வெறுமனே ஒரு சிப்பை மற்றொன்றால் மாற்றுவது பற்றியது அல்ல; இது செயல்திறன் வேறுபாடுகள், மென்பொருள் பொருந்தக்கூடிய சிக்கல்கள் மற்றும் நூற்றுக்கணக்கான பில்லியன் அல்லது டிரில்லியன் கணக்கான அளவுருக்களைக் கொண்ட மாதிரிகளைப் பயிற்றுவிப்பதற்குத் தேவையான அளவிலான சிக்கலான வலையமைப்பில் பயணிப்பதை உள்ளடக்கியது.
Ant குழுமம் கணினி சுதந்திரத்தை நோக்கிய ஒரு பாதையை வகுக்கிறது
வழங்கல் சங்கிலி நிச்சயமற்ற தன்மை மற்றும் தீவிரமடைந்து வரும் தொழில்நுட்ப போட்டி ஆகியவற்றின் பின்னணியில், Alibaba குழும ஹோல்டிங்குடன் இணைந்த fintech ஜாம்பவானான Ant குழுமம், அதிக கணினி தன்னிறைவை நோக்கிய ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தை சமிக்ஞை செய்துள்ளது. நிறுவனத்தின் Ling குழு - அதன் பெரிய மொழி மாதிரி (LLM) முயற்சிகளை முன்னெடுக்கும் பிரிவு - ஒரு ஆராய்ச்சித் தாளில் விவரிக்கப்பட்டுள்ள சமீபத்திய வெளிப்பாடுகள், Nvidia-மையப்படுத்தப்பட்ட பாதையிலிருந்து வெற்றிகரமான விலகலைக் குறிக்கின்றன. இந்த சாதனையின் மையமானது உள்நாட்டில் தயாரிக்கப்பட்ட GPU-க்களைப் பயன்படுத்தி ஒரு அதிநவீன AI மாதிரியை திறம்பட பயிற்றுவிக்கும் திறனில் உள்ளது.
கேள்விக்குரிய மாதிரி, Ling-Plus-Base என்று பெயரிடப்பட்டது, இது ஒரு இலகுரக மாதிரி அல்ல. இது Mixture-of-Experts (MoE) கட்டமைப்பைப் பயன்படுத்தி வடிவமைக்கப்பட்டுள்ளது, இது LLM-களை அளவிடுவதில் அதன் செயல்திறனுக்காக இழுவைப் பெறும் ஒரு நுட்பமாகும். கணிசமான 300 பில்லியன் அளவுருக்களைக் கொண்ட Ling-Plus-Base, மற்ற முக்கிய உலகளாவிய மாதிரிகளுடன் ஒப்பிடக்கூடிய ஒரு லீக்கில் செயல்படுகிறது. இருப்பினும், முக்கியமான வேறுபாடு அதன் பயிற்சியின் அடிப்படையிலான வன்பொருள் ஆகும். ஆராய்ச்சி கண்டுபிடிப்புகளின்படி, இந்த சக்திவாய்ந்த மாதிரியை குழு “குறைந்த செயல்திறன் கொண்ட சாதனங்கள்” என்று விவரிக்கும் ஒன்றில் முதிர்ச்சியடையச் செய்ய முடியும். கவனமாக தேர்ந்தெடுக்கப்பட்ட இந்த சொற்றொடர், அமெரிக்க ஏற்றுமதி கட்டுப்பாடுகளின் எல்லைக்கு வெளியே வரும் செயலாக்க அலகுகளின் பயன்பாட்டை நேரடியாக சுட்டிக்காட்டுகிறது, இது சீனாவிற்குள் வடிவமைக்கப்பட்டு தயாரிக்கப்பட்ட சிப்களின் பயன்பாட்டை வலுவாகக் குறிக்கிறது.
இந்த வளர்ச்சி ஒரு தொழில்நுட்பத் தீர்வு மட்டுமல்ல; இது ஒரு சாத்தியமான மூலோபாய மாற்றத்தைக் குறிக்கிறது. மிக உயர்ந்த அடுக்கு, கட்டுப்படுத்தப்பட்ட வெளிநாட்டு வன்பொருளை பிரத்தியேகமாக நம்பாமல் அதிநவீன மாதிரிகளைப் பயிற்றுவிக்கும் திறனை நிரூபிப்பதன் மூலம், Ant குழுமம் விநியோகச் சங்கிலி அபாயங்களைக் குறைப்பது மட்டுமல்லாமல், குறிப்பிடத்தக்க செலவுத் திறன்களையும் திறக்கக்கூடும்.
பொருளாதார சமன்பாடு: பயிற்சி செலவுகளைக் குறைத்தல்
Ling குழுவின் ஆராய்ச்சியிலிருந்து வெளிவரும் மிகவும் அழுத்தமான புள்ளிவிவரங்களில் ஒன்று, Ling-Plus-Base மாதிரியின் முக்கியமான முன்-பயிற்சி கட்டத்தில் கணினி செலவுகளில் 20 சதவீதம் குறைப்பு பதிவாகியுள்ளது. முன்-பயிற்சி என்பது வள-செறிவானது, மொழி வடிவங்கள், சூழல் மற்றும் அறிவைக் கற்றுக்கொள்ள மாதிரிக்கு பரந்த தரவுத்தொகுப்புகளை ஊட்டுவதை உள்ளடக்கியது. இது அடித்தள LLM-களை உருவாக்குவதோடு தொடர்புடைய ஒட்டுமொத்த செலவின் பெரும்பகுதியைக் கொண்டுள்ளது. எனவே, இந்த கட்டத்தில் ஐந்தில் ஒரு பங்கு செலவுக் குறைப்பை அடைவது கணிசமான சேமிப்பாக மொழிபெயர்க்கிறது, இது மேலும் ஆராய்ச்சி, மேம்பாடு அல்லது பெரிய அளவில் வரிசைப்படுத்துவதற்கான மூலதனத்தை விடுவிக்கக்கூடும்.
இந்த செலவு சேமிப்பு எவ்வாறு அடையப்படுகிறது? தாள் சரியான செலவு முறிவை விவரிக்கவில்லை என்றாலும், பல காரணிகள் பங்களிக்கக்கூடும்:
- வன்பொருள் கொள்முதல்: உள்நாட்டில் தயாரிக்கப்பட்ட GPU-க்கள், Nvidia-வின் சிறந்த சலுகைகளை விட தனித்தனியாக சக்தி குறைவாக இருந்தாலும், குறைந்த கொள்முதல் விலையில் வரலாம் அல்லது சீன சந்தையில் மிகவும் சாதகமான மொத்த தள்ளுபடிகளை வழங்கலாம், குறிப்பாக உயர்நிலை Nvidia சிப்களின் கட்டுப்படுத்தப்பட்ட விநியோகத்தைக் கருத்தில் கொண்டு.
- ஆற்றல் திறன்: வெளிப்படையாகக் கூறப்படவில்லை என்றாலும், சாத்தியமான குறைந்த சக்தி-பசி (ஒரு யூனிட்டுக்கு குறைந்த செயல்திறன் கொண்டதாக இருந்தாலும்) உள்நாட்டு சிப்களுக்கான பயிற்சியை மேம்படுத்துவது குறைந்த செயல்பாட்டு ஆற்றல் செலவுகளுக்கு பங்களிக்கக்கூடும், இது பெரிய தரவு மையங்களை இயக்குவதில் ஒரு குறிப்பிடத்தக்க காரணியாகும்.
- அல்காரிதம் மற்றும் கட்டமைப்பு மேம்படுத்தல்: MoE கட்டமைப்பின் பயன்பாடு முக்கியமானது. MoE மாதிரிகள் ஒரு குறிப்பிட்ட உள்ளீட்டிற்கு குறிப்பிட்ட ‘நிபுணர்’ துணை நெட்வொர்க்குகளை மட்டுமே செயல்படுத்துகின்றன, அடர்த்தியான கட்டமைப்புகளைப் போல முழு மாதிரியையும் ஈடுபடுத்துவதற்குப் பதிலாக. இந்த உள்ளார்ந்த அடர்த்தி குறைவு பயிற்சி மற்றும் அனுமானம் இரண்டின் போதும் கணக்கீட்டுச் சுமையை கணிசமாகக் குறைக்கும், இது ஒரு சிப்பிற்கு குறைந்த மூல செயலாக்க சக்தி இருந்தாலும் கூட நல்ல முடிவுகளை அடைய சாத்தியமாக்குகிறது. Ant-இன் வெற்றி, கிடைக்கக்கூடிய உள்நாட்டு வன்பொருளின் செயல்திறனை அதிகரிக்க அதிநவீன மென்பொருள் மற்றும் அல்காரிதம் சரிசெய்தலைக் குறிக்கிறது.
இந்த செலவுக் குறைப்பு வெறுமனே ஒரு கணக்கியல் நன்மை அல்ல; இது பெரிய அளவிலான மாதிரிகளை உருவாக்குவதற்கான நுழைவுத் தடையைக் குறைக்கிறது மற்றும் நிறுவனத்திற்குள் AI புதுமையின் வேகத்தை துரிதப்படுத்தக்கூடும், மேலும் முறைகள் பிரதிபலிக்கக்கூடியதாக நிரூபிக்கப்பட்டால் பரந்த சீன தொழில்நுட்ப சுற்றுச்சூழல் அமைப்பிலும் கூட.
செயல்திறன் சமநிலை: வன்பொருள் இடைவெளியைக் குறைப்பதா?
செலவு சேமிப்பு கவர்ச்சிகரமானது, ஆனால் இதன் விளைவாக வரும் AI மாதிரி கணிசமாக குறைந்த செயல்திறன் கொண்டதாக இருந்தால் அவை அர்த்தமற்றவை. Ant-இன் Ling குழு இதை நேரடியாகக் குறிப்பிடுகிறது, Ling-Plus-Base துறையில் உள்ள மற்ற நன்கு மதிக்கப்படும் மாதிரிகளுடன் ஒப்பிடக்கூடிய செயல்திறனை அடைகிறது என்று வலியுறுத்துகிறது. குறிப்பாக, அவர்கள் தங்கள் படைப்பை Qwen2.5-72B-Instruct (தாய் நிறுவனமான Alibaba-வால் உருவாக்கப்பட்டது) மற்றும் DeepSeek-V2.5-1210-Chat, மற்றொரு முக்கிய சீன LLM போன்ற மாதிரிகளுக்கு எதிராக தரப்படுத்தினர்.
“குறைந்த செயல்திறன் கொண்ட சாதனங்களை” பயன்படுத்திய போதிலும் “ஒப்பிடக்கூடிய செயல்திறன்” என்ற கூற்று குறிப்பிடத்தக்கது. இது Ant மூல கணக்கீட்டுப் பற்றாக்குறையை ஈடுசெய்ய பயனுள்ள வழிகளைக் கண்டறிந்துள்ளது என்பதைக் குறிக்கிறது:
- மேம்பட்ட மாதிரி கட்டமைப்பு: MoE வடிவமைப்பு இங்கு கருவியாக உள்ளது, பணிச்சுமையை திறமையாக விநியோகிக்கிறது.
- மென்பொருள் மேம்படுத்தல்: பயன்படுத்தப்படும் உள்நாட்டு GPU-களின் கட்டமைப்பிற்காக பயிற்சி மென்பொருள் அடுக்கை (இணைப்படுத்தல் கட்டமைப்புகள் மற்றும் எண் நூலகங்கள் போன்றவை) குறிப்பாக வடிவமைப்பது முக்கியமானது. இது பெரும்பாலும் குறிப்பிடத்தக்க பொறியியல் முயற்சியை உள்ளடக்கியது.
- தரவு க்யூரேஷன் மற்றும் பயிற்சி நுட்பங்கள்: பயிற்சித் தரவைத் தேர்ந்தெடுப்பதற்கும் பயிற்சி செயல்முறையைச் செம்மைப்படுத்துவதற்கும் அதிநவீன முறைகள் இறுதி மாதிரி தரத்தை கணிசமாக பாதிக்கலாம், சில சமயங்களில் வன்பொருள் வரம்புகளை ஈடுசெய்யும்.
செயல்திறன் உரிமைகோரல்களை நுணுக்கத்துடன் அணுகுவது முக்கியம். “ஒப்பிடக்கூடியது” என்பது பல்வேறு தரநிலைகளில் (எ.கா., மொழி புரிதல், பகுத்தறிவு, உருவாக்கம், குறியீட்டு முறை) பலவிதமான விளைவுகளை உள்ளடக்கும். பல தரப்படுத்தப்பட்ட சோதனைகளில் விரிவான பெஞ்ச்மார்க் முடிவுகளுக்கான அணுகல் இல்லாமல், ஒரு துல்லியமான ஒப்பீடு சவாலாக உள்ளது. இருப்பினும், இந்த கூற்று Ant-இன் அணுகுமுறை செலவு/அணுகல் மற்றும் திறனுக்கு இடையில் ஒரு முடக்கும் வர்த்தகத்தை அவசியமாக்காது என்ற அதன் நம்பிக்கையை சமிக்ஞை செய்கிறது. வன்பொருள் கட்டுப்பாடுகளால் விதிக்கப்பட்ட கட்டுப்பாடுகளுக்குள் கூட போட்டித்தன்மையை பராமரிப்பதற்கான ஒரு பாதையை இது நிரூபிக்கிறது.
ஆராய்ச்சியாளர்களே பரந்த தாக்கங்களை முன்னிலைப்படுத்தினர்: “இந்த முடிவுகள் குறைந்த சக்திவாய்ந்த வன்பொருளில் அதிநவீன பெரிய அளவிலான MoE மாதிரிகளைப் பயிற்றுவிப்பதற்கான சாத்தியக்கூறுகளை நிரூபிக்கின்றன, இது கணினி வளத் தேர்வைப் பொறுத்து அடித்தள மாதிரி மேம்பாட்டிற்கு மிகவும் நெகிழ்வான மற்றும் செலவு குறைந்த அணுகுமுறையை செயல்படுத்துகிறது.” இது ஒரு வகையான ஜனநாயகமயமாக்கலை நோக்கி சுட்டிக்காட்டுகிறது, செயலாக்க சக்தியின் முழுமையான உச்சத்திற்கான அணுகல் குறைவாக இருக்கும்போது கூட அதிநவீன AI வளர்ச்சியைத் தொடர அனுமதிக்கிறது.
Mixture-of-Experts (MoE) நன்மையைப் புரிந்துகொள்வது
Mixture-of-Experts கட்டமைப்பு Ant குழுமத்தின் அறிவிக்கப்பட்ட வெற்றிக்கு மையமானது. இது பாரம்பரிய “அடர்த்தியான” நரம்பியல் நெட்வொர்க் மாதிரிகளிலிருந்து ஒரு விலகலைக் குறிக்கிறது, அங்கு ஒவ்வொரு உள்ளீடும் ஒவ்வொரு அளவுருவையும் செயல்படுத்துகிறது. ஒரு MoE மாதிரியில்:
- மாதிரி பல சிறிய, சிறப்பு வாய்ந்த “நிபுணர்” நெட்வொர்க்குகளால் ஆனது.
- ஒரு “கேட்டிங் நெட்வொர்க்” அல்லது “ரூட்டர்” பொறிமுறையானது உள்வரும் தரவை (LLM-களின் விஷயத்தில் டோக்கன்கள்) செயலாக்கத்திற்கு மிகவும் பொருத்தமான நிபுணர்(களு)க்கு அனுப்ப கற்றுக்கொள்கிறது.
- தேர்ந்தெடுக்கப்பட்ட நிபுணர்(கள்) மட்டுமே - பெரும்பாலும் நூற்றுக்கணக்கானவற்றில் ஒன்று அல்லது இரண்டு - அந்த குறிப்பிட்ட தரவுத் துண்டுக்கான கணக்கீடுகளைச் செய்கிறார்கள்.
இந்த அணுகுமுறை பல முக்கிய நன்மைகளை வழங்குகிறது, குறிப்பாக வன்பொருள் கட்டுப்பாடுகளின் சூழலில் பொருத்தமானது:
- அளவிடுதல்: MoE மாதிரிகள் அனுமானத்தின் போது அல்லது பயிற்சி படிகளின் போது கூட ஒவ்வொரு உள்ளீட்டு டோக்கனையும் செயலாக்குவதற்கான கணக்கீட்டு செலவில் விகிதாசார அதிகரிப்பு இல்லாமல் மிகப்பெரிய அளவுரு எண்ணிக்கைகளுக்கு (டிரில்லியன்கள் சாத்தியமாகி வருகின்றன) வளர அனுமதிக்கிறது. ஏனென்றால், மொத்த அளவுருக்களில் ஒரு பகுதி மட்டுமே எந்த நேரத்திலும் செயலில் இருக்கும்.
- பயிற்சி திறன்: MoE மாதிரிகளைப் பயிற்றுவிப்பது அதன் சொந்த சிக்கல்களைக் கொண்டிருந்தாலும் (நிபுணர்களிடையே சுமை சமநிலைப்படுத்துதல் போன்றவை), ஒரு டோக்கனுக்கு குறைக்கப்பட்ட கணக்கீடு வேகமான பயிற்சி நேரங்களாக மொழிபெயர்க்கலாம் அல்லது, Ant நிரூபிப்பது போல, நியாயமான காலக்கெடுவிற்குள் குறைந்த சக்திவாய்ந்த வன்பொருளில் திறம்பட பயிற்சி அளிக்கும் திறன்.
- சிறப்புத்தன்மை: ஒவ்வொரு நிபுணரும் வெவ்வேறு வகையான தரவு, பணிகள் அல்லது அறிவு களங்களில் நிபுணத்துவம் பெறலாம், இது குறிப்பிட்ட பகுதிகளில் உயர்தர வெளியீடுகளுக்கு வழிவகுக்கும்.
Google (GShard, Switch Transformer), Mistral AI (Mixtral மாதிரிகள்) உட்பட உலகெங்கிலும் உள்ள முன்னணி AI ஆய்வகங்கள் MoE-ஐ ஏற்றுக்கொண்டன, மேலும் சீனாவிற்குள், DeepSeek மற்றும் Alibaba (அதன் Qwen மாதிரிகள் MoE கூறுகளை உள்ளடக்கியது) போன்ற நிறுவனங்கள். Ant-இன் Ling-Plus-Base, வன்பொருள் யதார்த்தங்களை வழிநடத்த கட்டமைப்பு புதுமைகளைப் பயன்படுத்தி, இந்த முன்னணிக்குள் உறுதியாக வைக்கிறது.
உள்நாட்டு வன்பொருள் சுற்றுச்சூழல் அமைப்பு: Nvidia வெற்றிடத்தை நிரப்புதல்
Ant ஆராய்ச்சித் தாள் பயன்படுத்தப்பட்ட வன்பொருளை வெளிப்படையாகப் பெயரிடுவதைத் தவிர்த்தாலும், Bloomberg-ஆல் குறிப்பிடத்தக்க வகையில் அடுத்தடுத்த அறிக்கையிடல், இந்த சாதனை உள்நாட்டில் வடிவமைக்கப்பட்ட சிப்களை உள்ளடக்கியது என்பதைக் குறித்தது. இது Ant-இன் இணை நிறுவனமான Alibaba-விலிருந்து உருவாகக்கூடிய செயலிகளை உள்ளடக்கியது, இது அதன் சொந்த சிப் வடிவமைப்பு பிரிவு T-Head-ஐக் கொண்டுள்ளது (Yitian 710 போன்ற CPU-க்களை உற்பத்தி செய்கிறது மற்றும் முன்பு AI முடுக்கிகளை ஆராய்ந்தது), மற்றும் முக்கியமாக, Huawei Technologies.
Huawei, தீவிரமான அமெரிக்கத் தடைகளை எதிர்கொண்ட போதிலும், சீன சந்தையில் Nvidia-வின் சலுகைகளுக்கு நேரடி மாற்றாக அதன் Ascend தொடர் AI முடுக்கிகளை (Ascend 910B போன்றவை) தீவிரமாக உருவாக்கி வருகிறது. இந்த சிப்கள் முக்கிய சீன தொழில்நுட்ப நிறுவனங்களால் ஏற்றுக்கொள்ளப்படுவதாகக் கூறப்படுகிறது. Ling-Plus-Base போன்ற பெரிய மாதிரிக்கு அத்தகைய வன்பொருளை திறம்பட பயன்படுத்த Ant குழுமத்தின் திறன் இந்த உள்நாட்டு மாற்றுகளுக்கு ஒரு குறிப்பிடத்தக்க சரிபார்ப்பைக் குறிக்கும்.
Ant குழுமம் Nvidia-வை முழுவதுமாக கைவிடவில்லை என்பதைக் கவனத்தில் கொள்ள வேண்டியது அவசியம். Nvidia சிப்கள் Ant-இன் AI மேம்பாட்டுக் கருவித்தொகுப்பின் ஒரு பகுதியாக இருப்பதாக அறிக்கைகள் தெரிவிக்கின்றன, அவற்றின் குறிப்பிட்ட செயல்திறன் பண்புகள் அல்லது முதிர்ந்த மென்பொருள் சுற்றுச்சூழல் அமைப்பு (CUDA போன்றவை) நன்மைகளை வழங்கும் பணிகளுக்கு அல்லது மரபு அமைப்புகளுக்குப் பயன்படுத்தப்படலாம். இந்த நடவடிக்கை ஒரே இரவில் முழுமையான மாற்றத்தைப் பற்றியது அல்ல, மாறாக மூலோபாய பாதிப்பைக் குறைக்கும் மற்றும் செலவுகளைக் கட்டுப்படுத்தும் சாத்தியமான, இணையான பாதைகளை உருவாக்குவது பற்றியது. இந்த கலப்பின அணுகுமுறை நிறுவனம் சுதந்திரத்தை வளர்க்கும் அதே வேளையில் சிறந்த கருவிகளைப் பயன்படுத்த அனுமதிக்கிறது. Ant குழுமம் பயன்படுத்தப்பட்ட குறிப்பிட்ட சிப்கள் குறித்து அதிகாரப்பூர்வமாக கருத்து தெரிவிக்க மறுத்து, ஒரு குறிப்பிட்ட அளவு கார்ப்பரேட் விவேகத்தை பராமரித்தது.
ஒரு பரந்த போக்கு: AI தன்னம்பிக்கைக்கான சீனாவின் கூட்டு முயற்சி
Ant குழுமத்தின் முயற்சி தனிமையில் நடக்கவில்லை. இது அமெரிக்க ஏற்றுமதி கட்டுப்பாடுகளால் விதிக்கப்பட்ட வரம்புகளைச் சுற்றி புதுமைப்பிப்பதற்காக சீனாவின் தொழில்நுட்பத் துறை முழுவதும் ஒரு பரந்த மூலோபாய உந்துதலைப் பிரதிபலிக்கிறது. “தொழில்நுட்பப் போர்” முக்கியமான தொழில்நுட்பங்களில், குறிப்பாக குறைக்கடத்திகள் மற்றும் AI-யில் அதிக தன்னிறைவை அடைவதற்கான முயற்சிகளைத் தூண்டியுள்ளது.
மற்ற முக்கிய வீரர்கள் இதே போன்ற இலக்குகளைப் பின்தொடர்கின்றனர்:
- ByteDance: TikTok-இன் தாய் நிறுவனமும், பரிந்துரை அல்காரிதம்கள், உருவாக்கும் AI மற்றும் பலவற்றை உள்ளடக்கிய அதன் AI லட்சியங்களுக்காக, உள்நாட்டு விருப்பங்கள் உட்பட மாற்று சிப்களைப் பாதுகாக்கவும் பயன்படுத்தவும் செயல்படுவதாகக் கூறப்படுகிறது.
- DeepSeek: இந்த AI ஸ்டார்ட்-அப், அதன் சக்திவாய்ந்த திறந்த மூல மாதிரிகளுக்கு பெயர் பெற்றது, பயிற்சித் திறனைக் குறிப்பிடுகிறது மற்றும் MoE கட்டமைப்பைப் பயன்படுத்தி மாதிரிகளை உருவாக்கியுள்ளது, இது மிகவும் சக்திவாய்ந்த GPU-களின் பரந்த கடற்படைகளை மட்டுமே சார்ந்து இல்லாத உத்திகளுடன் ஒத்துப்போகிறது.
- Baidu, Tencent, மற்றும் பிற: அனைத்து முக்கிய சீன கிளவுட் மற்றும் தொழில்நுட்ப நிறுவனங்களும் AI-யில் பெரிதும் முதலீடு செய்கின்றன மற்றும் தவிர்க்க முடியாமல் வன்பொருள் பல்வகைப்படுத்தல் உத்திகளை ஆராய்ந்து வருகின்றன, இதில் உள்நாட்டு சிப்களுக்கான மேம்படுத்தல் மற்றும் அவற்றின் சொந்த தனிப்பயன் சிலிக்கானை உருவாக்குதல் ஆகியவை அடங்கும்.
கூட்டுச் செய்தி தெளிவாக உள்ளது: Nvidia-வின் உயர்மட்ட தயாரிப்புகளுக்கான அணுகல் விரும்பத்தக்கதாக இருந்தாலும், சீன தொழில்நுட்பத் துறை மாற்று தீர்வுகளை தீவிரமாக உருவாக்கி சரிபார்க்கிறது. இது ஒரு பன்முனை அணுகுமுறையை உள்ளடக்கியது: MoE போன்ற திறமையான மாதிரி கட்டமைப்புகளைத் தழுவுதல், வெவ்வேறு வன்பொருள் பின்தளங்களுக்கான தீவிர மென்பொருள் மேம்படுத்தல், மற்றும் உள்நாட்டில் தயாரிக்கப்பட்ட சிப்களின் வளர்ச்சி மற்றும் தத்தெடுப்பை ஆதரித்தல்.
மொழி மாதிரிகளுக்கு அப்பால்: சுகாதாரத்துறையில் Ant-இன் AI விரிவாக்கம்
Ant குழுமத்தின் AI முயற்சிகள் அடித்தள LLM-களுக்கு அப்பால் நீண்டுள்ளன. அதன் பயிற்சித் திறன்கள் பற்றிய செய்தியுடன் ஒரே நேரத்தில், நிறுவனம் சுகாதாரத் துறைக்கு ஏற்றவாறு அதன் AI தீர்வுகள் தொகுப்பிற்கு குறிப்பிடத்தக்க மேம்படுத்தல்களை வெளியிட்டது. இந்த முயற்சி ஒரு தனித்துவமான, சுயமாக உருவாக்கப்பட்ட சுகாதாரம் சார்ந்த AI மாதிரியைப் பயன்படுத்துகிறது.
மேம்படுத்தப்பட்ட தீர்வுகள் மல்டிமாடல் திறன்கள் (உரை, படங்கள் மற்றும் பிற மருத்துவத் தரவு போன்ற பல்வேறு தரவு வகைகளைச் செயலாக்குதல்) மற்றும் அதிநவீன மருத்துவ பகுத்தறிவு ஆகியவற்றைக் கொண்டுள்ளன. இவை Ant “ஆல்-இன்-ஒன் மெஷின்கள்” என்று விவரிக்கும் ஒன்றில் ஒருங்கிணைக்கப்பட்டுள்ளன, இது மருத்துவ அமைப்புகள் அல்லது சுகாதார மேலாண்மைக்காக வடிவமைக்கப்பட்ட சாதனங்கள் அல்லது தளங்களாக இருக்கலாம்.
Ling-Plus-Base LLM செய்தியிலிருந்து தனித்தனியாகத் தோன்றினாலும், ஒரு சாத்தியமான அடிப்படை இணைப்பு உள்ளது. உள்நாட்டு விருப்பங்கள் உட்பட வன்பொருளின் கலவையைப் பயன்படுத்தி, மிகவும் செலவு குறைந்த முறையில் சக்திவாய்ந்த AI மாதிரிகளைப் பயிற்றுவிக்கும் திறன், சுகாதாரம் போன்ற துறைகளுக்கான சிறப்பு மாதிரிகளை உருவாக்குவதற்கும் வரிசைப்படுத்துவதற்கும் பொருளாதார நம்பகத்தன்மையை ஆதரிக்கக்கூடும். AI வளர்ச்சியின் அடித்தளச் செலவுகளைக் குறைப்பது, வளங்களை கள-குறிப்பிட்ட பயன்பாடுகளுக்கு அனுப்ப அனுமதிக்கிறது, இது முக்கியமான தொழில்களில் நடைமுறை AI கருவிகளின் வெளியீட்டை துரிதப்படுத்தக்கூடும். இந்த சுகாதார உந்துதல் Ant-இன் AI நிபுணத்துவத்தை அதன் fintech வேர்களுக்கு அப்பால் விரிவாகப் பயன்படுத்துவதற்கான லட்சியத்தை அடிக்கோடிட்டுக் காட்டுகிறது.
எதிர்காலத்திற்கான தாக்கங்கள்: AI பாதையில் ஒரு பிளவு?
Ant குழுமம் Nvidia அல்லாத, பெரும்பாலும் உள்நாட்டு, GPU-க்களைப் பயன்படுத்தி ஒரு பெரிய அளவிலான MoE மாதிரியை வெற்றிகரமாகப் பயிற்றுவித்தது குறிப்பிடத்தக்க தாக்கங்களைக் கொண்டுள்ளது:
- உள்நாட்டு சிப்களுக்கான சரிபார்ப்பு: இது Huawei-இன் Ascend போன்ற சீன-வடிவமைக்கப்பட்ட AI முடுக்கிகளின் நம்பகத்தன்மைக்கு ஒரு முக்கியமான ஆதாரமாக செயல்படுகிறது, இது சீனாவிற்குள் அவற்றின் தத்தெடுப்பை அதிகரிக்கக்கூடும்.
- போட்டி நிலப்பரப்பு: கட்டுப்பாடுகள் இருந்தபோதிலும், கட்டமைப்பு மற்றும் மென்பொருள் புதுமைகளைப் பயன்படுத்தி, சீன நிறுவனங்கள் அதிநவீன AI வளர்ச்சியில் போட்டித்தன்மையுடன் இருக்க முடியும் என்பதை இது நிரூபிக்கிறது.
- செலவு இயக்கவியல்: 20% செலவுக் குறைப்பு, மாற்று வன்பொருளை திறம்பட பயன்படுத்தக்கூடிய நிறுவனங்களுக்கு ஒரு சாத்தியமான போட்டி நன்மையை எடுத்துக்காட்டுகிறது, இது உலகளாவிய AI விலை நிர்ணயம் மற்றும் அணுகலை பாதிக்கக்கூடும்.
- Nvidia-வின் நிலை: Nvidia உலகளவில் ஆதிக்கம் செலுத்தினாலும், ஒழுங்குமுறைகள் மற்றும் உள்ளூர் போட்டியாளர்களின் எழுச்சி காரணமாக குறிப்பிடத்தக்க சீன சந்தையில் அது எதிர்கொள்ளும் சவால்களை இந்த போக்கு அடிக்கோடிட்டுக் காட்டுகிறது. இது சீனாவுக்காக வடிவமைக்கப்பட்ட ஏற்றுமதி-இணக்கமான சிப்களின் Nvidia-வின் வளர்ச்சியை துரிதப்படுத்தலாம், ஆனால் மாற்றுப் பாதையையும் சரிபார்க்கிறது.
- தொழில்நுட்பப் பிளவு?: நீண்ட காலத்திற்கு, வன்பொருள் அணுகல் மற்றும் மென்பொருள் மேம்படுத்தல் ஆகியவற்றில் தொடர்ச்சியான வேறுபாடு ஓரளவு வேறுபட்ட AI சுற்றுச்சூழல் அமைப்புகளுக்கு வழிவகுக்கும், மாதிரிகள் மற்றும் கருவிகள் வெவ்வேறு அடிப்படை சிலிக்கானுக்கு உகந்ததாக இருக்கும்.
Ant குழுமத்தின் Ling குழு மேற்கொண்ட பயணம் புவிசார் அரசியல் கட்டுப்பாடுகளால் தூண்டப்படும் வளத்தின் அடையாளமாகும். MoE போன்ற மேம்பட்ட மாதிரி கட்டமைப்புகளை புத்திசாலித்தனமாக இணைப்பதன் மூலமும், கிடைக்கக்கூடிய உள்நாட்டு வன்பொருளை மேம்படுத்தவும் பயன்படுத்தவும் தயாராக இருப்பதன் மூலமும், அவர்கள் செயற்கை நுண்ணறிவின் முக்கியமான துறையில் தொடர்ச்சியான முன்னேற்றத்தை உறுதிசெய்யும் ஒரு போக்கை வகுத்துள்ளனர், இது தொழில்துறையை வரையறுக்கும் செலவுக் கட்டமைப்புகள் மற்றும் மூலோபாய சார்புகளை மறுவடிவமைக்கக்கூடும். புதுமை பெரும்பாலும் அழுத்தத்தின் கீழ் மிகவும் துடிப்பாக செழித்து வளரும் என்ற கருத்துக்கு இது ஒரு சான்றாகும்.