2025 ஆம் ஆண்டின் விடியல் செயற்கை நுண்ணறிவுத் துறையில் ஒரு பெரிய நிகழ்வைக் கண்டது: சீன அணியான DeepSeek ஆல் DeepSeek-R1 வெளியிடப்பட்டது. 671 பில்லியன் அளவுருக்கள் கொண்ட இந்த திறந்த மூல மொழி மாதிரி, கணிதம், நிரலாக்கம் மற்றும் தர்க்கரீதியான பகுத்தறிவு போன்ற முக்கியமான பகுதிகளில் OpenAI இன் முன்னணி மாதிரிகளுக்கு போட்டியாக விரைவாக தன்னை நிலைநிறுத்திக் கொண்டது. reinforcement learning ஐப் பயன்படுத்துவதன் காரணமாக, சிக்கலான சிக்கல்களைத் தீர்க்கும் DeepSeek-R1 இன் திறன் குறிப்பாக குறிப்பிடத்தக்கது. மாதிரியின் MIT உரிமம் வணிக தடைகளை அகற்றுவதன் மூலம் நிலப்பரப்பை மேலும் சீர்குலைத்தது. DeepSeek-R1 இன் அறிமுகத்தின் அதிர்வுகள் தொழில்நுட்ப உலகம் முழுவதும் மற்றும் நிதிச் சந்தைகளிலும் உணரப்பட்டன, அதன் வெளியீட்டிற்கு ஒரு வாரத்திற்குள் AI பங்குகளில் குறிப்பிடத்தக்க வீழ்ச்சியை ஏற்படுத்தியது.
உயர்-நிலை மொழி மாதிரிகளின் துறையில் சீனாவின் திறந்த மூல AI இயக்கத்திற்கு DeepSeek-R1 ஒரு முக்கியமான முன்னேற்றத்தைக் குறித்தது. இந்த எதிர்பாராத சவால், அமெரிக்கா மற்றும் சீனாவிலிருந்து வரும் உலகளாவிய AI தலைவர்களை அவர்களின் முயற்சிகளை துரிதப்படுத்தத் தூண்டியுள்ளது, தொழில்நுட்பம் மற்றும் சந்தை நிலைப்பாடு இரண்டிலும் அவர்களின் உத்திகளை வெளிப்படுத்துகிறது. இது DeepSeek-R1 மாதிரியைச் சுற்றி ஒரு AI பந்தயத்தைத் தொடங்கியுள்ளது.
AI அரங்கில் உள்ள முக்கிய வீரர்கள் - Meta, Google, OpenAI, Anthropic, Alibaba மற்றும் Baidu - இந்த புதிய போட்டிக்கு எவ்வாறு பதிலளித்துள்ளனர் என்பதை ஆராய்வோம்.
Meta: LLaMA 4 மூலம் அளவிடுதல் மற்றும் செயல்திறனை மேம்படுத்துதல்
திறந்த மூல மாதிரி சமூகத்தில் முன்னணியில் இருக்கும் Meta, DeepSeek R1 க்கு LLaMA 4 ஐ அறிமுகப்படுத்துவதன் மூலம் பதிலளித்தது. ஏப்ரல் 2025 இல், Meta அதன் மிகவும் சக்திவாய்ந்த மாதிரியான LLaMA 4 ஐ அறிமுகப்படுத்தியது, Cloudflare போன்ற தளங்கள் வழியாக API அணுகலை வழங்கியது. LLaMA 4 Mixture-of-Experts (MoE) கட்டிடக்கலையைப் பயன்படுத்துகிறது, இது மாதிரியை துணை மாதிரிகளாகப் பிரிக்கிறது மற்றும் ஒவ்வொரு அனுமானத்தின் போதும் ஒரு பகுதியை மட்டுமே செயல்படுத்துகிறது. இந்த வடிவமைப்பு பெரிய அளவிலான அளவுருக்களை அனுமானத் திறனுடன் சமப்படுத்துகிறது.
LLaMA 4 தொடரில் பல துணை மாதிரிகள் உள்ளன, இதில் “ஸ்கவுட்” 109 பில்லியன் மொத்த அளவுருக்களையும், 17 பில்லியன் செயலில் உள்ள அளவுருக்களை மட்டுமே கொண்டுள்ளது, இது ஒரு H100 அட்டையில் இயங்க அனுமதிக்கிறது. “Maverick” மாடல் 400 பில்லியன் மொத்த அளவுருக்களைக் (128 நிபுணர்கள்) கொண்டுள்ளது, ஆனால் இன்னும் 17 பில்லியன் செயலில் உள்ள அளவுருக்களை மட்டுமே கொண்டுள்ளது, இதற்கு DGX கிளஸ்டர் தேவைப்படுகிறது. இந்த வடிவமைப்பு LLaMA 4 ஐ 10 மில்லியன் டோக்கன்கள் வரை உள்ள சூழல் சாளரங்களை ஆதரிக்க உதவுகிறது, இது இந்த திறனை வழங்கும் முதல் திறந்த மூல மாதிரிகளில் ஒன்றாகும். இது நீண்ட ஆவணங்களை சுருக்கவும் மற்றும் பெரிய குறியீடு களஞ்சியங்களை பகுப்பாய்வு செய்யவும் மிகவும் பயனுள்ளதாக இருக்கும்.
LLaMA 4 விரைவான பதில் நேரங்களை பராமரிக்கிறது மற்றும் படங்கள், ஆடியோ மற்றும் வீடியோவிற்கான multimodal உள்ளீடுகளை ஆதரிக்கிறது, அதன் MoE கட்டிடக்கலைக்கு நன்றி. Meta செயல்திறன் உத்தியை தேர்ந்தெடுத்துள்ளது, அதன் multimodal திறன்களை வலுப்படுத்துகிறது மற்றும் அதன் செயல்பாடுகளை ஒழுங்குபடுத்துகிறது, திறந்த மூல துறையில் அதன் நிலையை உறுதிப்படுத்த, DeepSeek அனுமான திறன்களில் கவனம் செலுத்துகிறது.
Google: தன்னாட்சி நுண்ணறிவு முகவர்களை நோக்கி ஜெமினியின் பரிணாமம்
OpenAI மற்றும் DeepSeek இலிருந்து வந்த ஒருங்கிணைந்த அழுத்தத்தை எதிர்கொண்ட Google, தொழில்நுட்ப கண்டுபிடிப்பு உத்தியைத் தேர்ந்தெடுத்துள்ளது. பிப்ரவரி 2025 இல், Google ஜெமினி 2.0 தொடரை அறிமுகப்படுத்தியது, இது Flash, Pro மற்றும் Lite பதிப்புகளைக் கொண்டுள்ளது, இது “நுண்ணறிவு முகவர்” திறன்களை நோக்கிய நகர்வைக் குறிக்கிறது.
ஜெமினி 2.0 இன் முகவர் திறன்கள் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கின்றன. மாதிரி பல முறைகளைப் புரிந்து கொள்ளவும், தேடுபொறிகள், குறியீடு சாண்ட்பாக்ஸ்கள் மற்றும் இணைய உலாவல் ஆகியவற்றை தீவிரமாகப் பயன்படுத்தவும் முடியும். Google இன் Project Mariner ஆனது AI-உந்துதல் Chrome உலாவி செயல்பாடுகளை அனுமதிக்கிறது, AI ஆனது படிவங்களை நிரப்பவும் மற்றும் பொத்தான்களைக் கிளிக் செய்யவும் உதவுகிறது.
Google Agent2Agent நெறிமுறையையும் அறிமுகப்படுத்தியுள்ளது, இது வெவ்வேறு நுண்ணறிவு முகவர்கள் ஒருவருக்கொருவர் தொடர்பு கொள்ளவும் ஒன்றாக வேலை செய்யவும் அனுமதிக்கிறது, அதன் முகவர் சுற்றுச்சூழல் அமைப்பை ஆதரிக்கிறது.கூடுதலாக, மூன்றாம் தரப்பு டெவலப்பர்களை பங்கேற்க ஊக்குவிக்கும் வகையில், Agent Garden என்ற கருவியையும் மேம்பாட்டுக் கருவியையும் உருவாக்கியுள்ளது.
DeepSeek மற்றும் OpenAI உடனான அளவுரு பந்தயத்தில் கவனம் செலுத்துவதற்குப் பதிலாக, AI கருவி அடிப்படையிலான மற்றும் தன்னாட்சி திறன்களை நோக்கி உருவாகும்போது, நுண்ணறிவு முகவர் ஒத்துழைப்பில் கவனம் செலுத்துவதன் மூலம் Google அடுத்த சகாப்தத்தின் முக்கிய சூழ்நிலைகளை மறுவரையறை செய்கிறது. ஜெமினியின் பரிணாமம் ஒரு மூலோபாய மாற்றத்தைக் குறிக்கிறது, மேலும் இது ஒரு மாதிரி மேம்பாடு மட்டுமல்ல.
OpenAI: நம்பகத்தன்மை மற்றும் தலைமைத்துவத்திற்கான மாதிரிகளை மீண்டும் செய்து சுற்றுச்சூழல் அமைப்புகளை ஒருங்கிணைத்தல்
DeepSeek R1 க்கு பதிலளிக்கும் விதமாக OpenAI அதன் மாதிரி மறு செய்கைகள் மற்றும் தயாரிப்பு வரிசைப்படுத்தல்களை துரிதப்படுத்தியுள்ளது. பிப்ரவரி 2025 இல், OpenAI GPT-4 இன் இடைக்கால பதிப்பான GPT-4.5 ஐஅறிமுகப்படுத்தியது, இது தர்க்கரீதியான நிலைத்தன்மையையும் உண்மையான துல்லியத்தையும் மேம்படுத்துகிறது, அதே நேரத்தில் GPT-5க்கான வழியையும் வகுக்கிறது.
GPT-4.5 என்பது சங்கிலி-சிந்தனை பகுத்தறிவை உள்ளடக்காத கடைசி முக்கிய மாதிரியாகக் கருதப்படுகிறது. GPT-5 ஆனது ஒருங்கிணைந்த “பொது அறிவாற்றல் மாதிரி” ஐ உருவாக்க, பரிசோதனை பகுத்தறிவு மாதிரி o3-mini மற்றும் GPT தொடரின் அம்சங்களை இணைக்கும். GPT-5 ஆனது அதிக அளவில் சரிசெய்யக்கூடிய நுண்ணறிவு நிலைகள் மற்றும் கருவி பயன்பாட்டு திறன்களைக் கொண்டிருக்கும் என்றும் OpenAI கூறியுள்ளது.
திறந்த மூல மாற்றுகளுக்கு பயனர்கள் மாறுவதற்கான அபாயத்தைக் குறைக்க, ChatGPT இன் இலவச பயனர்கள் GPT-5 இன் அடிப்படை பதிப்பைப் பயன்படுத்த OpenAI முடிவு செய்தது, அதே நேரத்தில் கட்டண பயனர்கள் மேம்பட்ட அம்சங்களுக்கான அணுகலைப் பெறுவார்கள். இந்த உத்தி பயனர்களை பரந்த அளவிலான கவரேஜ் மூலம் ஈடுபடுத்துவதை நோக்கமாகக் கொண்டுள்ளது.
OpenAI ஆனது செருகுநிரல்கள், உலாவிகள் மற்றும் குறியீடு செயலி போன்ற திறன்களை GPT மைய மாதிரியில் ஒருங்கிணைக்கிறது, அவற்றை தனித்தனியாக வைத்திருப்பதற்கு மாறாக, “முழு அம்ச AI” ஐ உருவாக்குகிறது. OpenAI ஆனது R1 இன் சவாலுக்கு முறையாக ஒருங்கிணைத்து நுண்ணறிவு அடர்த்தியை அதிகரிப்பதன் மூலம் பதிலளிக்கிறது.
Anthropic: கலப்பு பகுத்தறிவு மற்றும் சிந்தனை வரவுசெலவு திட்டங்களுடன் வலுவான நுண்ணறிவை ஆழப்படுத்துதல்
Anthropic பிப்ரவரி 2025 இல் Claude 3.7 Sonnet ஐ அறிமுகப்படுத்தியது, இது “கலப்பு பகுத்தறிவு” மற்றும் “சிந்தனை வரவுசெலவு திட்டங்களில்” கவனம் செலுத்துகிறது. பயனர்கள் விரைவான பதில்களுக்காக “சாதாரண பயன்முறையை” தேர்வு செய்யலாம் அல்லது ஆழமான, படிப்படியான சிந்தனைக்கு “நீட்டிக்கப்பட்ட பயன்முறையை” இயக்கலாம்.
இந்த முறை மக்கள் கடினமான பணிகளை எதிர்கொள்ளும் போது “அதிகமாக சிந்திப்பதற்கு” ஒத்ததாகும், ஏனெனில் இது AI துல்லியத்தை மேம்படுத்த நீண்ட நேரம் காரணத்தை அனுமதிக்கிறது. Anthropic பயனர்கள் பகுத்தறிவு ஆழத்தையும் அழைப்பு செலவுகளையும் சமப்படுத்த “சிந்தனை நேரத்தை” அமைக்க அனுமதிக்கிறது.
Claude 3.7 அதன் முன்னோடி 3.5 ஐ விட நிரலாக்கம் மற்றும் பகுத்தறிவு போன்ற சவாலான பணிகளில் சிறப்பாக செயல்படுகிறது, மேலும் இது பகுத்தறிவு செயல்முறையின் வெளிப்படைத்தன்மையில் கவனம் செலுத்தும் தொழில்துறையின் சில மாதிரிகளில் ஒன்றாகும். அதன் குறியீடு திறன்களும் சமீபத்திய மதிப்பீடுகளில் 70.3% துல்லியமான விகிதத்தை எட்டியுள்ளன.
Anthropic அளவுருக்களை அடுக்கி வைப்பதை விட, விளக்கக்கூடிய, நிலையான மற்றும் தனிப்பயனாக்கக்கூடிய சிந்தனை வடிவங்களுடன் மாதிரிகளை உருவாக்குவதில் கவனம் செலுத்துவதன் மூலம் “கட்டுப்படுத்தக்கூடிய நுண்ணறிவு”க்கான அதன் உறுதிப்பாட்டை Claude 3.7 நிரூபிக்கிறது. Anthropic R1-உந்துதல் “பகுத்தறிவு பந்தயத்தில்” அதன் சொந்த வேகத்தில் சீராக முன்னேறி வருகிறது.
Alibaba: Qwen மூலம் ஒரு சீன திறந்த மூல சுற்றுச்சூழல் அமைப்பை உருவாக்குதல்
Alibaba வின் Damo Academy, DeepSeek R1 வெளியான ஒரு வாரத்தில், பிப்ரவரி 2025 இல் Qwen 2.5 தொடரையும், ஏப்ரல் இறுதியில் புதிய Qwen 3 தொடரையும் வெளியிட்டு, வலுவான தயாரிப்பு பிரதிபலிப்பு மற்றும் மூலோபாய தொலைநோக்கு பார்வையைக் காட்டியது.
Qwen 3 தொடரில் 600 மில்லியன் முதல் 235 பில்லியன் அளவுருக்கள் வரையிலான மாதிரி பதிப்புகள் உள்ளன. இது குறைவான கணக்கீட்டு ஆதாரங்களைப் பயன்படுத்தும் போது மாதிரி செயல்திறனைப் பராமரிக்க MoE கட்டமைப்பைப் பயன்படுத்துகிறது. முதன்மை மாதிரி, Qwen3-235B-A22B, செயல்படுத்தல் அளவுருக்களை மேம்படுத்துவதன் மூலம் வரிசைப்படுத்தலுக்கு நான்கு உயர்-செயல்திறன் GPU கள் மட்டுமே தேவைப்படுகின்றன, இது பெரிய மாதிரிகளை செயல்படுத்த வணிகங்களுக்கான நுழைவுத் தடையை பெரிதும் குறைக்கிறது. பல நிலையான சோதனைகளில், Qwen 3 இன் ஒட்டுமொத்த செயல்திறன் DeepSeek R1, OpenAI o1 மற்றும் Gemini 2.5 Pro போன்ற சிறந்த சர்வதேச மாதிரிகளை விட அதிகமாக உள்ளது.
Alibaba தொழில்நுட்ப போட்டித்திறனுடன் கூடுதலாக, திறந்த மூல சுற்றுச்சூழல் அமைப்பை உருவாக்குவதற்கு வலுவான முக்கியத்துவம் அளிக்கிறது. Qwen 3 ஆனது Apache 2.0 உரிமத்தின் கீழ் முழுமையாக திறந்த மூலமாகும், இதில் திறந்த எடைகள், பயிற்சி குறியீடு மற்றும் வரிசைப்படுத்தல் கருவிகள், உலகளாவிய டெவலப்பர்களால் நேரடியாகப் பயன்படுத்தவும் தனிப்பயனாக்கவும் முடியும் என்ற இலக்குடன் பல மொழி (119 மொழிகள்) மற்றும் multimodal பயன்பாடுகளை ஆதரிக்கிறது.
Alibaba வின் “தொழில்நுட்பம் + சுற்றுச்சூழல் அமைப்பு” உத்தி DeepSeek இன் இலகுரக திருப்புமுனை பாணியை நிறைவு செய்கிறது. ஒன்று விரைவான மறு செய்கை மற்றும் முன்னணி அனுமானத்தை வலியுறுத்துகிறது, மற்றொன்று சுற்றுச்சூழல் அமைப்பு கட்டுமானம் மற்றும் அளவை சமநிலைப்படுத்துதல் மற்றும் பன்முகத்தன்மையை வலியுறுத்துகிறது. DeepSeek ஏற்படுத்திய தொழில்துறை சீர்குலைவுக்கு ஒரு நிலையான பதிலடியாக Qwen உள்நாட்டு சந்தையில் திறந்த மூல பெரிய மாதிரிகளின் “சுற்றுச்சூழல் மையமாக” படிப்படியாக தன்னை நிலைநிறுத்திக் கொள்கிறது.
Baidu: ERNIE Bot இன் மேம்பாடுடன் Multimodality மற்றும் Plugin கருவிகளை மேம்படுத்துதல்
Baidu மார்ச் மாதத்தில் அதன் முதன்மை மாதிரியான ERNIE Bot ஐ மேம்படுத்தியது, ERNIE Bot 4.5 மற்றும் ERNIE X1 ஆகியவற்றை பொது சோதனைக்காக வெளியிட்டது. ERNIE X1 “ஆழமான சிந்தனை மாதிரி” என்று நிலைநிறுத்தப்பட்டுள்ளது, இது AI இன் புரிதல், திட்டமிடல் மற்றும் சிக்கலான பணிகளைச் செயல்படுத்தும் திறனை மேம்படுத்துவதில் கவனம் செலுத்துகிறது.
ERNIE 4.5 என்பது Baidu வின் முதல் சொந்த multimodal பெரிய மாதிரி ஆகும், இது உரை, படங்கள், ஆடியோ மற்றும் வீடியோவின் கூட்டு மாதிரியை ஆதரிக்கிறது. இந்த பதிப்பு மாயத்தோற்ற உற்பத்தியை கணிசமாகக் குறைக்கிறது மற்றும் குறியீடு புரிதல் மற்றும் தர்க்கரீதியான பகுத்தறிவை மேம்படுத்துகிறது, பல சீன காட்சி பணிகளில் GPT-4.5 அளவை மிஞ்சுகிறது.
Baidu அதிக பயனுள்ள “AI கருவி சுற்றுச்சூழல் அமைப்பை” உருவாக்குகிறது. X1 மாதிரி தேடல், ஆவணம் Q&A, PDF படித்தல், குறியீடு செயல்படுத்தல், பட அங்கீகாரம், இணைய அணுகல் மற்றும் வணிக தகவல் வினவல் செயல்பாடுகளைப் பயன்படுத்தி AI இன் “நேரடி திறனை” உண்மையாக உணர முடியும், Google Gemini இன் முகவர் பாதையை எதிரொலிக்கிறது.
ERNIE மாதிரியின் சில அளவுருக்களை ஜூன் 2025 இறுதிக்குள் திறந்த மூலமாக்கப் போவதாகவும், நிறுவன அளவிலான வாடிக்கையாளர்களுடன் பயன்பாட்டு ஒருங்கிணைப்பை மேலும் விரிவுபடுத்தப் போவதாகவும் Baidu அறிவித்துள்ளது. ERNIE தொடர் ஒரு மூடிய-சுழற்சி தயாரிப்பிலிருந்து ஒரு தள சுற்றுச்சூழல் அமைப்பாக மாறுகிறது, இது API கள் மற்றும் செருகுநிரல் அமைப்புகள் மூலம் டெவலப்பர்கள் மற்றும் வணிகங்களை ஈர்க்கிறது.
திறந்த மூல இடத்தில் R1 மற்றும் Qwen உடன் நேரடியாக போட்டியிடுவதற்குப் பதிலாக, Baidu சீன உள்ளடக்கம், தேடல் சேவைகள் மற்றும் அறிவு வரைபடங்களில் அதன் ஆழமான குவிப்புகளைப் பயன்படுத்தி, தேடல், அலுவலகம் மற்றும் தகவல் ஓட்டம் போன்ற தயாரிப்பு காட்சிகளுடன் மாதிரியை ஆழமாக ஒருங்கிணைக்கிறது, இது மிகவும் உள்ளூர்மயமாக்கப்பட்ட AI தயாரிப்பு போர்ட்ஃபோலியோவை உருவாக்குகிறது.
சுருக்கமாக, DeepSeek R1 இன் வெளியீடு ஒரு தொழில்நுட்ப முன்னேற்றம் மட்டுமல்ல; இது உலகளாவிய AI அரங்கில் ஒரு ஊக்கியாக இருந்தது. இது அனுமான செயல்திறனை மேம்படுத்த ஜாம்பவான்களை கட்டாயப்படுத்தியுள்ளது, திறந்த மூலத்திற்கான போட்டியில் உள்நாட்டு நிறுவனங்களைத் தூண்டியது மற்றும் முகவர்கள், ஒருங்கிணைப்பு மற்றும் multimodality ஆகியவற்றின் வளர்ச்சியை விரைவுபடுத்த அமெரிக்க நிறுவனங்களைத் தூண்டியது.
சீன மற்றும் அமெரிக்க AI ஜாம்பவான்களின் பதில்கள் வேறுபட்டாலும், அவற்றின் இலக்குகள் ஒரே மாதிரியானவை: வலிமையான, நம்பகமான மற்றும் நெகிழ்வான பெரிய மாதிரிகளை உருவாக்குவது மற்றும் தொழில்நுட்பம், சுற்றுச்சூழல் அமைப்பு மற்றும் பயனர்களின் மூன்று போட்டிகளில் வெற்றி பெறுவது. இந்த செயல்முறை இன்னும் முடியவில்லை. GPT-5, Gemini 3, Claude 4 மற்றும் DeepSeek R2 மற்றும் Qwen 4 ஆகியவை ஒன்றன் பின் ஒன்றாக வெளியிடப்படுவதால், உலகளாவிய AI “சுழல் உயர்வு” என்ற புதிய கட்டத்திற்குள் நுழைகிறது.
நிறுவன பயனர்கள் மற்றும் டெவலப்பர்களுக்கு, இந்த போட்டி அதிக தேர்வுகள், குறைந்த செலவுகள் மற்றும் அதிக சக்திவாய்ந்த பெரிய மாதிரி கருவிகளைக் கொண்டுவரும். உலகளாவிய AI திறன்கள் முன்னெப்போதும் இல்லாத விகிதத்தில் பரவி ஜனநாயகமயமாக்கப்படுகின்றன, மேலும் அடுத்த தீர்க்கமான தொழில்நுட்ப முன்னேற்றம் ஏற்கனவே செயல்பாட்டில் இருக்கலாம்.