தீப்சீக்கின் R1 மேம்பாடு: அமெரிக்க AI சவாலே? | ta

ஷாங்காய்/பெய்ஜிங் - செயற்கை நுண்ணறிவுத் துறையில் ஒரு பெரிய நகர்வாக, சீனா ஸ்டார்ட்அப் DeepSeek வியாழக்கிழமை அதிகாலை அதன் பாராட்டப்பட்ட R1 பகுத்தறிவு மாதிரிக்கான குறிப்பிடத்தக்க மேம்படுத்தலை வெளியிட்டது. இந்த மேம்படுத்தல் OpenAI போன்ற அமெரிக்காவை தளமாகக் கொண்ட AI நிறுவனங்களுடனான வளர்ந்து வரும் போட்டியில் ஒரு புதிய அத்தியாயத்தைக் குறிக்கிறது.

R1-0528: பகுத்தறிதல் மற்றும் அனுமானத்தில் ஒரு முன்னேற்றம்

DeepSeek, டெவலப்பர் பிளாட்ஃபார்மான Hugging Face இல் அதன் இருப்பு மூலம், R1-0528 அசல் R1 மாதிரியின் மேம்படுத்தப்பட்ட பதிப்பாகும் என்று அறிவித்தது. இது ஒரு சிறிய மேம்பாடாகக் குறிக்கப்பட்டாலும், பகுத்தறிதல் மற்றும் அனுமான திறன்களின் ஆழத்தில் கணிசமான முன்னேற்றங்களைக் கொண்டுள்ளது. சிக்கலான பணிகளைச் சமாளிக்கும் திறனும் இதில் குறிப்பிடத்தக்க வகையில் மேம்படுத்தப்பட்டுள்ளது. இது OpenAI இன் o3 பகுத்தறிவு மாதிரிகள் மற்றும் Google இன் Gemini 2.5 Pro நிர்ணயித்த அளவுகோல்களுக்கு ஒட்டுமொத்த செயல்திறனை நெருக்கமாகக் கொண்டுவருகிறது.

ஜனவரியில் R1 இன் ஆரம்ப வெளியீடு உலகளவில் பரபரப்பை ஏற்படுத்தியது, சீனாவின் வெளியே தொழில்நுட்ப பங்குச் சந்தைகளில் அதிர்ச்சி அலைகளை ஏற்படுத்தியது. மேலும் முக்கியமாக, மேம்பட்ட AIஐ உருவாக்குவதற்கு அதிக கணினி சக்தியும், பெரிய நிதி முதலீடும் அவசியம் என்ற நிலவிய கருத்துக்கு இது சவால் விடுத்தது. R1 வெளியானதிலிருந்து, Alibaba மற்றும் Tencent உள்ளிட்ட பல சீன தொழில்நுட்ப நிறுவனங்கள் DeepSeek இன் சாதனைகளை விஞ்சியிருப்பதாகக் கூறி தங்கள் சொந்த மாதிரிகளை அறிமுகப்படுத்தியுள்ளன.

நுட்பமான மேம்பாடுகள், குறிப்பிடத்தக்க தாக்கம்

ஜனவரியில் R1 இன் விரிவான வெளியீட்டிற்கு மாறாக, நிறுவனத்தின் உத்திகளைப் பிரிக்கும் ஒரு விரிவான கல்வி ஆய்வுக் கட்டுரையும் இருந்தது. வியாழக்கிழமை மேம்படுத்தல் குறித்த விவரங்கள் ஆரம்பத்தில் குறைவாகவே இருந்தன. DeepSeek இன் அணுகுமுறையைப் புரிந்துகொள்ள AI சமூகம் முந்தைய ஆய்வுக் கட்டுரையை உன்னிப்பாக ஆய்வு செய்தது.

இருப்பினும், ஹாங்சூவை தளமாகக் கொண்ட நிறுவனம் X (முன்னர் ட்விட்டர்) இல் ஒரு சுருக்கமான பதிவு மூலம் R1-0528 இன் மேம்பாடுகள் குறித்து அதிக வெளிச்சம் போட்டுக் காட்டியது. மாதிரி மேம்பட்ட ஒட்டுமொத்த செயல்திறனை அவை எடுத்துக்காட்டின. WeChat இல் ஒரு விரிவான பதிவில், உள்ளடக்கம் மறுஎழுதுதல் மற்றும் சுருக்குதல் போன்ற காட்சிகளில் “மாயத்தோற்றங்களின்” விகிதம் சுமார் 45-50 சதவீதம் குறைந்துள்ளது என்று DeepSeek வெளிப்படுத்தியது.

கூடுதலாக, கட்டுரைகள், நாவல்கள் மற்றும் பிற இலக்கிய வகைகளை உள்ளடக்கிய பல்வேறு வடிவங்களில் உள்ளடக்கத்தை உருவாக்கும் மாதிரியின் மேம்பட்ட திறனை DeepSeek வலியுறுத்தியது. முன்-இறுதி குறியீட்டை உருவாக்குதல் மற்றும் யதார்த்தமான ரோல்-பிளே காட்சிகளில் ஈடுபடுதல் போன்ற நடைமுறை பகுதிகளில் இந்த மேம்பாடுகள் நீட்டிக்கப்பட்டன.

கணிதம், நிரலாக்கம் மற்றும் பொதுவான தர்க்கம் ஆகியவற்றை உள்ளடக்கிய பல்வேறு அளவுகோல் மதிப்பீடுகளில் புதுப்பிக்கப்பட்ட மாதிரி விதிவிலக்கான செயல்திறனைக் காட்டுகிறது என்று DeepSeek நம்பிக்கையுடன் கூறியது. இது மாதிரியின் பன்முகத்தன்மை மற்றும் பல்வேறு பயன்பாடுகள் முழுவதும் சாத்தியமான தாக்கத்தை அடிக்கோடிட்டுக் காட்டுகிறது.

அமெரிக்க ஆதிக்கத்திற்கும் ஏற்றுமதி கட்டுப்பாடுகளுக்கும் சவால்

DeepSeek இன் வெற்றி சீனாவின் AI வளர்ச்சியில் அமெரிக்க ஏற்றுமதி கட்டுப்பாடுகளின் தாக்கம் குறித்த மரபுவழி ஞானத்திற்கு சவால் விடுத்துள்ளது. அமெரிக்காவில் உள்ள தொழில்துறை முன்னணி மாடல்களுக்கு போட்டியாக அல்லது மிஞ்சும் AI மாடல்களை வெளியிட முடியும் என்பதை நிறுவனம் நிரூபித்துள்ளது. இது கணிசமாக குறைந்த செலவில் அடையப்பட்டுள்ளது. இது நிறுவப்பட்ட ஒழுங்கை மேலும் சீர்குலைக்கிறது.

DeepSeek அதன் மேம்படுத்தலின் மாறுபாடு Alibaba இன் Qwen 3 8B அடிப்படை மாதிரியை மேம்படுத்துவதற்காக R1-0528 மாதிரியால் பயன்படுத்தப்படும் பகுத்தறிவு செயல்முறையைப் பயன்படுத்துவதன் மூலம் உருவாக்கப்பட்டது என்று மேலும் அறிவித்தது. வடிகட்டுதல் என்று அழைக்கப்படும் இந்த செயல்முறை அசல் Qwen 3 மாதிரியுடன் ஒப்பிடும்போது 10 சதவீதத்திற்கும் அதிகமான செயல்திறன் மேம்பாட்டை அளித்தது.

DeepSeek-R1-0528 இல் பயன்படுத்தப்படும் சிந்தனைச் சங்கிலி, பகுத்தறிவு மாதிரிகளில் கவனம் செலுத்தும் கல்வி ஆராய்ச்சி மற்றும் சிறிய அளவிலான மாதிரிகளை மையமாகக் கொண்ட தொழில்துறை வளர்ச்சி ஆகிய இரண்டிற்கும் விலைமதிப்பற்றதாக இருக்கும் என்று DeepSeek நம்புகிறது. இது அதன் பரந்த பயன்பாடு மற்றும் மேலும் புதுமைக்கான திறனைக் குறிக்கிறது.

DeepSeek பிரதிநிதி WeChat குழுவில் ஒரு "சிறிய சோதனை மேம்பாடு" நிறைவடைந்துள்ளதாகவும், பயனர்கள் அதை சோதிக்கத் தொடங்கலாம் என்றும் பகிர்ந்துள்ளார். இது குறித்து முதலில் புளூம்பெர்க் புதன்கிழமை செய்தி வெளியிட்டது. இது பயனர் சமூகத்துடனான நிறுவனத்தின் செயலூக்கமான ஈடுபாட்டை எடுத்துக்காட்டுகிறது.

தொழில்துறையாளர் தாக்கம் மற்றும் போட்டி பதில்கள்

AI துறையில் DeepSeek ஒரு பெரிய வீரராக உருவெடுத்துள்ளதால், அதன் அமெரிக்க போட்டியாளர்களிடமிருந்து குறிப்பிடத்தக்க பதில்களைத் தூண்டியுள்ளது. Google இன் Gemini தள்ளுபடி செய்யப்பட்ட அணுகல் அடுக்குகளை அறிமுகப்படுத்தியுள்ளது. அதே நேரத்தில் OpenAI விலைகளைக் குறைத்து, குறைந்த செயலாக்க சக்தி தேவைப்படும் அதன் GPT மாதிரியின் “மினி” பதிப்பை வெளியிட்டுள்ளது. DeepSeek இன் போட்டியின் அழுத்தத்திற்கு நேரடி பதில்களாக இந்த நடவடிக்கைகள் விளக்கப்படுகின்றன.

R1 க்குப் பின் R2 ஐ வெளியிடவும் DeepSeek பரவலாக எதிர்பார்க்கப்படுகிறது. இது AI ஆயுதப் போட்டியில் மேலும் அதிகரிப்பைக் குறிக்கும். மார்ச் மாதத்தில், R2 இன் வெளியீடு முதலில் மே மாதத்தில் திட்டமிடப்பட்டது என்று ராய்ட்டர்ஸ் செய்தி வெளியிட்டது. ஆனால் உண்மையான வெளியீட்டு தேதி நிச்சயமற்றது. DeepSeek மார்ச் மாதத்தில் அதன் V3 பெரிய மொழி மாதிரிக்கு ஒரு மேம்படுத்தலையும் வெளியிட்டது. இது அதன் தயாரிப்பு வரிசையில் தொடர்ச்சியான மேம்பாடு மற்றும் புதுமைக்கான உறுதிப்பாட்டைக் காட்டுகிறது.

DeepSeek இன் R1-0528 தொழில்நுட்ப மேம்பாடுகளில் ஆழ்ந்த மூழ்கல்

DeepSeek இன் R1-0528 மேம்படுத்தலின் பரந்த தாக்கங்கள் குறிப்பிடத்தக்கவை என்றாலும், தொழில்நுட்ப மேம்பாடுகளை நெருக்கமாகப் பார்ப்பது AI மாதிரி வளர்ச்சியில் ஏற்பட்டுள்ள முன்னேற்றம் குறித்த மதிப்புமிக்க நுண்ணறிவை வழங்குகிறது. குறிப்பிட்ட மேம்பாடுகள் மற்றும் மாதிரியின் ஒட்டுமொத்த செயல்திறனுக்கு அவை எவ்வாறு பங்களிக்கின்றன என்பது குறித்து ஆராய்வோம்.

மேம்படுத்தப்பட்ட பகுத்தறிவு மற்றும் அனுமானம்: மேம்படுத்தலின் மையப்பகுதி

R1-0528 உடன் DeepSeek இன் முதன்மை கவனம் மாதிரியின் பகுத்தறிவு மற்றும் அனுமான திறன்களை ஆழமாக்குவதாகும். இதன் பொருள் தகவல்களின் பின்னணியைப் புரிந்துகொள்ளவும், தர்க்கரீதியான முடிவுகளை எடுக்கவும் மற்றும் கிடைக்கக்கூடிய தரவுகளின் அடிப்படையில் கணிப்புகளைச் செய்யவும் மாதிரி சிறப்பாக பொருத்தப்பட்டுள்ளது. மாதிரி கட்டிடக்கலை மற்றும் பயிற்சி வழிமுறைகளை திறம்பட மேம்படுத்துவதன் மூலம் தரவுகளுக்குள் சிக்கலான உறவுகளை திறம்படப் பிடிக்க முடியும்.

இந்த மேம்பாட்டின் ஒரு முக்கிய அம்சம் தெளிவற்ற அல்லது முழுமையற்ற தகவல்களை கையாளும் மாதிரியின் திறனை மேம்படுத்துவதாகும். நிஜ உலகப் பணிகளில் பெரும்பாலும் நிச்சயமற்ற அல்லது இரைச்சல் தரவுகளைக் கையாள்வது அடங்கும். R1-0528 பொருத்தமற்ற தகவல்களை வடிகட்டி, மிகவும் பொருத்தமான கூறுகளில் கவனம் செலுத்துவதற்கான சிறந்த திறனைக் காட்டுகிறது. இது மிகவும் துல்லியமான மற்றும் நம்பகமான முடிவுகளை உருவாக்க அனுமதிக்கிறது.

சிக்கலான பணி கையாளுதல்: எளிய பயன்பாடுகளுக்கு அப்பால் நகர்தல்

மேம்படுத்தப்பட்ட மாதிரி பல படிகள், சிக்கலான உறவுகளை உள்ளடக்கிய அல்லது பல்வேறு ஆதாரங்களில் இருந்து அறிவை ஒருங்கிணைக்க வேண்டிய பணிகளைக் கையாளும் சிறந்த திறனையும் காட்டுகிறது. AI பயன்பாடுகளை மிகவும் சிக்கலான மற்றும் உண்மையான உலக காட்சிகளுக்கு அளவிடுவதற்கு இது முக்கியமானது.

உதாரணமாக, ஒரு வாடிக்கையாளர் சேவை பயன்பாட்டில், ஒரு சிக்கலான வினவலை கையாள்வது இதில் அடங்கும்:

வாடிக்கையாளரின் குறிப்பிட்ட பிரச்சினை குறித்து புரிந்துகொள்வது.
பல்வேறு தரவுத்தளங்களிலிருந்து தொடர்புடைய தகவல்களை அணுகுவது.
தனிப்பயனாக்கப்பட்ட தீர்வை உருவாக்குவது.
தெளிவான மற்றும் சுருக்கமான முறையில் தீர்வை முன்வைப்பது.

இந்த பகுதியில் R1-0528 இன் மேம்படுத்தப்பட்ட திறன்கள் இதுபோன்ற பலதரப்பட்ட பணிகளைக் கையாள்வதற்கு ஏற்றதாக அமைகிறது. இதன் மூலம் செயல்திறன் மற்றும் பயனர் திருப்தியை மேம்படுத்துகிறது.

மாயத்தோற்றங்களைக் குறைத்தல்: நம்பகமான AI நோக்கி ஒரு படி

உண்மையில் தவறான அல்லது தவறான தகவல்களை உருவாக்குவது பெரிய மொழி மாதிரிகளின் வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க சவாலாக உள்ளது. இந்த மாதிரிகள் மிகவும் நம்பகமான உரையை உருவாக்க முடியும் என்றாலும், அவை எப்போதும் துல்லியமானவை அல்ல. சில நேரங்களில் உண்மையில் இல்லாத தகவல்களை "உருவாக்கலாம்".

குறிப்பிட்ட காட்சிகளில் 45-50% மாயத்தோற்றங்கள் குறைக்கப்பட்டதாக DeepSeek கூறியது AI மாடல்களின் நம்பகத்தன்மை மற்றும் நம்பகத்தன்மையை மேம்படுத்துவதற்கான ஒரு பெரிய படியாகும்:

மறுஎழுதுதல்: இருக்கும் உரையை மறுஎழுதும்படி கேட்கும்போது, R1-0528 உண்மையான பிழைகளை அறிமுகப்படுத்த அல்லது தவறாகப் புரிந்து கொள்ள வாய்ப்புகள் குறைவு.
சுருக்குதல்: இதேபோல் ஆவணங்கள் அல்லது கட்டுரைகளை சுருக்கமாக கூறும்போது, மாதிரி முக்கிய புள்ளிகளை துல்லியமாகப் பிடிக்கவும் தவறான அல்லது தவறான தகவல்களை வைப்பதைத் தவிர்க்கவும் சிறப்பாக உள்ளது.

AI மாடல்களின் நம்பகத்தன்மையை மேம்படுத்துவதற்கும், துல்லியம் உயர்ந்த பயன்பாடுகளில் அவற்றின் தத்தெடுப்பை ஊக்குவிப்பதற்கும், மாயத்தோற்றங்களில் இந்த குறைப்பு அவசியம்.

ஆக்கப்பூர்வமான உள்ளடக்கம் உருவாக்கம்: AI இன் எல்லைகளை விரிவுபடுத்துதல்

மேம்படுத்தப்பட்ட பகுத்தறிவு மற்றும் துல்லியத்திற்கு அப்பால், R1-0528 ஆக்கப்பூர்வமான உள்ளடக்கம் உருவாக்கத்தில் மேம்பட்ட திறன்களைக் கொண்டுள்ளது. குறிப்பாக கட்டுரைகள், நாவல்கள் மற்றும் பிற இலக்கிய வகைகளை எழுதுவதில் சிறந்து விளங்குகிறது. இது தகவல்களை செயலாக்குவதற்கும் மூலமான மற்றும் ஈர்க்கும் உள்ளடக்கத்தை உருவாக்குவதற்கு AI ஐ செயல்படுத்துவதற்கும் ஒரு படியாகும். இது சந்தைப்படுத்தல் முதல் பொழுதுபோக்கு வரை பரந்த அளவில் முக்கிய பங்கு வகிக்கக்கூடும்.

இலக்கியம், கவிதை மற்றும் பிற ஆக்கப்பூர்வ எழுத்துக்களின் பெரிய தரவுத்தொகைகளில் மாதிரியைப் பயிற்றுவிப்பதன் மூலம், வேறுபட்ட எழுத்து நடைகளைப் புரிந்துகொள்ளவும், பின்பற்றும் திறனையும், வேறுபட்ட வகைகளுக்கு ஏற்பவும், ஒருங்கிணையும் மற்றும் கற்பனையான உரையை உருவாக்கவும் R1-0528 இன் திறனை DeepSeek செம்மைப்படுத்தியுள்ளது. இருப்பினும் AI உருவாக்கிய ஆக்கப்பூர்வமான உள்ளடக்கம் ஆசிரியரின் உரிமம், பதிப்புரிமை மற்றும் கலை திறனைச் சுற்றியுள்ள பொருத்தமான சிக்கல்களை எழுப்புகிறது என்பதை கவனத்தில் கொள்ள வேண்டும்.

மேம்படுத்தப்பட்ட குறியீடு உருவாக்கம் மற்றும் ரோல்-பிளே திறன்கள்: நடைமுறை பயன்பாடுகள்

பகுத்தறிவு மற்றும் ஆக்கப்பூர்வமான உள்ளடக்க உருவாக்கத்தில் அதன் முன்னேற்றங்களுக்கு மேலதிகமாக, குறியீடு உருவாக்கம் மற்றும் விளையாடுவது போன்ற அதிக நடைமுறை பகுதிகளில் R1-0528 மேம்பாடுகளைக் காட்டுகிறது.

குறியீடு உருவாக்கம்: முன்-இறுதி குறியீட்டை உருவாக்க மாதிரி மேம்பட்ட திறனைக் காட்டுகிறது. இது மேம்பாட்டு செயல்முறையை தானியக்கமாக்க அல்லது விரைவுபடுத்த விரும்பும் டெவலப்பர்களுக்கு மதிப்புமிக்க கருவியாக அமைகிறது. பயனர் நேரடியாக தொடர்பு கொள்ளும் மென்பொருள் பயன்பாடுகளின் பகுதியை முன்-இறுதி குறியீடு உருவாக்குகிறது.
விளையாடுதல்: மேம்படுத்தப்பட்ட விளையாடும் திறன்கள் மாதிரியை அதிகமான யதார்த்தமான மற்றும் ஈடுபாட்டுடன் உரையாடல்களில் ஈடுபட அனுமதிக்கின்றன. மாதிரி வேறுபட்ட பெர்சோனாக்களை எடுத்துக்கொள்ளக்கூடும். மேலும் பயனர் உள்ளீடுகளுக்கு ஏற்றவாறு பதிலளிக்க முடியும். அத்துடன் மிகவும் தனிப்பயனாக்கப்பட்ட மற்றும் பயனுள்ள ஆதரவை வழங்கக்கூடிய சாட்-போட்கள் மற்றும் மெய்நிகர் உதவியாளர்களை உருவாக்குவதற்கு இது முக்கியமானது.

இந்த நடைமுறை திறன்கள் R1-0528 இன் பன்முகத்தன்மையையும் பரந்த அளவிலான தொழில்களில் சாதகமான தாக்கத்தை ஏற்படுத்தக்கூடிய திறனையும் எடுத்துக்காட்டுகின்றன.

வடிகட்டுதல் அணுகுமுறை: Alibaba இன் Qwen மாதிரியை மேம்படுத்துதல்

Alibaba உடனான DeepSeek இன் கூட்டு அணுகுமுறை AI சமூகத்திற்குள் அறிவு பகிர்வு மற்றும் ஒத்துழைப்பின் வளர்ந்து வரும் போக்கைக் காட்டுகிறது:

Alibaba இன் Qwen 3 8B அடிப்படை மாதிரிக்கு (வடிகட்டுதல் என்று அழைக்கப்படும் செயல்முறை) R1-0528 பயன்படுத்தும் பகுத்தறிவு செயல்முறையைப் பயன்படுத்துவதன் மூலம், Qwen மாதிரியின் செயல்திறனில் 10% க்கும் அதிகமான முன்னேற்றத்தை DeepSeek உணர முடிந்தது.

வடிகட்டுதல் என்பது ஒரு பெரிய, மிகவும் சிக்கலான மாதிரியால் பெறப்பட்ட அறிவைப் பயன்படுத்தி, செயல்திறனில் பாராட்டுக்குரிய தரமிறக்கம் இல்லாமல், சிறிய மற்றும் மிகவும் திறமையான மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்குகிறது. இந்த நிகழ்வில் DeepSeek இன் R1-0528 அடிப்படையில் Alibaba இன் Qwen மாதிரி கற்றுக்கொள்ளக்கூடிய "ஆசிரியராக" செயல்பட்டது.

இந்த வகை கூட்டு அணுகுமுறை AI மாடல்களின் வளர்ச்சியை விரைவுபடுத்தலாம். மேலும் சிறப்பாக அடைய ஒவ்வொரு நிறுவனத்திற்கும் தனது நிபுணத்துவத்தைப் பயன்படுத்த உதவுகிறது.

தாக்கங்கள் மற்றும் எதிர்கால திசைகள்

DeepSeek இன் R1-0528 மேம்படுத்தல் AI சந்தையின் இயக்கவியல் மற்றும் போட்டித்தன்மையைக் காட்டுகிறது. பகுத்தறிவை மேம்படுத்துதல், மாயத்தோற்றங்களைக் குறைத்தல் மற்றும் புதிய பயன்பாட்டு பகுதிகளுக்கு மாதிரியை விரிவுபடுத்துவதற்கான DeepSeek இன் உறுதிப்பாடு எதிர்கால திட்டங்களை பரிந்துரைக்கிறது.

DeepSeek க்கும் அதன் அமெரிக்க பிரதிபலிப்பாளர்களுக்கும் இடையிலான தொடர்ச்சியான போட்டி புதுமையைத் தூண்டுகிறது மற்றும் அதிகரித்து வரும் அதிநவீன மற்றும் நடைமுறை AI தொழில்நுட்பங்களின் வளர்ச்சியை துரிதப்படுத்துகிறது.

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௬-௦௧

# AIGC # LLM # DeepSeek