AI இறையாண்மைக்கான தைவானின் தேடல் | ta

சீனாவின் செயற்கை நுண்ணறிவுத் துறையில், குறிப்பாக DeepSeek-R1 அறிமுகத்துடன் ஏற்பட்டுள்ள முன்னேற்றங்கள் உலகத்தின் கவனத்தை ஈர்த்துள்ளன. அதே நேரத்தில் தைவான், தனது தனித்துவமான கலாச்சார அடையாளத்தையும், ஜனநாயக விழுமியங்களையும் பிரதிபலிக்கும் மொழி மாதிரிகளை உருவாக்குவதில் ஒரு மாறுபட்ட பாதையை வகுத்து வருகிறது. சர்வாதிகார ஆட்சிகளால் செல்வாக்கு செலுத்தப்படும் AI அமைப்புகளுக்கு ஒரு எதிர் எடையை உருவாக்கும் நோக்கத்துடன் இது செயல்படுகிறது.

DeepSeek சவால்

ஜனவரியில் DeepSeek-R1 வெளியிடப்பட்டது தொழில்நுட்ப சமூகத்தில் கணிசமான ஆர்வத்தைத் தூண்டியது. இதற்கு முன்பு சீனாவின் மொழி மாதிரிகளான Baidu’s Ernie மற்றும் ByteDance’s Doubao போன்றவை சீன மொழி பயன்பாடுகள், கணிதம் மற்றும் குறியீட்டு முறையில் நம்பிக்கையளித்தன. ஆனால் அவை பலவீனமான ஆங்கில அறிவு மற்றும் அணுகக்கூடிய கட்டுப்பாடு காரணமாக குறைவாகவே பயன்படுத்தப்பட்டன. DeepSeek-R1 சர்வதேச அளவில் அங்கீகாரம் பெற்ற முதல் சீன LLM ஆக ஒரு முக்கியமான மைல்கல்லைக் குறித்தது.

DeepSeek-R1 இன் மிக முக்கியமான அம்சங்களில் ஒன்று, அதன் குறைந்த வளர்ச்சி செலவு ஆகும். OpenAI இன் GPT-4o பயிற்சிக்கு US$100 மில்லியனுக்கும் அதிகமாக செலவானதாகக் கூறப்படுகிறது. ஆனால் DeepSeek ஆராய்ச்சியாளர்கள் தங்கள் சாட்போட்டை வெறும் US$5.6 மில்லியனில் உருவாக்கியதாகக் கூறினர். செயல்திறன் பற்றிய கூற்றை மேலும் வலுப்படுத்தும் வகையில், DeepSeek பொறியாளர்கள் GPT-4o அல்லது Anthropic’s Claude போன்ற மாடல்களில் பயன்படுத்தப்படும் உயர்தர சிப்களுக்கு பதிலாக Nvidia H800 போன்ற மிட்-ரேஞ்ச் CPUகளைப் பயன்படுத்தி R1 மாடலை பயிற்றுவித்தனர். அமெரிக்காவின் கட்டுப்பாடுகள் இருந்தபோதிலும், உயர் செயல்திறன் சிப்களை சீனாவுக்கு ஏற்றுமதி செய்ய முடியவில்லை. DeepSeek-R1, GPT-4o மற்றும் Anthropic’s Claude மாடல்களை விஞ்சியது. மேலும் 256 சேவையகங்களில் பரவியிருக்கும் 2,048 செயலிகளைப் பயன்படுத்தி மற்ற முன்னணி பாட்களை விட சிறப்பாக செயல்பட்டது.

இந்த குறிப்பிடத்தக்க செயல்திறன் மற்றும் குறைந்த வளர்ச்சிச் செலவு ஆகியவை அதிநவீன நிரலாக்க நுட்பங்களுக்குக் காரணம் ஆகும். டெவலப்பர்கள் செயல்திறனைச் செம்மைப்படுத்தவும், ஹார்டுவேர் பயன்பாட்டை அதிகரிக்கவும் உதவும் அசெம்பிளி போன்ற மொழி PTX இதில் அடங்கும்.

வெளியான உடனேயே, DeepSeek-R1 செயலி அமெரிக்க Apple App Store இன் இலவச பதிவிறக்க தரவரிசையில் முதலிடத்திற்கு உயர்ந்தது. மேலும் ChatGPT, TikTok மற்றும் Meta சமூக ஊடக தளங்களை விஞ்சியது. DeepSeek-R1 அறிமுகத்தைத் தொடர்ந்து Nasdaq சரிவை சந்தித்தது. மேலும் Nvidia பங்குகள் வீழ்ச்சியடைந்தன.

DeepSeek கூற்றுகள் கேள்விக்குறியானது

ஆரம்ப உற்சாகம் இருந்தபோதிலும், பல பார்வையாளர்கள் DeepSeek இன் LLM தொடர்பான கூற்றுகளின் செல்லுபடியாகும் தன்மை குறித்து கேள்விகளை எழுப்பியுள்ளனர். ஆய்வாளர்கள் குறிப்பிட்ட புள்ளிவிவரங்கள் கணக்கீட்டுச் செலவுகளை மட்டுமே கணக்கிடுகின்றன என்றும், உள்கட்டமைப்பு, வன்பொருள் மற்றும் மனித வளச் செலவுகளைக் குறைக்கின்றன அல்லது புறக்கணிக்கின்றன என்றும் தெரிவித்துள்ளனர்.

தைப்பேயை தளமாகக் கொண்ட ஜெனரேட்டிவ் AI மற்றும் கிளவுட் கேமிங் சேவை வழங்குநரான Ubitus இன் நிறுவனர் மற்றும் CEO வெஸ்லி குவோ இந்த கவலைகளை எதிரொலித்தார். மேலும் உண்மையான செலவு அவர்கள் தெரிவிப்பதை விட அதிகமாக இருக்கும் என்று கூறினார். Nvidia இன் ஆதரவுடன் Ubitus, பாரம்பரிய சீன எழுத்துக்களைப் பயன்படுத்தி ஒரு உள்ளூர்மயமாக்கப்பட்ட LLM ஆன Project TAME ஐ ஆதரித்தது. அவர்கள் H100 CPU கள் மற்றும் கேமிங் தரவை வழங்கினர். Ubitus, Foxlink மற்றும் Shinfox Energy உடன் இணைந்து Ubilink.AI ஐ நிறுவியது. இது Asus உடன் இணைந்து தைவானின் மிகப்பெரிய பசுமை ஆற்றல் மூலம் இயங்கும் AI சூப்பர் கம்ப்யூட்டிங் சேவை மையத்தை உருவாக்கியது.

கேமிங், சுற்றுலா மற்றும் சில்லறை வணிகம் போன்ற துறைகளில் ஜப்பானிய அரசாங்கம் உட்பட அரசாங்கங்களுக்கான LLM பயன்பாடுகள் மற்றும் மாடல்களை உருவாக்குவதில் நிறுவனத்தின் பங்களிப்பை குவோ வலியுறுத்துகிறார். தொழிலாளர் பற்றாக்குறை மற்றும் வயதான மக்கள் தொகை போன்ற பிரச்சினைகளை AI எவ்வாறு தீர்க்கும் என்பதையும் அவர் எடுத்துக்காட்டுகிறார்.

தரவு ஒருமைப்பாடு கவலைகள்

DeepSeek மாதிரி வடிகட்டுதல் மூலம் தரவைப் பெற்றிருக்கலாம் என்று OpenAI மற்றும் Microsoft கூறியுள்ள கூற்றுகளுடன் குவோ உடன்படுகிறார். பெரிய மாடல்களின் வெளியீடுகளைப் பிரதிபலிக்கும் வகையில் சிறிய மொழி மாதிரிகளுக்கு பயிற்சி அளிப்பதை இந்த செயல்முறை உள்ளடக்கியது. OpenAI மற்றும் Microsoft, DeepSeek அதன் வளர்ச்சியை எளிதாக்க OpenAI இன் பயன்பாட்டு நிரலாக்க இடைமுகத்தைப் பயன்படுத்தியதாகக் கூறுகின்றன.

DeepSeek OpenAI இலிருந்து தரவைப் பெற்றது என்றும், நிறுவனத்தின் செயல்திறன் பற்றிய கூற்றுகளைச் சுற்றி தவறான புரிதல்கள் இருப்பதாகவும் குவோ கூறுகிறார். 670 பில்லியன் அளவுருக்களைக் கொண்ட DeepSeek-R1, Meta AI இன் Llama 3.1 405B ஐ விட கணிசமாக பெரியது என்று அவர் சுட்டிக்காட்டுகிறார். கணிப்புகளைச் செய்ய பயிற்சி செய்யும் போது ஒரு மாதிரி கற்றுக்கொள்ளும் உள் எண் மதிப்புகள் அளவுருக்கள் ஆகும். DeepSeek இன் மாதிரிகள் Llama 3.1 இலிருந்து வடிகட்டப்பட்டிருக்கலாம் என்றும் குவோ கூறுகிறார்.

இந்த மறுப்புகளுக்கு அப்பாற்பட்டு, DeepSeek-R1 இன் திறன்கள் குறித்து கவலைகள் எழுந்துள்ளன. அதன் முன்னோடிகளைப் போலவே, R1 சிறப்பு, பணி சார்ந்த செயல்பாடுகளில் சிறந்து விளங்குகிறது. ஆனால் பொது நோக்க செயல்திறனில் GPT-4o இன் பதிப்புகளை விட பின்தங்கியுள்ளது என்று நிபுணர்கள் கூறுகின்றனர்.

DeepSeek மாடல்களின் முக்கிய குறைபாடு தகவல் அணுகலில் உள்ள கட்டுப்பாடு ஆகும். முக்கியமான அரசியல் தலைப்புகள் பற்றிய விசாரணைகளுக்கு தெளிவற்ற பதில்கள் கிடைத்தன என்று பயனர்கள் கண்டறிந்தனர். சின்ஜியாங்கின் உய்குர் சிறுபான்மையினர் மற்றும் தைவான் போன்ற தலைப்புகளில், DeepSeek இன் பதில்கள் அதிகாரப்பூர்வ சீன கம்யூனிஸ்ட் கட்சியின் நிலைப்பாடுகளை பிரதிபலிக்கின்றன. ஜனநாயகம், மனித உரிமைகள் மற்றும் சீனாவின் சர்ச்சைக்குரிய இறையாண்மை உரிமைகள் தொடர்பான தகவல்களை அடக்குவதற்காக DeepSeek இன் வெளியீடுகளில் கணிசமான பகுதி தணிக்கை செய்யப்படுகின்றன என்று ஆராய்ச்சி கூறுகிறது.

தைவானின் மாற்று: TAIDE மற்றும் அதற்கு அப்பால்

இதற்கு பதிலடியாக, தைவானில் உருவாக்கப்பட்ட LLM-கள், TAME போன்றவை Sinosphere இல் DeepSeek க்கு மாற்றாக வெளிவந்துள்ளன. தேசிய பயன்பாட்டு ஆராய்ச்சி நிறுவனத்தால் (National Institute of Applied Research) ஜூன் 2023 இல் தொடங்கப்பட்ட Trustworthy AI Dialogue Engine (TAIDE), தைவானின் சமூக, கலாச்சார மற்றும் மொழி விதிமுறைகளுக்கு ஏற்ப ஒரு மாதிரியை உருவாக்க இலக்கு கொண்டுள்ளது.

TAIDE இன் பணிகள் நிறுத்தப்பட்டதாக தோன்றினாலும், இது Project TAME க்கு ஒரு முக்கியமான அளவுகோலாக செயல்பட்டது. தேசிய தைவான் பல்கலைக்கழகத்தில் (National Taiwan University) உள்ள Machine Intelligence and Understanding Laboratory (MiuLab) உருவாக்கிய TAME, பல்வேறு அமைப்புகளின் நிதி உதவியுடன் 500 பில்லியன் டோக்கன்களில் பயிற்றுவிக்கப்பட்டது. பல்கலைக்கழக நுழைவு, பார் மற்றும் பாரம்பரிய சீன மருத்துவ தேர்வுகள் உட்பட 39 மதிப்பீடுகளில் GPT-4o உட்பட போட்டியாளர்களை விஞ்சியது.

TAME இன் நோக்கங்களில் ஒன்று உள்ளூர் கலாச்சாரத்தை மேம்படுத்துவதாகும். உள்ளூர் மொழி திறன்களை திறப்பது ஒரு முக்கியமான படியாகும். விஸ்பரை அடிப்படையாகக் கொண்ட தைவானிய குரல் LLM இன் வளர்ச்சியை குவோ குறிப்பிடுகிறார். இது தைவானிய வாய்மொழியைப் புரிந்துகொள்வதில் சாதகமான முடிவுகளைப் பெற்றுள்ளது. ஹக்கா மொழி அங்கீகாரத்தை மேம்படுத்துவதற்கான முயற்சிகள் நடந்து வருகின்றன.

இந்த முயற்சிகள் இந்த மொழிகள் பரவலாக உள்ள பிராந்தியங்களில் உள்ள நிறுவனங்களால் நல்ல வரவேற்பைப் பெற்றுள்ளன. பழங்குடி மொழி அங்கீகாரத்தில் மாதிரிக்கு பயிற்சி அளிப்பதற்கும் முயற்சிகள் மேற்கொள்ளப்படுகின்றன. ஆனால் வரையறுக்கப்பட்ட தரவு ஒரு தடையாக உள்ளது. AI க்கு ஒரு புதிய மொழியைக் கற்கப் பயிற்சி அளிக்க குரல் பதிவுகள் நிறைய தேவைப்படுகிறது. அத்துடன் உரையும் தேவைப்படுகிறது.

அரசாங்க காப்பகங்களில் உள்ள வரலாற்றுத் தரவை அணுகுவது மற்றொரு வாய்ப்பை வழங்குகிறது. இருப்பினும் சில தரவுகள் பதிப்புரிமையால் பாதுகாக்கப்படுகின்றன. செயற்கை பொது நுண்ணறிவின் தோற்றம் அழிந்து வரும் மற்றும் அழிந்துபோன மொழிகளை புதுப்பிக்க உதவும் திறனை வழங்குகிறது.

AI இறையாண்மைக்கான தேடல்

தொழில் ஆலோசகரும், Market Intelligence & Consulting Institute (MIC) இயக்குனருமான ஜூலியன் சூ, LLM மாதிரிகள் மற்றும் பயிற்சி தரவுகளில் உள்ள சாத்தியமான சார்புநிலையை வலியுறுத்துகிறார். பாரம்பரிய எழுத்துக்களைப் பயன்படுத்தும் போது கூட, LLM வெளியீடுகள் சீனாவின் மக்கள் குடியரசின் பாணியை பிரதிபலிக்கக்கூடும் என்றும் தைவானின் கலாச்சாரத்தைப் பிடிக்கத் தவறக்கூடும் என்றும் அவர் குறிப்பிடுகிறார். தைவானிய நிறுவனங்கள் தைவானிய மொழி அல்லது தரவைப் பயன்படுத்தி LLM களுக்கு பயிற்சி அளித்து AI இறையாண்மையை உருவாக்குவதே இதன் நோக்கமாகும்.

தைவான் வெப் சர்வீஸ் மூலம் செப்டம்பர் 2023 இல் வெளியிடப்பட்ட மற்றொரு நம்பிக்கைக்குரிய தைவான் LLM ஆக Formosa Foundation Model (FFM-Llama2) ஐ சூ குறிப்பிடுகிறார். இது AI ஐ ஜனநாயகப்படுத்துவதை நோக்கமாகக் கொண்டது. Foxconn மார்ச் மாதத்தில் அதன் LLM, FoxBrain ஐ அறிமுகப்படுத்தியது. இருப்பினும் சில விமர்சகர்கள் பெரிய நிறுவனங்கள் LLM களில் ஈடுபடுவதை சந்தேகிக்கின்றனர்.

TAME ஐ உருவாக்கிய MiuLab குழுவின் உறுப்பினரான லின் யென்-டிங், தைவான் தொடர்பான தகவல் சூழலில் உள்ள இடைவெளியை நிவர்த்தி செய்ய வேண்டியதன் அவசியத்தை வலியுறுத்துகிறார். DeepSeek-R1 மற்றும் பிற சீன LLM கள் தைவானைப் பற்றிய தவறான கண்ணோட்டத்தை முன்வைக்கின்றன என்று அவர் குறிப்பிடுகிறார். அமெரிக்காவில் உருவாக்கப்பட்ட மாதிரிகள் கூட சில சமயங்களில் தைவானைத் தவறாக சித்தரிக்கக்கூடும். திறந்த மூல மாதிரிகள் தைவானுக்கு முன்னுரிமை அளிக்காது. பயிற்சி தரவுகளில் சீனா ஆதிக்கம் செலுத்துகிறது.

எனவே தைவானிய உள்ளடக்கத்தை தேர்ந்தெடுத்து இணைத்து, மாதிரிக்கு மறு பயிற்சி அளிப்பது முக்கியம். இந்த செயலூக்கமான அணுகுமுறை தைவானின் தனித்துவமான கலாச்சார மற்றும் மொழி நிலப்பரப்பு டிஜிட்டல் உலகில் துல்லியமாக குறிப்பிடப்படுவதை உறுதி செய்கிறது. மேலும் உலகளாவிய AI வளர்ச்சியில் தேசிய அடையாள உணர்வை வளர்த்து அதன் தனித்துவமான பாரம்பரியத்தைப் பாதுகாக்கிறது. தைவானிய அடையாளத்தைப் பாதுகாப்பதற்கான இந்த அர்ப்பணிப்பு, தீவு தேசத்தின் தனித்துவமான கலாச்சாரம் மற்றும் மதிப்புகள் ஆதிக்கம் செலுத்தும் கதைகளால் மறைக்கப்படாமல் இருப்பதை உறுதி செய்கிறது.

இந்த முயற்சியில் உள்ளார்ந்த சவால்கள் கணிசமானவை. உண்மையான பிரதிநிதித்துவ AI மாதிரியை உருவாக்குவதற்கு உள்ளூர்மயமாக்கப்பட்ட உள்ளடக்கத்தின் பரந்த தரவுத்தொகுப்புகளுக்கான அணுகல் மற்றும் இயற்கை மொழி செயலாக்கத்தில் நிபுணத்துவம் உள்ளிட்ட வளங்களின் குறிப்பிடத்தக்க முதலீடு தேவைப்படுகிறது. மேலும் தவறான தகவல் மற்றும் சார்பு தகவல்களை எதிர்த்துப் போராடுவதற்கான தொடர்ச்சியான தேவை சுத்திகரிப்பு மற்றும் தழுவலின் தொடர்ச்சியான செயல்முறையை கட்டாயமாக்குகிறது.

இந்த சவால்கள் இருந்தபோதிலும் AI இறையாண்மைக்கான தைவானின் அர்ப்பணிப்பு உறுதியாக உள்ளது. TAME மற்றும் பிற உள்ளூர்மயமாக்கப்பட்ட LLM களின் வளர்ச்சி செயற்கை நுண்ணறிவின் எதிர்காலம் தீவின் தனித்துவமான கலாச்சார அடையாளம், ஜனநாயக விழுமியங்கள் மற்றும் உலகில் அதன் தனித்துவமான இடத்தைப் பாதுகாப்பதற்கான அசைக்க முடியாத உறுதிப்பாட்டை பிரதிபலிப்பதை உறுதி செய்வதற்கான ஒரு முக்கியமான படியாகும். AI இறையாண்மைக்கு முன்னுரிமை அளிப்பதன் மூலம் தைவான் தனது கலாச்சார பாரம்பரியத்தைப் பாதுகாப்பது மட்டுமல்லாமல், கலாச்சார அடையாளத்தையும் ஜனநாயகக் கோட்பாடுகளையும் பாதுகாப்பதோடு தொழில்நுட்ப முன்னேற்றத்தை இணைக்க முடியும் என்பதை நிரூபித்து உலகளாவிய AI நிலப்பரப்பில் ஒரு முக்கிய வீரராக தன்னை நிலைநிறுத்திக் கொள்கிறது.

பயணத்தைத் தொடர்கிறது

முழுமையான AI இறையாண்மையை நோக்கிய பயணம் தொடர்கிறது. மேலும் ஆராய்ச்சி, மேம்பாடு மற்றும் ஒத்துழைப்பு ஆகியவை சவால்களை சமாளிப்பதற்கும் இந்த முயற்சிகளின் நீண்டகால வெற்றியை உறுதி செய்வதற்கும் முக்கியமானவை. AI இறையாண்மைக்கு தொடர்ந்து முன்னுரிமை அளிப்பதன் மூலம் தைவான் தனது தனித்துவமான கலாச்சார அடையாளத்தையும் ஜனநாயக விழுமியங்களையும் உண்மையாக பிரதிபலிக்கும் டிஜிட்டல் நிலப்பரப்பை உருவாக்க முடியும். மேலும் பெருகிய முறையில் ஒன்றோடொன்று இணைக்கப்பட்ட உலகில் தங்கள் தனித்துவமான இடத்தைத் தக்க வைத்துக் கொள்ள முயற்சிக்கும் மற்ற நாடுகளுக்கு ஒரு முன்மாதிரியாக அமைகிறது.

DeepSeek சவால்: தைவானின் பதில்

சீனாவின் DeepSeek-R1 செயற்கை நுண்ணறிவு அறிமுகம் ஒரு உலகளாவிய தாக்கத்தை ஏற்படுத்தியுள்ளது. தைவான் தனது கலாச்சார விழுமியங்களைப் பிரதிபலிக்கும் ஒரு தனித்துவமான பாதையை உருவாக்க முயல்கிறது.

தைவான் தனது தனித்துவமான கலாச்சார அடையாளத்தையும், ஜனநாயக விழுமியங்களையும் பிரதிபலிக்கும் மொழி மாதிரிகளை உருவாக்குவதில் ஒரு மாறுபட்ட பாதையை வகுத்து வருகிறது. சர்வாதிகார ஆட்சிகளால் செல்வாக்கு செலுத்தப்படும் AI அமைப்புகளுக்கு ஒரு எதிர் எடையை உருவாக்கும் நோக்கத்துடன் இது செயல்படுகிறது. தைவான் DeepSeek-R1க்கு சவால் விடுகிறது. இந்த LLM ஆனது ஜனவரியில் வெளியிடப்பட்டது. இது சீன மொழிப் பயன்பாடுகள், கணிதம் மற்றும் குறியீட்டு முறையில் நம்பிக்கையளித்தது. ஆனால் அவை பலவீனமான ஆங்கில அறிவு மற்றும் அணுகக்கூடிய கட்டுப்பாடு காரணமாக குறைவாகவே பயன்படுத்தப்பட்டன. DeepSeek-R1 சர்வதேச அளவில் அங்கீகாரம் பெற்ற முதல் சீன LLM ஆக ஒரு முக்கியமான மைல்கல்லைக் குறித்தது. GPT-4o பயிற்சிக்கு US$100 மில்லியனுக்கும் அதிகமாக செலவானதாகக் கூறப்படுகிறது. ஆனால் DeepSeek ஆராய்ச்சியாளர்கள் தங்கள் சாட்போட்டை வெறும் US$5.6 மில்லியனில் உருவாக்கியதாகக் கூறினர். செயல்திறன் பற்றிய கூற்றை மேலும் வலுப்படுத்தும் வகையில், DeepSeek பொறியாளர்கள் GPT-4o அல்லது Anthropic’s Claude போன்ற மாடல்களில் பயன்படுத்தப்படும் உயர்தர சிப்களுக்கு பதிலாக Nvidia H800 போன்ற மிட்-ரேஞ்ச் CPUகளைப் பயன்படுத்தி R1 மாடலை பயிற்றுவித்தனர். அமெரிக்காவின் கட்டுப்பாடுகள் இருந்தபோதிலும், உயர் செயல்திறன் சிப்களை சீனாவுக்கு ஏற்றுமதி செய்ய முடியவில்லை. DeepSeek-R1, GPT-4o மற்றும் Anthropic’s Claude மாடல்களை விஞ்சியது. மேலும் 256 சேவையகங்களில் பரவியிருக்கும் 2,048 செயலிகளைப் பயன்படுத்தி மற்ற முன்னணி பாட்களை விட சிறப்பாக செயல்பட்டது. அசெம்பிளி போன்ற மொழி PTX டெவலப்பர்கள் செயல்திறனைச் செம்மைப்படுத்தவும், ஹார்டுவேர் பயன்பாட்டை அதிகரிக்கவும் உதவியது. வெளியான உடனேயே, DeepSeek-R1 செயலி அமெரிக்க Apple App Store இன் இலவச பதிவிறக்க தரவரிசையில் முதலிடத்திற்கு உயர்ந்தது. ChatGPT, TikTok மற்றும் Meta சமூக ஊடக தளங்களை விஞ்சியது. DeepSeek-R1 அறிமுகத்தைத் தொடர்ந்து Nasdaq சரிவை சந்தித்தது. மேலும் Nvidia பங்குகள் வீழ்ச்சியடைந்தன.

DeepSeek கூற்றுகள் கேள்விக்குறியானது

பல பார்வையாளர்கள் DeepSeek இன் LLM தொடர்பான கூற்றுகளின் செல்லுபடியாகும் தன்மை குறித்து கேள்விகளை எழுப்பியுள்ளனர். ஆய்வாளர்கள் குறிப்பிட்ட புள்ளிவிவரங்கள் கணக்கீட்டுச் செலவுகளை மட்டுமே கணக்கிடுகின்றன என்றும், உள்கட்டமைப்பு, வன்பொருள் மற்றும் மனித வளச் செலவுகளைக் குறைக்கின்றன அல்லது புறக்கணிக்கின்றன என்றும் தெரிவித்துள்ளனர். தைப்பேயை தளமாகக் கொண்ட ஜெனரேட்டிவ் AI மற்றும் கிளவுட் கேமிங் சேவை வழங்குநரான Ubitus இன் நிறுவனர் மற்றும் CEO வெஸ்லி குவோ இந்த கவலைகளை எதிரொலித்தார். மேலும் உண்மையான செலவு அவர்கள் தெரிவிப்பதை விட அதிகமாக இருக்கும் என்று கூறினார். Nvidia இன் ஆதரவுடன் Ubitus, பாரம்பரிய சீன எழுத்துக்களைப் பயன்படுத்தி ஒரு உள்ளூர்மயமாக்கப்பட்ட LLM ஆன Project TAME ஐ ஆதரித்தது. அவர்கள் H100 CPU கள் மற்றும் கேமிங் தரவை வழங்கினர். Ubitus, Foxlink மற்றும் Shinfox Energy உடன் இணைந்து Ubilink.AI ஐ நிறுவியது. இது Asus உடன் இணைந்து தைவானின் மிகப்பெரிய பசுமை ஆற்றல் மூலம் இயங்கும் AI சூப்பர் கம்ப்யூட்டிங் சேவை மையத்தை உருவாக்கியது. OpenAI மற்றும் Microsoft, DeepSeek அதன் வளர்ச்சியை எளிதாக்க OpenAI இன் பயன்பாட்டு நிரலாக்க இடைமுகத்தைப் பயன்படுத்தியதாகக் கூறுகின்றன. DeepSeek OpenAI இலிருந்து தரவைப் பெற்றது என்றும், நிறுவனத்தின் செயல்திறன் பற்றிய கூற்றுகளைச் சுற்றி தவறான புரிதல்கள் இருப்பதாகவும் குவோ கூறுகிறார். 670 பில்லியன் அளவுருக்களைக் கொண்ட DeepSeek-R1, Meta AI இன் Llama 3.1 405B ஐ விட கணிசமாக பெரியது என்று அவர் சுட்டிக்காட்டுகிறார். DeepSeek இன் மாதிரிகள் Llama 3.1 இலிருந்து வடிகட்டப்பட்டிருக்கலாம் என்றும் குவோ கூறுகிறார். R1 சிறப்பு, பணி சார்ந்த செயல்பாடுகளில் சிறந்து விளங்குகிறது. ஆனால் பொது நோக்க செயல்திறனில் GPT-4o இன் பதிப்புகளை விட பின்தங்கியுள்ளது என்று நிபுணர்கள் கூறுகின்றனர். முக்கியமான அரசியல் தலைப்புகள் பற்றிய விசாரணைகளுக்கு தெளிவற்ற பதில்கள் கிடைத்தன என்று பயனர்கள் கண்டறிந்தனர். சின்ஜியாங்கின் உய்குர் சிறுபான்மையினர் மற்றும் தைவான் போன்ற தலைப்புகளில், DeepSeek இன் பதில்கள் அதிகாரப்பூர்வ சீன கம்யூனிஸ்ட் கட்சியின் நிலைப்பாடுகளை பிரதிபலிக்கின்றன. ஜனநாயகம், மனித உரிமைகள் மற்றும் சீனாவின் சர்ச்சைக்குரிய இறையாண்மை உரிமைகள் தொடர்பான தகவல்களை அடக்குவதற்காக DeepSeek இன் வெளியீடுகளில் கணிசமான பகுதி தணிக்கை செய்யப்படுகின்றன என்று ஆராய்ச்சி கூறுகிறது.

தைவானின் மாற்று: TAIDE மற்றும் அதற்கு அப்பால்

இதற்கு பதிலடியாக தைவானில் உருவாக்கப்பட்ட LLM-கள், TAME போன்றவை Sinosphere இல் DeepSeek க்கு மாற்றாக வெளிவந்துள்ளன. ஜூன் 2023 இல் தொடங்கப்பட்ட Trustworthy AI Dialogue Engine (TAIDE), தைவானின் சமூக, கலாச்சார மற்றும் மொழி விதிமுறைகளுக்கு ஏற்ப ஒரு மாதிரியை உருவாக்க இலக்கு கொண்டுள்ளது. TAIDE இன் பணிகள் நிறுத்தப்பட்டதாக தோன்றினாலும், இது Project TAME க்கு ஒரு முக்கியமான அளவுகோலாக செயல்பட்டது. தேசிய தைவான் பல்கலைக்கழகத்தில் (National Taiwan University) உள்ள Machine Intelligence and Understanding Laboratory (MiuLab) உருவாக்கிய TAME, பல்வேறு அமைப்புகளின் நிதி உதவியுடன் 500 பில்லியன் டோக்கன்களில் பயிற்றுவிக்கப்பட்டது. பல்கலைக்கழக நுழைவு, பார் மற்றும் பாரம்பரிய சீன மருத்துவ தேர்வுகள் உட்பட 39 மதிப்பீடுகளில் GPT-4o உட்பட போட்டியாளர்களை விஞ்சியது. TAME இன் நோக்கங்களில் ஒன்று உள்ளூர் கலாச்சாரத்தை மேம்படுத்துவதாகும். விஸ்பரை அடிப்படையாகக் கொண்ட தைவானிய குரல் LLM இன் வளர்ச்சியை குவோ குறிப்பிடுகிறார். இது தைவானிய வாய்மொழியைப் புரிந்துகொள்வதில் சாதகமான முடிவுகளைப் பெற்றுள்ளது. ஹக்கா மொழி அங்கீகாரத்தை மேம்படுத்துவதற்கான முயற்சிகள் நடந்து வருகின்றன. பழங்குடி மொழி அங்கீகாரத்தில் மாதிரிக்கு பயிற்சி அளிப்பதற்கும் முயற்சிகள் மேற்கொள்ளப்படுகின்றன. ஆனால் வரையறுக்கப்பட்ட தரவு ஒரு தடையாக உள்ளது. அரசாங்க காப்பகங்களில் உள்ள வரலாற்றுத் தரவை அணுகுவது மற்றொரு வாய்ப்பை வழங்குகிறது. இருப்பினும் சில தரவுகள் பதிப்புரிமையால் பாதுகாக்கப்படுகின்றன. செயற்கை பொது நுண்ணறிவின் தோற்றம் அழிந்து வரும் மற்றும் அழிந்துபோன மொழிகளை புதுப்பிக்க உதவும் திறனை வழங்குகிறது.

AI இறையாண்மைக்கான தேடல்

மொழி மற்றும் கலாச்சாரத்தின் கலவையானது தைவானிய அடையாளத்தை வலுப்படுத்துவதற்கும், தைவானின் கதையை தொடர்புகொள்வதற்கும், அதன் தகவல் சூழலைப் பாதுகாப்பதற்கும் ஒரு வழியாக AI இறையாண்மையின் முக்கியத்துவத்தை அடிக்கோடிட்டுக் காட்டுகிறது. தொழில் ஆலோசகரும், Market Intelligence & Consulting Institute (MIC) இயக்குனருமான ஜூலியன் சூ, LLM மாதிரிகள் மற்றும் பயிற்சி தரவுகளில் உள்ள சாத்தியமான சார்புநிலையை வலியுறுத்துகிறார். பாரம்பரிய எழுத்துக்களைப் பயன்படுத்தும் போது கூட, LLM வெளியீடுகள் சீனாவின் மக்கள் குடியரசின் பாணியை பிரதிபலிக்கக்கூடும் என்றும் தைவானின் கலாச்சாரத்தைப் பிடிக்கத் தவறக்கூடும் என்றும் அவர் குறிப்பிடுகிறார். தைவானிய நிறுவனங்கள் தைவானிய மொழி அல்லது தரவைப் பயன்படுத்தி LLM களுக்கு பயிற்சி அளித்து AI இறையாண்மையை உருவாக்குவதே இதன் நோக்கமாகும். தைவான் வெப் சர்வீஸ் மூலம் செப்டம்பர் 2023 இல் வெளியிடப்பட்ட மற்றொரு நம்பிக்கைக்குரிய தைவான் LLM ஆக Formosa Foundation Model (FFM-Llama2) ஐ சூ குறிப்பிடுகிறார். இது AI ஐ ஜனநாயகப்படுத்துவதை நோக்கமாகக் கொண்டது. Foxconn மார்ச் மாதத்தில் அதன் LLM, FoxBrain ஐ அறிமுகப்படுத்தியது. TAME ஐ உருவாக்கிய MiuLab குழுவின் உறுப்பினரான லின் யென்-டிங், தைவான் தொடர்பான தகவல் சூழலில் உள்ள இடைவெளியை நிவர்த்தி செய்ய வேண்டியதன் அவசியத்தை வலியுறுத்துகிறார். DeepSeek-R1 மற்றும் பிற சீன LLM கள் தைவானைப் பற்றிய தவறான கண்ணோட்டத்தை முன்வைக்கின்றன என்று அவர் குறிப்பிடுகிறார். அமெரிக்காவில் உருவாக்கப்பட்ட மாதிரிகள் கூட சில சமயங்களில் தைவானைத் தவறாக சித்தரிக்கக்கூடும். திறந்த மூல மாதிரிகள் தைவானுக்கு முன்னுரிமை அளிக்காது. பயிற்சி தரவுகளில் சீனா ஆதிக்கம் செலுத்துகிறது. எனவே தைவானிய உள்ளடக்கத்தை தேர்ந்தெடுத்து இணைத்து மாதிரிக்கு மறு பயிற்சி அளிப்பது முக்கியம். இந்த செயலூக்கமான அணுகுமுறை தைவானின் தனித்துவமான கலாச்சார மற்றும் மொழி நிலப்பரப்பு டிஜிட்டல் உலகில் துல்லியமாக குறிப்பிடப்படுவதை உறுதி செய்கிறது. மேலும் உலகளாவிய AI வளர்ச்சியில் தேசிய அடையாள உணர்வை வளர்த்து அதன் தனித்துவமான பாரம்பரியத்தைப் பாதுகாக்கிறது.

பயணத்தைத் தொடர்கிறது

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௫-௦௯

# Chatbot # Llama # DeepSeek