ஆராய்வு திறன் LLM புதுமைக்கு டீப்ஸீக்-R1
டீப்ஸீக்-R1, ஆராய்ச்சி மற்றும் மேம்பாட்டை துரிதப்படுத்த உதவியது. தரவு தரம், பயிற்சி நுட்பங்கள், மற்றும் வலுவூட்டல் கற்றல் வழிமுறைகள் ஆகியவை காரணிகள்.
டீப்ஸீக்-R1, ஆராய்ச்சி மற்றும் மேம்பாட்டை துரிதப்படுத்த உதவியது. தரவு தரம், பயிற்சி நுட்பங்கள், மற்றும் வலுவூட்டல் கற்றல் வழிமுறைகள் ஆகியவை காரணிகள்.
OpenAI o4-mini மாதிரியை வலுவூட்டல் ஃபைன்-ட்யூனிங் மூலம் தனிப்பயனாக்கி, நிறுவனத்தின் தேவைகளுக்கு ஏற்ப AI-ஐ மாற்றலாம்.
அறிவு வடிகட்டல் என்பது பெரிய AI மாதிரிகள் சிறிய மாதிரிகளுக்கு அறிவை வழங்கும் நுட்பம். இது AI செயல்திறனை அதிகரிக்கிறது.
Nvidia வின் புதிய திறந்த மூல மாதிரி DeepSeek-R1 ஐ விஞ்சியது. 140,000 H100 பயிற்சி மணிநேரங்கள் பற்றிய விவரங்கள் இங்கே.
6,000 மாதிரி தரவுகளில் பயிற்சி பெற்ற மைக்ரோசாஃப்ட்டின் சிறிய மாடல் அசாதாரணமான பகுத்தறிவு திறன்களைக் கொண்டுள்ளது.
Meta's LlamaCon மாநாடு LLM மற்றும் multimodal பயன்பாடுகளை ஆராய்ந்தது. புதிய மாடல்கள் அறிமுகம் செய்யப்படவில்லை, ஆனால் தொழில்நுட்பத்தின் எதிர்காலத்தைப் பற்றி விவாதிக்கப்பட்டது.
டீப்ஸீக்கின் விலை குறைக்கப்பட்ட அடித்தள மாதிரிகள், AI பயன்பாட்டின் முக்கிய தடையை தகர்த்து, நிறுவனங்கள் மத்தியில் AI தத்தெடுப்பை அதிகரிக்கும்.
மைக்ரோசாஃப்ட் ஃபை-4-ரீசனிங்-பிளஸ் ஐ அறிமுகப்படுத்துகிறது, இது சிக்கலான பணிகளுக்கு வடிவமைக்கப்பட்ட திறந்த-எடை மொழி மாதிரி. இது கணிதம், அறிவியல், குறியீட்டு முறை மற்றும் தர்க்கரீதியான சிக்கல்களில் சிறந்து விளங்குகிறது. ஃபை-4 கட்டமைப்பை அடிப்படையாகக் கொண்டது, மேற்பார்வையிடப்பட்ட சிறந்த-சரிப்படுத்தும் மற்றும் வலுவூட்டல் கற்றல் நுட்பங்களைப் பயன்படுத்துகிறது.
அமேசான் நோவா மாதிரிகளைப் பயன்படுத்தி கருவி பயன்பாட்டை மேம்படுத்துதல், தனிப்பயனாக்கம் மூலம்.
GPT-4.1 வழிமுறைகளை பின்பற்றுவதில் சிறப்பாக இருந்தும், முந்தையதை விட நம்பகத்தன்மை குறைவாக உள்ளதா? AI வளர்ச்சியின் திசை பற்றிய விவாதத்தை தூண்டுகிறது.