மைக்ரோசாஃப்ட் ஃபை-4 ரீசனிங்: SLM க்கள் பெரியவர்களைப் போல சிந்திக்க முடியும்!
மைக்ரோசாஃப்ட்டின் ஃபை-4 ரீசனிங் மேம்பட்ட பகுத்தறிவு திறன் கொண்ட சிறிய, திறந்த-எடை (MIT உரிமம் பெற்றது), வேகமான, திறமையான SLMகளை வழங்குகிறது.
மைக்ரோசாஃப்ட், OpenAI இன் சலுகை பெற்ற பங்குதாரராகவும், அவர்களின் AI மாடல்களை Azure AI ஃபவுண்டரியில் ஒருங்கிணைக்க பெரும்பாலான வீரர்களுடன் இணைந்து பணியாற்றி வருகிறது. இருப்பினும் சொந்த தொழில்நுட்ப முயற்சிகளை மேற்கொள்வதில் பின்வாங்கவில்லை. இதில் நரம்பியல் நெட்வொர்க்குகளின் மையத்தில் உள்ள கண்டுபிடிப்புகள் அடங்கும். ட்ரிட் அடிப்படையிலான கவர்ச்சிகரமான பிட்நெட் பி1.58 மாதிரி, அதன் சொந்த திறந்த மூல SLMகள் மற்றும் ரகசியமாக வைக்கப்பட்டுள்ள எல்லை மாதிரிகள் (Project MAI-1) போன்றவை அடங்கும்.
சிறிய AI மாடல்களின் (SLMகள்) வரம்பான ஃபை-3 ஐ அறிமுகப்படுத்தி ஒரு வருடம் கழித்தும், மல்டிமோடல் SLM (ஃபை-4-மல்டிமோடல்) மற்றும் ஒரு சிறிய மாதிரி (ஃபை-4-மினி) உடன் 4வது தலைமுறையை அறிமுகப்படுத்திய இரண்டு மாதங்களுக்குப் பிறகும், மைக்ரோசாஃப்ட் அதன் சமீபத்திய தலைமுறை SLM-ன் மூன்று புதிய வகைகளை அறிவிக்கிறது: ஃபை-4-ரீசனிங், ஃபை-4-ரீசனிங்-பிளஸ் மற்றும் ஃபை-4-மினி-ரீசனிங்.
ஏப்ரல் 30, 2025 அன்று வெளியிடப்பட்ட இந்த “பகுத்தறிவு-ஒருங்கிணைந்த” பதிப்புகள், குறைந்த தாமதத்தை பராமரிக்க வேண்டிய அதே நேரத்தில் சிக்கலான பகுத்தறிவு தேவைப்படும் டெவலப்பர்களுக்கான சிறிய மாதிரிகளின் திறந்த எடை சலுகையை விரிவுபடுத்துகின்றன.
மைக்ரோசாஃப்ட் பொறியாளர்கள் SLMகளை “பகுத்தறிவுக்கு” உருவாக்கும் அணுகுமுறையின் இதயம்: OpenAI இன் பகுத்தறிவு சங்கிலிகளான o3-மினியிலிருந்து நுண்ணிய மேற்பார்வையை (SFT) நம்பியிருப்பது மற்றும் “பிளஸ்” பதிப்பிற்கு வலுவூட்டல் கற்றலைப் (RL) பயன்படுத்துவது. “வடித்தல், வலுவூட்டல் கற்றல் மற்றும் உயர்தர தரவு மூலம், இந்த மாதிரிகள் அளவு மற்றும் செயல்திறனை சமரசம் செய்கின்றன,” என்று மைக்ரோசாஃப்ட் விளக்குகிறது.
சிறியது ஆனால் திறமையானது
சந்தையின் பல்வேறு முன்னணி அளவுகோல்களில் கிடைத்த முடிவுகள் போட்டியாளர்களுக்கு அதிர்ச்சியை அளிக்கும் வகையில் உள்ளன: பொதுவாக 14 பில்லியன் அளவுருக்கள் மட்டுமே கொண்டு, ஃபை-4-ரீசனிங் டீப் சீக்-ஆர்1-டிஸ்டில்-லாமா-70B (70 பில்லியன் அளவுருக்கள்) மாடலை AIME 2025, MMLU-Pro அல்லது HumanEval-Plus தொடர்களில் மிஞ்சுகிறது. மேலும் முழுமையான டீப் சீக்-ஆர்1 மாடலை (671 பில்லியன் அளவுருக்கள்) நெருங்குகிறது! அதே 14 பில்லியன் அளவுருக்களில் சீரமைக்கப்பட்டு, 1.5 மடங்கு அதிகமான டோக்கன்களுடன் பயிற்சி அளிக்கப்பட்ட ஃபை-4-ரீசனிங்-பிளஸ் மாறுபாடு, OmniMath இல் OpenAI இன் o3-மினி மதிப்பெண்களை ஏறக்குறைய எட்டுகிறது! தகவலுக்கு, ஃபை-4-ரீசனிங் கிளாசிக் 128,000 டோக்கன் சூழல் சாளரத்திலிருந்து பயனடைகிறது. இது ஃபை-4-ரீசனிங்-பிளஸ் பதிப்பிற்கு 256,000 டோக்கன்களாக நீட்டிக்கப்பட்டுள்ளது.
உள்ளமைக்கப்பட்ட அமைப்புகளுக்காக வடிவமைக்கப்பட்ட ஃபை-4-மினி-ரீசனிங் 3.8 பில்லியன் அளவுருக்களைக் காட்டுகிறது, டீப் சீக்-ஆர்1 ஆல் உருவாக்கப்பட்ட ஒரு மில்லியன் கணித சிக்கல்களின் செயற்கை தொகுப்பு மற்றும் Math-500 இல் o1-மினி செயல்திறனை அடைகிறது. அதே நேரத்தில் 7 முதல் 8 பில்லியன் அளவுருக்கள் கொண்ட பல மாடல்களை மிஞ்சுகிறது. அதன் சிறிய அளவுடன், இந்த மாதிரி மொபைல் சாதனங்கள் உட்பட உள்ளூர் செயலாக்கத்திற்கும், கிட்டத்தட்ட உடனடி பதில்களுக்கான தேவைக்கும் ஏற்றது. இது குறிப்பாக கல்வி பயன்பாடுகள் மற்றும் உள்ளூர் சாட்போட்களுக்கு ஏற்றது.
மாறுபட்ட பயன்பாடுகளுக்கான திறந்த மாதிரிகள்
Deployment பக்கத்தில், CISOs இந்த மாதிரிகள் ஏற்கனவே Copilot+ PCகளுக்கு உகந்ததாக இருப்பதைக் காண்பார்கள்: NPU மாறுபாடான “ஃபை சிலிகா” நினைவகத்தில் முன்பே ஏற்றப்பட்டுள்ளது. மேலும் வணிக பயன்பாடுகளுடன் ஆற்றல் திறன்மிக்க கூட்டுவாழ்வை உறுதிசெய்து, கிட்டத்தட்ட உடனடி பதில் நேரத்தை வழங்குகிறது. விண்டோஸ் APIகள் ஆஃப்லைன் உற்பத்தியை Outlook அல்லது உள் கருவிகளில் ஒருங்கிணைக்க அனுமதிக்கின்றன.
பாதுகாப்பு அடிப்படையில், மைக்ரோசாஃப்ட் பொறுப்புக்கூறல், நியாயம், நம்பகத்தன்மை, பாதுகாப்பு மற்றும் உள்ளடக்கம் ஆகிய கொள்கைகளுக்கு ஏற்ப ஒரு pipeline உள்ளது என்று கூறுகிறது. பொது மற்றும் உள் “உதவும் தன்மை/தீங்கற்ற தன்மை” சார்ந்த தொகுப்புகளிலிருந்து SFT, டைரக்ட் விருப்பத்தேர்வு தேர்வுமுறை மற்றும் RLHF ஆகியவற்றை இணைத்து பயிற்சிக்குப் பிந்தைய செயல்முறைக்கு மாதிரிகள் உட்படுத்தப்படுகின்றன. மைக்ரோசாஃப்ட் அதன் மாதிரிகளின் “அட்டைகளையும்” வெளியிடுகிறது. இது எஞ்சியிருக்கும் வரம்புகள் மற்றும் தணிப்பு நடவடிக்கைகளை விவரிக்கிறது.
Azure AI ஃபவுண்டரி, ஹக்கிங் ஃபேஸ் மற்றும் GitHub மாடல்ஸ் ஆகியவற்றில் இப்போது கிடைக்கும் மூன்று மாடல்களும் மிக அனுமதிமிக்க MIT உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளன. இது உள்ளூர் அனுமானம் மற்றும் கலப்பின கிளவுட் Deploymentகளுக்கு வழியைத் திறக்கிறது. பாதுகாப்பு மற்றும் கட்டமைப்பு குழுக்களுக்கு, இந்த புதிய தலைமுறை SLMகள் பாரிய LLMகளுக்கு நம்பகமான மாற்றீட்டை வழங்குகிறது. குறைந்த TCO, உள்ளூரில் மற்றும் Edgeல் இயங்குதல் மற்றும் தரவின் மீதான அதிகரித்த கட்டுப்பாடு ஆகியவற்றுடன் இது சாத்தியமாகிறது. இந்த மாதிரிகள் ஒரு வருடத்தில் SLMகள் செய்த அற்புதமான முன்னேற்றத்திற்கும், குறைவான விலையுள்ள மற்றும் அதிக ஆற்றல் மற்றும் வளங்களை மிச்சப்படுத்தும் AIஐத் தேடும் பிரபஞ்சத்தில் அவற்றின் அற்புதமான திறனுக்கும் சான்றாகும்.
ஃபை-4 இன் பகுத்தறிவு திறன்களை ஆழமாக ஆராய்தல்
ஃபை-4 மாடல் குடும்பத்தின் வருகை சிறிய மொழி மாடல்களின் (SLMகள்) வளர்ச்சியில் ஒரு முக்கியமான படியாகும். இந்த மாதிரிகளை தனித்துவமாக்குவது அவற்றின் மேம்பட்ட பகுத்தறிவு திறன்கள் ஆகும். அவை புதுமையான பயிற்சி நுட்பங்கள் மற்றும் உயர்தர தரவில் கவனம் செலுத்துவதன் மூலம் அடையப்படுகின்றன. திறந்த மூலக் கொள்கைகளுக்கு மைக்ரோசாஃப்ட்டின் அர்ப்பணிப்பு இந்த சக்திவாய்ந்த கருவிகளுக்கான அணுகலை மேலும் ஜனநாயகப்படுத்துகிறது. மேலும் மேம்பட்ட AI திறன்களை பரந்த அளவிலான பயன்பாடுகளில் ஒருங்கிணைக்க டெவலப்பர்களுக்கு அதிகாரம் அளிக்கிறது.
கட்டமைப்பை புரிந்துகொள்வது
ஃபை-4 மாதிரிகள் ஒரு டிரான்ஸ்ஃபார்மர் கட்டமைப்பின் அடிப்படையில் கட்டப்பட்டுள்ளன. இது இயற்கை மொழி செயலாக்கத்திற்கான நிரூபிக்கப்பட்ட கட்டமைப்பாகும். இருப்பினும், பகுத்தறிவு பணிகளுக்காக மாதிரிகளை மேம்படுத்த மைக்ரோசாஃப்ட் பல முக்கிய கண்டுபிடிப்புகளை செயல்படுத்தியுள்ளது.
- துல்லியமான மேற்பார்வை (SFT): இந்த மாதிரிகள் துல்லியமான மேற்பார்வை (SFT) எனப்படும் ஒரு நுட்பத்தைப் பயன்படுத்தி பயிற்சி அளிக்கப்படுகின்றன. இதில் OpenAI இன் o3-மினி மாடலால் உருவாக்கப்பட்ட விரிவான பகுத்தறிவு சங்கிலிகளிலிருந்து கற்றுக்கொள்வது அடங்கும். இது சிக்கலான பகுத்தறிவு செயல்முறைகளில் உள்ள படிகளைக் கற்றுக்கொள்ள ஃபை-4 மாதிரிகளுக்கு உதவுகிறது.
- வலுவூட்டல் கற்றல் (RL): ஃபை-4 மாடலின் “பிளஸ்” மாறுபாடான ஃபை-4-ரீசனிங்-பிளஸ், அதன் பகுத்தறிவு திறன்களை மேலும் மேம்படுத்த வலுவூட்டல் கற்றலைப் (RL) பயன்படுத்துகிறது. RL ஆனது வெகுமதி சமிக்ஞையை அதிகப்படுத்த மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்குகிறது. இந்த விஷயத்தில் அதன் பகுத்தறிவின் துல்லியம் மற்றும் செயல்திறனை அடிப்படையாகக் கொண்டது.
- வடித்தல்: பெரிய, மிகவும் சிக்கலான மாடல்களிலிருந்து சிறிய ஃபை-4 மாடல்களுக்கு அறிவை மாற்ற வடித்தல் பயன்படுத்தப்படுகிறது. இது SLMகள் அவற்றின் சிறிய அளவு மற்றும் செயல்திறனைப் பராமரிக்கும் அதே வேளையில், பெரிய மாடல்களுக்கு ஒப்பான செயல்திறன் அளவை அடைய அனுமதிக்கிறது.
செயல்திறன் ஒப்பீடு
ஃபை-4 மாதிரிகள் பல்வேறு பகுத்தறிவு அளவுகோல்களில் ஈர்க்கக்கூடிய செயல்திறனைக் காட்டியுள்ளன. சில சந்தர்ப்பங்களில் பெரிய மாதிரிகளை மிஞ்சியுள்ளன. உதாரணமாக, 14 பில்லியன் அளவுருக்கள் மட்டுமே கொண்ட ஃபை-4-ரீசனிங், டீப் சீக்-ஆர்1-டிஸ்டில்-லாமா-70B (70 பில்லியன் அளவுருக்கள்) ஐ AIME 2025, MMLU-Pro மற்றும் HumanEval-Plus உட்பட பல சவாலான தரவுத்தொகுப்புகளில் மிஞ்சுகிறது. இது ஃபை-4 இன் கட்டமைப்பு மற்றும் பயிற்சி நுட்பங்களின் செயல்திறனையும் பயனுறுதியையும் எடுத்துக்காட்டுகிறது.
- 5 மடங்கு அதிகமான டோக்கன்களுடன் பயிற்சி அளிக்கப்பட்ட ஃபை-4-ரீசனிங்-பிளஸ் மாறுபாடு, OmniMath தரப்படுத்தலில் OpenAI இன் o3-மினிக்கு நெருக்கமான மதிப்பெண்களை அடைகிறது. இது சிக்கலான கணித பகுத்தறிவு சிக்கல்களைத் தீர்க்கும் திறனை நிரூபிக்கிறது.
பயன்பாடுகள் மற்றும் பயன்பாட்டு நிகழ்வுகள்
மேம்பட்ட பகுத்தறிவு திறன்கள் தேவைப்படும் பல்வேறு பயன்பாடுகளுக்கு ஃபை-4 மாதிரிகள் மிகவும் பொருத்தமானவை.
- கல்வி கருவிகள்: ஃபை-4-மினி-ரீசனிங் மாதிரி, அதன் சிறிய அளவு மற்றும் அதிக செயல்திறனுடன் கல்வி பயன்பாடுகளுக்கு ஏற்றது. தனிப்பயனாக்கப்பட்ட கருத்து மற்றும் ஆதரவை மாணவர்களுக்கு வழங்கும் ஊடாடும் கற்றல் கருவிகளை உருவாக்க இதைப் பயன்படுத்தலாம்.
- உள்ளூர் சாட்போட்கள்: ஃபை-4 மாதிரிகள் பயனர்களுக்கு உடனடி தகவல் மற்றும் ஆதரவை வழங்கும் உள்ளூர் சாட்போட்களை உருவாக்க பயன்படும். அவற்றின் சிறிய அளவு மொபைல் சாதனங்கள் மற்றும் பிற வள-வரையறுக்கப்பட்ட சூழல்களில் Deployment செய்ய அனுமதிக்கிறது.
- Copilot+ PCகள்: ஃபை-4 மாதிரிகள் Copilot+ PCகளுக்கு மேம்படுத்தப்பட்டுள்ளன. பயனர்களுக்கு தடையற்ற AI அனுபவத்தை வழங்குகின்றன. “ஃபை சிலிகா” மாறுபாடு நினைவகத்தில் முன்பே ஏற்றப்பட்டுள்ளது. மேலும் கிட்டத்தட்ட உடனடி பதில் நேரத்தை வழங்குகிறது.
- ஆஃப்லைன் உருவாக்கம்: விண்டோஸ் APIகள் ஆஃப்லைன் உற்பத்தியை Outlook அல்லது உள் கருவிகளில் ஒருங்கிணைக்க அனுமதிக்கின்றன. இது இணையத்துடன் இணைக்கப்படாதபோதும் AI திறன்களை அணுக பயனர்களுக்கு உதவுகிறது.
பாதுகாப்பு மற்றும் பொறுப்பு
மைக்ரோசாஃப்ட் பொறுப்பான மற்றும் நெறிமுறை முறையில் AI மாடல்களை உருவாக்கி Deployment செய்ய உறுதிபூண்டுள்ளது. ஃபை-4 மாதிரிகள் இதற்கு விதிவிலக்கல்ல.
- பொறுப்புக் கொள்கைகள்: மைக்ரோசாஃப்ட்டின் AI மேம்பாட்டு pipeline அதன் பொறுப்புக் கொள்கைகளுடன் ஒத்துப்போகிறது. இது பொறுப்புக்கூறல், நியாயம், நம்பகத்தன்மை, பாதுகாப்பு மற்றும் உள்ளடக்கம் ஆகியவற்றை உள்ளடக்கியது.
- பயிற்சிக்குப் பிந்தைய: ஃபை-4 மாதிரிகள் பொது மற்றும் உள் “உதவும் தன்மை/தீங்கற்ற தன்மை” சார்ந்த தரவுத்தொகுப்புகளிலிருந்து SFT, டைரக்ட் விருப்பத்தேர்வு தேர்வுமுறை மற்றும் RLHF ஆகியவற்றைப் பயன்படுத்தி பயிற்சிக்குப் பிந்தைய செயல்முறைக்கு உட்படுத்தப்படுகின்றன. இது மாதிரிகள் பாதுகாப்பானவை மற்றும் நம்பகமானவை என்பதை உறுதிப்படுத்த உதவுகிறது.
- மாடல் அட்டைகள்: மைக்ரோசாஃப்ட் அதன் மாதிரிகளுக்கான “அட்டைகளை” வெளியிடுகிறது. இது எஞ்சியிருக்கும் வரம்புகள் மற்றும் தணிப்பு நடவடிக்கைகளை விவரிக்கிறது. இது பயனர்களுக்கு வெளிப்படைத்தன்மையை வழங்குகிறது. மேலும் மாதிரிகளை எவ்வாறு பயன்படுத்துவது என்பது குறித்து தகவலறிந்த முடிவுகளை எடுக்க அவர்களுக்கு அனுமதிக்கிறது.
SLMகளின் எதிர்காலம்
சிறிய மொழி மாடல்களின் (SLMகள்) வளர்ச்சியில் ஃபை-4 மாதிரிகள் ஒரு முக்கியமான படியாகும். அவற்றின் மேம்பட்ட பகுத்தறிவு திறன்கள், அவற்றின் சிறிய அளவு மற்றும் செயல்திறனுடன் இணைந்து, பல பயன்பாடுகளில் பெரிய மொழி மாடல்களுக்கு (LLMகள்) ஒரு கட்டாய மாற்றாக அமைகின்றன.
SLMகள் தொடர்ந்து மேம்பட்டு வருவதால், அவை AI நிலப்பரப்பில் பெருகிய முறையில் முக்கிய பங்கு வகிக்கும் வாய்ப்புள்ளது. வள-வரையறுக்கப்பட்ட சாதனங்களில் இயங்கும் மற்றும் வேகமான, திறமையான செயல்திறனை வழங்கும் திறன் கல்வி கருவிகள் முதல் உள்ளூர் சாட்போட்கள் முதல் விளிம்பு கம்ப்யூட்டிங் சாதனங்கள் வரை பரந்த அளவிலான பயன்பாடுகளுக்கு ஏற்றதாக அமைகிறது.
திறந்த மூலக் கொள்கைகள் மற்றும் பொறுப்பான AI மேம்பாட்டிற்கு மைக்ரோசாஃப்ட்டின் அர்ப்பணிப்பு ஃபை-4 மாதிரிகளை AI சமூகத்திற்கான மதிப்புமிக்க ஆதாரமாக மேலும் நிலைநிறுத்துகிறது. இந்த சக்திவாய்ந்த கருவிகளுக்கான அணுகலை ஜனநாயகப்படுத்துவதன் மூலம், மைக்ரோசாஃப்ட் புதுமையான மற்றும் தாக்கத்தை ஏற்படுத்தும் பயன்பாடுகளை உருவாக்க டெவலப்பர்களுக்கு அதிகாரம் அளிக்கிறது. அவை ஒட்டுமொத்த சமூகத்திற்கும் பயனளிக்கும்.
ஃபை-4 இன் தொழில்நுட்ப அம்சங்களை உற்று நோக்குதல்
ஃபை-4 கட்டமைப்பு மற்றும் பயிற்சியின் விவரங்களை ஆழமாக ஆராய்வது, இந்த SLMகள் இவ்வளவு ஈர்க்கக்கூடிய பகுத்தறிவு திறன்களை அடைய உதவும் புதுமையான நுட்பங்களை வெளிப்படுத்துகிறது. கவனமாக க்யுரேட் செய்யப்பட்ட தரவுத்தொகுப்புகள், அதிநவீன பயிற்சி வழிமுறைகள் மற்றும் செயல்திறனில் கவனம் செலுத்துதல் ஆகியவற்றின் கலவையானது சக்திவாய்ந்த மற்றும் நடைமுறை மாதிரிகளின் குடும்பத்திற்கு வழிவகுத்துள்ளது.
தரவு க்யுரேஷன் மற்றும் தயாரிப்பு
எந்தவொரு இயந்திர கற்றல் மாதிரியின் வெற்றியும் அது பயிற்சி பெறும் தரவின் தரம் மற்றும் பொருத்தத்தை அடிப்படையாகக் கொண்டது. ஃபை-4 மாதிரிகளுக்கு பயிற்சி அளிக்கப் பயன்படுத்தப்படும் தரவுத்தொகுப்புகளை க்யுரேட் செய்வதிலும் தயாரிப்பதிலும் மைக்ரோசாஃப்ட் குறிப்பிடத்தக்க முயற்சியை மேற்கொண்டது.
- OpenAI இன் o3-மினியிலிருந்து பகுத்தறிவு சங்கிலிகள்: சிக்கலான பகுத்தறிவு செயல்முறைகளில் உள்ள படிகளைக் கற்றுக்கொள்வதற்கு OpenAI இன் o3-மினி மாதிரியால் உருவாக்கப்பட்ட பகுத்தறிவு சங்கிலிகளை மாதிரிகள் பயன்படுத்துகின்றன. இந்த சங்கிலிகள் SLMகள் பின்பற்றுவதற்கு ஒரு விரிவான வரைபடத்தை வழங்குகின்றன. மேலும் அடிப்படை தர்க்கத்தைப் பற்றி ஆழமான புரிதலை வளர்க்க அவர்களுக்கு உதவுகின்றன.
- செயற்கை கணித சிக்கல்கள்: ஃபை-4-மினி-ரீசனிங் மாதிரி டீப் சீக்-ஆர்1 ஆல் உருவாக்கப்பட்ட ஒரு மில்லியன் கணித சிக்கல்களின் செயற்கை தரவுத்தொகுப்பில் பயிற்சி பெற்றது. இந்த தரவுத்தொகுப்பு கணித சவால்களின் பல்வேறு வரம்பை வழங்குகிறது. இது மாதிரி வலுவான சிக்கல் தீர்க்கும் திறன்களை வளர்க்க அனுமதிக்கிறது.
- உதவும் தன்மை/தீங்கற்ற தன்மை தரவுத்தொகுப்புகள்: மாதிரிகள் உதவும் தன்மை மற்றும் தீங்கற்ற தன்மையை ஊக்குவிக்க வடிவமைக்கப்பட்ட தரவுத்தொகுப்புகளைப் பயன்படுத்தி பயிற்சிக்குப் பிந்தைய செயல்முறைக்கு உட்படுத்தப்படுகின்றன. இது மாதிரிகள் பாதுகாப்பான மற்றும் பொறுப்பான வெளியீடுகளை உருவாக்குவதை உறுதிப்படுத்த உதவுகிறது.
பயிற்சி வழிமுறைகள்
கண்காணிக்கப்பட்ட கற்றல், வலுவூட்டல் கற்றல் மற்றும் வடித்தல் ஆகியவற்றின் கலவையைப் பயன்படுத்தி ஃபை-4 மாதிரிகளுக்கு பயிற்சி அளிக்கப்படுகிறது. இந்த நுட்பங்கள் பகுத்தறிவு பணிகளுக்காக மாதிரிகளை மேம்படுத்த ஒன்றிணைந்து செயல்படுகின்றன. மேலும் அவை துல்லியமானவை மற்றும் திறமையானவை என்பதை உறுதிப்படுத்துகின்றன.
- கண்காணிக்கப்பட்ட நுண்சீரமைத்தல் (SFT): OpenAI இன் o3-மினி மாதிரியால் உருவாக்கப்பட்ட பகுத்தறிவு சங்கிலிகளில் மாதிரிகளை நுண்சீரமைக்க SFT பயன்படுத்தப்படுகிறது. இது சிக்கலான பகுத்தறிவு செயல்முறைகளின் சிறப்பியல்புள்ள குறிப்பிட்ட வடிவங்கள் மற்றும் உறவுகளைக் கற்றுக்கொள்ள மாதிரிகளுக்கு உதவுகிறது.
- வலுவூட்டல் கற்றல் (RL): ஃபை-4-ரீசனிங்-பிளஸ் மாடலுக்கு பயிற்சி அளிக்க RL பயன்படுத்தப்படுகிறது. இது அதன் பகுத்தறிவின் துல்லியம் மற்றும் செயல்திறன் அடிப்படையில் வெகுமதி சமிக்ஞையை அதிகப்படுத்துகிறது. இது சிக்கல்களைத் தீர்ப்பதற்கான உத்திகளை உருவாக்க மாதிரியை ஊக்குவிக்கிறது. அது பயனுள்ளதாகவும் கணக்கீட்டு முறையில் திறமையானதாகவும் இருக்கும்.
- வடித்தல்: பெரிய, மிகவும் சிக்கலான மாடல்களிலிருந்து சிறிய ஃபை-4 மாடல்களுக்கு அறிவை மாற்ற வடித்தல் பயன்படுத்தப்படுகிறது. இது SLMகள் அவற்றின் சிறிய அளவு மற்றும் செயல்திறனைப் பராமரிக்கும் அதே வேளையில், பெரிய மாடல்களுக்கு ஒப்பான செயல்திறன் அளவை அடைய அனுமதிக்கிறது.
செயல்திறனுக்கான தேர்வுமுறை
ஃபை-4 மாதிரல்களை உருவாக்குவதில் முக்கிய குறிக்கோள்களில் ஒன்று, அவற்றை செயல்திறனுக்காக மேம்படுத்துவதாகும். இது அவற்றின் வடிவமைப்பு மற்றும் பயிற்சியின் பல அம்சங்களில் பிரதிபலிக்கிறது.
- சிறிய கட்டமைப்பு: ஃபை-4 மாதிரிகள் தேவையான அளவுருக்களின் எண்ணிக்கையை குறைக்கும் ஒரு சிறிய கட்டமைப்பைக் கொண்டு வடிவமைக்கப்பட்டுள்ளன. இது மாதிரிகளை இயக்குவதற்கான கணக்கீட்டு செலவைக் குறைக்கிறது. மேலும் அவற்றை வள-வரையறுக்கப்பட்ட சாதனங்களில் Deployment செய்வதற்கு ஏற்றதாக ஆக்குகிறது.
- குவாண்டமாக்கம்: மாதிரிகளின் நினைவக இடத்தை குறைக்க மற்றும் அவற்றின் அனுமான வேகத்தை மேம்படுத்த குவாண்டமாக்கம் பயன்படுத்தப்படுகிறது. இது மாதிரியின் அளவுருக்களை குறைவான பிட்களைப் பயன்படுத்தி பிரதிநிதித்துவப்படுத்துவதை உள்ளடக்குகிறது. இது மாதிரியை இயக்குவதற்கான கணக்கீட்டு செலவை கணிசமாகக் குறைக்கும்.
- வன்பொருள் முடுக்கம்: ஃபை-4 மாதிரிகள் CPUகள், GPUகள் மற்றும் NPUs உட்பட பல்வேறு தளங்களில் வன்பொருள் முடுக்கத்திற்காக மேம்படுத்தப்பட்டுள்ளன. இது பரந்த அளவிலான சாதனங்களில் அதிகபட்ச செயல்திறனை அடைய அனுமதிக்கிறது.
AI இன் எதிர்காலத்திற்கான தாக்கங்கள்
ஃபை-4 மாதிரிகள் AI இன் வளர்ச்சியில் ஒரு முக்கியமான படியை பிரதிபலிக்கின்றன. அவை வடிவமைக்கப்பட்டுள்ள குறிப்பிட்ட பயன்பாடுகளுக்கு அப்பால் நீண்ட தூரம் செல்லும் தாக்கங்களைக் கொண்டுள்ளன. ஒப்பீட்டளவில் சிறிய அளவு மற்றும் கணக்கீட்டு வளங்களைக் கொண்டு அதிக செயல்திறனை அடையும் திறன் பரந்த அளவிலான அமைப்புகளில் AIஐ Deployment செய்வதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.
AI இன் ஜனநாயகம்
ஃபை-4 மாதிரிகள் சக்திவாய்ந்த AI திறன்களை பாரிய கணக்கீட்டு வளங்கள் அல்லது தனியுரிம தரவுத்தொகுப்புகளுக்கான அணுகல் தேவையில்லாமல் அடைய முடியும் என்பதற்கு சான்றாகும். இது AI க்கான அணுகலை ஜனநாயகப்படுத்துகிறது. மேலும் டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்களுக்கு குறைந்த வளங்களைக் கொண்டிருந்தாலும் புதுமையான பயன்பாடுகளை உருவாக்க அதிகாரம் அளிக்கிறது.
விளிம்பு கம்ப்யூட்டிங்
ஃபை-4 மாதிரல்களின் சிறிய அளவு மற்றும் செயல்திறன் விளிம்பு கம்ப்யூட்டிங் பயன்பாடுகளுக்கு ஏற்றதாக ஆக்குகிறது. இது தரவு மூலத்திற்கு அருகில் AI ஐ Deployment செய்ய அனுமதிக்கிறது. தாமதத்தைக் குறைக்கிறது மற்றும் பதிலளிக்கும் திறனை மேம்படுத்துகிறது. விளிம்பு கம்ப்யூட்டிங் உற்பத்தி முதல் சுகாதாரம் முதல் போக்குவரத்து வரை பரந்த அளவிலான தொழில்களில் புரட்சியை ஏற்படுத்தும் திறனைக் கொண்டுள்ளது.
தனிப்பயனாக்கப்பட்ட AI
ஃபை-4 மாதிரிகளை தனிப்பட்ட பயனர்கள் அல்லது நிறுவனங்களின் குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்ய தனிப்பயனாக்கலாம் மற்றும் மாற்றியமைக்கலாம். இது ஒவ்வொரு பயனரின் தனிப்பட்ட தேவைகளுக்கு ஏற்ப தனிப்பயனாக்கப்பட்ட AI அனுபவங்களை உருவாக்க அனுமதிக்கிறது. தனிப்பயனாக்கப்பட்ட AI உற்பத்தித்திறனை மேம்படுத்தவும், கற்றலை மேம்படுத்தவும், ஒட்டுமொத்த நல்வாழ்வை மேம்படுத்தவும் திறனைக் கொண்டுள்ளது.
நிலையான AI
ஃபை-4 மாதிரிகள் பெரிய மொழி மாடல்களுக்கு ஒரு நிலையான மாற்றாகும். ஏனெனில் அவற்றுக்கு குறைவான ஆற்றல் மற்றும் கணக்கீட்டு வளங்கள் தேவைப்படுகின்றன. AI இன் சுற்றுச்சூழல் தாக்கத்தைக் குறைப்பதற்கும், அது பொறுப்பான மற்றும் நிலையான முறையில் Deployment செய்யப்படுவதை உறுதி செய்வதற்கும் இது முக்கியமானது.
மைக்ரோசாஃப்ட் ஃபை-4-ரீசனிங் மாதிரிகள் AI இன் எப்போதும் உருவாகி வரும் உலகில் மற்றொரு மறு செய்கை மட்டுமல்ல; அவை ஒரு முன்னுதாரண மாற்றமாகும். புத்திசாலித்தனம் என்பது அளவு மற்றும் கணக்கீட்டு சக்தியின் செயல்பாடு மட்டுமல்ல. அது புத்திசாலித்தனமான வடிவமைப்பு, தரவின் கவனமான க்யுரேஷன் மற்றும் புதுமையான பயிற்சி நுட்பங்கள் மூலம் அடைய முடியும் என்பதை அவை நிரூபிக்கின்றன. இந்த மாதிரிகள் தொடர்ந்து உருவாகி வருவதால், அவை AI க்கான புதிய சாத்தியங்களைத் திறக்க மற்றும் தொழில்நுட்பத்துடன் நாம் தொடர்பு கொள்ளும் விதத்தை மாற்ற தயாராக உள்ளன.