AI-யில் செயல்திறனை மறுவரையறை செய்தல்: ஃபை-4 அணுகுமுறை
ஃபை-4 வரிசை, ஃபை-4-மல்டிமாடல் (5.6 பில்லியன் அளவுருக்கள்) மற்றும் ஃபை-4-மினி (3.8 பில்லியன் அளவுருக்கள்) உள்ளிட்டவை, சிறிய மொழி மாதிரிகளின் (SLMகள்) வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கின்றன. இவை பெரிய மாடல்களின் சிறிய பதிப்புகள் மட்டுமல்ல; அவை தங்கள் அளவை விட இரு மடங்கு பெரிய மாடல்களுக்கு போட்டியாக அல்லது சில சமயங்களில் அவற்றை விட சிறப்பாக செயல்படும் வகையில் கவனமாக வடிவமைக்கப்பட்டுள்ளன. இந்த செயல்திறன் வெறும் தொழில்நுட்ப சாதனை மட்டுமல்ல; எட்ஜ் கம்ப்யூட்டிங் மற்றும் தரவு தனியுரிமை ஆகியவற்றில் அதிக கவனம் செலுத்தும் உலகில் இது ஒரு மூலோபாய நன்மை.
மைக்ரோசாப்டின் ஜெனரேட்டிவ் AI-யின் துணைத் தலைவர் வெய்சு சென், இந்த மாடல்களின் வலுவூட்டல் தன்மையை வலியுறுத்துகிறார்: ‘இந்த மாடல்கள் மேம்பட்ட AI திறன்களைக் கொண்டு டெவலப்பர்களை வலுவூட்டும் வகையில் வடிவமைக்கப்பட்டுள்ளன.’ பல முறைகளைக் கையாளும் திறனைக் கொண்ட ஃபை-4-மல்டிமாடலின் சாத்தியக்கூறுகளை அவர் எடுத்துக்காட்டுகிறார், ‘புதுமையான மற்றும் சூழல் சார்ந்த பயன்பாடுகளை உருவாக்குவதற்கான புதிய சாத்தியக்கூறுகளைத் திறக்கிறது.’
இத்தகைய திறமையான மாடல்களுக்கான தேவை, மிகப்பெரிய தரவு மையங்களின் எல்லைக்கு வெளியே செயல்படக்கூடிய AI-க்கான வளர்ந்து வரும் தேவையால் இயக்கப்படுகிறது. நிறுவனங்கள் நிலையான வன்பொருளில் அல்லது ‘எட்ஜ்’ இல் - நேரடியாக சாதனங்களில் இயங்கக்கூடிய AI தீர்வுகளை நாடுகின்றன. இந்த அணுகுமுறை செலவுகளைக் குறைக்கிறது, தாமதத்தைக் குறைக்கிறது, மேலும், தரவு செயலாக்கத்தை உள்ளூரில் வைத்திருப்பதன் மூலம் தரவு தனியுரிமையை மேம்படுத்துகிறது.
செயல்திறனுக்குப் பின்னால் உள்ள கண்டுபிடிப்பு: Mixture of LoRAs
ஃபை-4-மல்டிமாடலின் திறன்களுக்கு அடிப்படையாக உள்ள ஒரு முக்கிய கண்டுபிடிப்பு அதன் நாவலான ‘Mixture of LoRAs’ நுட்பமாகும். இந்த அணுகுமுறை, உரை, படம் மற்றும் பேச்சு செயலாக்கத்தை ஒரு ஒற்றை கட்டமைப்பிற்குள் தடையின்றி ஒருங்கிணைக்க மாதிரியை அனுமதிக்கிறது. பாரம்பரிய முறைகளைப் போலல்லாமல், முறைகளைச் சேர்ப்பது செயல்திறன் குறைவுக்கு வழிவகுக்கும், Mixture of LoRAs இந்த வெவ்வேறு உள்ளீட்டு வகைகளுக்கு இடையிலான குறுக்கீட்டைக் குறைக்கிறது.
இந்த நுட்பத்தை விவரிக்கும் ஆய்வுக் கட்டுரை விளக்குகிறது: ‘Mixture of LoRAs ஐப் பயன்படுத்துவதன் மூலம், ஃபை-4-மல்டிமாடல் முறைகளுக்கு இடையிலான குறுக்கீட்டைக் குறைக்கும் அதே வேளையில் மல்டிமாடல் திறன்களை விரிவுபடுத்துகிறது. இந்த அணுகுமுறை தடையற்ற ஒருங்கிணைப்பை செயல்படுத்துகிறது மற்றும் உரை, படங்கள் மற்றும் பேச்சு/ஆடியோ சம்பந்தப்பட்ட பணிகளில் நிலையான செயல்திறனை உறுதி செய்கிறது.’
இதன் விளைவாக, வலுவான மொழி புரிதல் திறன்களை பராமரிக்கும் அதே வேளையில் பார்வை மற்றும் பேச்சு அங்கீகாரத்தில் சிறந்து விளங்கும் ஒரு மாதிரி கிடைக்கிறது. பல உள்ளீட்டு வகைகளுக்கு மாடல்களைப் பயன்படுத்தும்போது அடிக்கடி செய்யப்படும் சமரசங்களிலிருந்து இது ஒரு குறிப்பிடத்தக்க புறப்பாடு ஆகும்.
பெஞ்ச்மார்க்கிங் வெற்றி: ஃபை-4’இன் செயல்திறன் சிறப்பம்சங்கள்
ஃபை-4 மாடல்கள் செயல்திறனை மட்டும் உறுதியளிக்கவில்லை; அவை நிரூபிக்கக்கூடிய முடிவுகளை வழங்குகின்றன. ஃபை-4-மல்டிமாடல் Hugging Face OpenASR லீடர்போர்டில் முதலிடத்தைப் பெற்றுள்ளது, வெறும் 6.14% என்ற வார்த்தை பிழை விகிதத்தைக் கொண்டுள்ளது. இது WhisperV3 போன்ற சிறப்பு பேச்சு அங்கீகார அமைப்புகளையும் மிஞ்சுகிறது. பேச்சைத் தாண்டி, கணிதம் மற்றும் படங்களுடன் கூடிய அறிவியல் ரீதியான பகுத்தறிவில் ஈடுபடும் பார்வை பணிகளில் இந்த மாதிரி போட்டி செயல்திறனைக் காட்டுகிறது.
ஃபை-4-மினி, அதன் சிறிய அளவைக் கொண்டிருந்தாலும், உரை அடிப்படையிலான பணிகளில் விதிவிலக்கான திறமையை நிரூபிக்கிறது. மைக்ரோசாப்டின் ஆராய்ச்சி, இது ‘ஒத்த அளவு மாடல்களை விட சிறப்பாக செயல்படுகிறது மற்றும் மொழி புரிதல் பெஞ்ச்மார்க்குகளில் இரு மடங்கு [பெரிய] மாடல்களுக்கு இணையாக உள்ளது’ என்பதைக் குறிக்கிறது.
கணிதம் மற்றும் கோடிங் பணிகளில் மாடலின் செயல்திறன் குறிப்பாக குறிப்பிடத்தக்கது. ஃபை-4-மினி, அதன் 32 டிரான்ஸ்பார்மர் லேயர்கள் மற்றும் உகந்த நினைவக பயன்பாட்டுடன், GSM-8K கணித பெஞ்ச்மார்க்கில் 88.6% மதிப்பெண் பெற்று, பெரும்பாலான 8-பில்லியன்-அளவுரு மாடல்களை விட சிறப்பாக செயல்பட்டது. MATH பெஞ்ச்மார்க்கில், இது 64% மதிப்பெண் பெற்றது, இது ஒத்த அளவிலான போட்டியாளர்களை விட கணிசமாக அதிகமாகும்.
வெளியீட்டுடன் வரும் தொழில்நுட்ப அறிக்கை இந்த சாதனையை வலியுறுத்துகிறது: ‘கணித பெஞ்ச்மார்க்கைப் பொறுத்தவரை, இந்த மாதிரி ஒத்த அளவிலான மாடல்களை பெரிய வித்தியாசத்தில், சில சமயங்களில் 20 புள்ளிகளுக்கு மேல் சிறப்பாக செயல்படுத்துகிறது. இது இரண்டு மடங்கு பெரிய மாடல்களின் மதிப்பெண்களைக் கூட மிஞ்சுகிறது.’ இவை சிறிய மேம்பாடுகள் அல்ல; அவை சிறிய AI மாடல்களின் திறன்களில் ஒரு கணிசமான பாய்ச்சலைக் குறிக்கின்றன.
உண்மையான-உலக பயன்பாடுகள்: ஃபை-4 செயலில்
ஃபை-4’இன் தாக்கம் பெஞ்ச்மார்க் மதிப்பெண்களுக்கு அப்பால் நீண்டுள்ளது; இது ஏற்கனவே உண்மையான-உலக பயன்பாடுகளில் உணரப்படுகிறது. Capacity, ஒரு AI ‘பதில் இயந்திரம்’, இது நிறுவனங்கள் பல்வேறு தரவுத்தொகுப்புகளை ஒன்றிணைக்க உதவுகிறது, அதன் தளத்தின் செயல்திறன் மற்றும் துல்லியத்தை மேம்படுத்த ஃபை குடும்பத்தை ஒருங்கிணைத்துள்ளது.
Capacity-யின் தயாரிப்புத் தலைவர் ஸ்டீவ் ஃபிரடெரிக்சன், ‘தனிப்பயனாக்கலுக்கு முன்பே, மாதிரியின் குறிப்பிடத்தக்க துல்லியம் மற்றும் வரிசைப்படுத்தலின் எளிமை’ ஆகியவற்றை முன்னிலைப்படுத்துகிறார். அவர்கள் ‘துல்லியம் மற்றும் நம்பகத்தன்மை இரண்டையும் மேம்படுத்த முடிந்தது, அதே நேரத்தில் தொடக்கத்தில் நாங்கள் மதிப்பிட்ட செலவு-செயல்திறன் மற்றும் அளவிடுதல் ஆகியவற்றை பராமரிக்க முடிந்தது’ என்று அவர் குறிப்பிடுகிறார். Capacity, போட்டியிடும் பணிப்பாய்வுகளுடன் ஒப்பிடும்போது 4.2x செலவு சேமிப்பை கணிசமாகப் பெற்றுள்ளது, அதே நேரத்தில் முன் செயலாக்க பணிகளில் ஒப்பிடக்கூடிய அல்லது சிறந்த முடிவுகளை அடைகிறது.
AI-ஐ பரவலாக ஏற்றுக்கொள்வதற்கு இந்த நடைமுறை நன்மைகள் முக்கியமானவை. ஃபை-4 பரந்த வளங்களைக் கொண்ட தொழில்நுட்ப ஜாம்பவான்களின் பிரத்யேக பயன்பாட்டிற்காக வடிவமைக்கப்படவில்லை; இது பல்வேறு சூழல்களில் பயன்படுத்தப்பட வேண்டும், அங்கு கணினி சக்தி குறைவாக இருக்கலாம் மற்றும் தனியுரிமை மிக முக்கியமானது.
அணுகல்தன்மை மற்றும் AI-யின் ஜனநாயகமயமாக்கல்
ஃபை-4 உடனான மைக்ரோசாப்டின் மூலோபாயம் தொழில்நுட்ப முன்னேற்றத்தைப் பற்றியது மட்டுமல்ல; இது AI-ஐ மேலும் அணுகக்கூடியதாக மாற்றுவதாகும். இந்த மாடல்கள் Azure AI Foundry, Hugging Face மற்றும் Nvidia API Catalog மூலம் கிடைக்கின்றன, இது பரந்த கிடைக்கும் தன்மையை உறுதி செய்கிறது. இந்த வேண்டுமென்றே அணுகுமுறை சக்திவாய்ந்த AI திறன்களுக்கான அணுகலை ஜனநாயகப்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது, விலையுயர்ந்த வன்பொருள் அல்லது பாரிய உள்கட்டமைப்பால் விதிக்கப்பட்ட தடைகளை நீக்குகிறது.
நிலையான சாதனங்களில், நெட்வொர்க்குகளின் விளிம்பில் மற்றும் கணினி சக்தி குறைவாக உள்ள தொழில்களில் AI-ஐ இயக்க வைப்பதே இதன் குறிக்கோள். பல்வேறு துறைகளில் AI-யின் முழு திறனைத் திறக்க இந்த அணுகல்தன்மை முக்கியமானது.
ஜப்பானிய AI நிறுவனமான Headwaters Co., Ltd.-யின் இயக்குநரான மசாயா நிஷிமாகி, இந்த அணுகல்தன்மையின் முக்கியத்துவத்தை அடிக்கோடிட்டுக் காட்டுகிறார்: ‘எட்ஜ் AI நிலையற்ற நெட்வொர்க் இணைப்புகள் உள்ள அல்லது ரகசியத்தன்மை மிக முக்கியமான சூழல்களில் கூட சிறந்த செயல்திறனை நிரூபிக்கிறது.’ இது தொழிற்சாலைகள், மருத்துவமனைகள், தன்னாட்சி வாகனங்கள் - நிகழ்நேர நுண்ணறிவு அவசியமான சூழல்களில் AI பயன்பாடுகளுக்கான சாத்தியக்கூறுகளைத் திறக்கிறது, ஆனால் பாரம்பரிய கிளவுட் அடிப்படையிலான மாடல்கள் பெரும்பாலும் நடைமுறைக்கு மாறானவை.
AI வளர்ச்சியில் ஒரு முன்னுதாரண மாற்றம்
ஃபை-4 AI வளர்ச்சியைப் பற்றி நாம் சிந்திக்கும் விதத்தில் ஒரு அடிப்படை மாற்றத்தைக் குறிக்கிறது. இது பெரிய மற்றும் பெரிய மாடல்களை இடைவிடாமல் பின்தொடர்வதில் இருந்து விலகி, செயல்திறன், அணுகல்தன்மை மற்றும் உண்மையான-உலக பயன்பாட்டினை நோக்கிய ஒரு நகர்வு. AI என்பது மிகவும் விரிவான வளங்களைக் கொண்டவர்களுக்கான ஒரு கருவி மட்டுமல்ல என்பதை இது நிரூபிக்கிறது; சிந்தனையுடன் வடிவமைக்கப்படும்போது, எந்த இடத்திலும், யாராலும் பயன்படுத்தக்கூடிய ஒரு திறன் இது.
ஃபை-4’இன் உண்மையான புரட்சி அதன் திறன்களில் மட்டுமல்ல, அது திறக்கும் சாத்தியக்கூறுகளிலும் உள்ளது. இது AI-ஐ விளிம்பிற்கு, அது மிகப்பெரிய தாக்கத்தை ஏற்படுத்தக்கூடிய சூழல்களுக்குக் கொண்டுவருவது மற்றும் அதன் சக்தியைப் பயன்படுத்த பயனர்களின் பரந்த வரம்பை வலுப்படுத்துவது பற்றியது. இது வெறும் தொழில்நுட்ப முன்னேற்றத்தை விட அதிகம்; இது மிகவும் உள்ளடக்கிய மற்றும் அணுகக்கூடிய AI எதிர்காலத்தை நோக்கிய ஒரு படியாகும். ஃபை-4 பற்றிய மிகவும் புரட்சிகரமான விஷயம் அது என்ன செய்ய முடியும் என்பது மட்டுமல்ல, அதை எங்கு செய்ய முடியும் என்பதும்தான்.