வேகமான ஏற்றம்: திறமையான பயிற்சி மற்றும் உள்ளூர்மயமாக்கப்பட்ட நிபுணத்துவம்
ஃபாக்ஸ்பிரைனின் வளர்ச்சி என்பது குறிப்பிடத்தக்க செயல்திறனின் கதை. வெறும் நான்கு வாரங்களில், ஃபாக்ஸ்கானின் குழு இந்த அதிநவீன எல்எல்எம்-ஐ உயிர்ப்பித்தது. இந்த விரைவான வளர்ச்சியானது, சிக்கலான சிக்கலுக்கு கணக்கீட்டு சக்தியை வீசுவதை விட பயிற்சி செயல்முறையை மேம்படுத்துவதில் கவனம் செலுத்தும் ஒரு மூலோபாய அணுகுமுறையை அடிக்கோடிட்டுக் காட்டுகிறது. ஹான் ஹாய் ஆராய்ச்சி நிறுவனத்தின் AI ஆராய்ச்சி மையத்தின் இயக்குனர் டாக்டர். யுங்-ஹுய் லி, “எங்கள் ஃபாக்ஸ்பிரைன் மாதிரி மிகவும் திறமையான பயிற்சி மூலோபாயத்தை ஏற்றுக்கொண்டது, கண்மூடித்தனமாக கணினி சக்தியைக் குவிப்பதை விட பயிற்சி செயல்முறையை மேம்படுத்துவதில் கவனம் செலுத்துகிறது” என்று கூறுகிறார்.
இந்த செயல்திறன் திறனின் விலையில் வரவில்லை. ஃபாக்ஸ்பிரைன் பாரம்பரிய சீனத்தின் நுணுக்கங்களுக்கு ஏற்ப சிறப்பாக வடிவமைக்கப்பட்டுள்ளது, உள்ளூர் மொழி வடிவங்களுக்கு உகந்ததாக வலுவான பகுத்தறிவு திறன்களை நிரூபிக்கிறது. உள்ளூர்மயமாக்கலில் இந்த கவனம் முக்கியமானது, பொதுவான மாதிரிகள் போராடக்கூடிய வகையில் மொழியின் நுணுக்கங்களை மாதிரி புரிந்துகொண்டு பதிலளிக்க அனுமதிக்கிறது.
உள் பயன்பாடுகளுக்கு அப்பால்: ஒரு திறந்த-மூல பார்வை
ஆரம்பத்தில் ஃபாக்ஸ்கானின் உள் செயல்பாடுகளை நெறிப்படுத்த வடிவமைக்கப்பட்டிருந்தாலும், தரவு பகுப்பாய்வு, முடிவு ஆதரவு, ஆவண ஒத்துழைப்பு மற்றும் குறியீடு உருவாக்கம் போன்ற பணிகளை உள்ளடக்கியது. இது கணிதம், பகுத்தறிவு மற்றும் சிக்கல் தீர்க்கும் வகையில் வடிவமைக்கப்பட்டது. ஃபாக்ஸ்பிரைனின் விதி நிறுவனத்தின் சுவர்களுக்கு அப்பால் நீண்டுள்ளது. ஃபாக்ஸ்கான் மாதிரியை ஓப்பன் சோர்ஸ் தொழில்நுட்பமாக வெளியிடும் தனது நோக்கத்தை தைரியமாக அறிவித்துள்ளது. இந்த நடவடிக்கை மேம்பட்ட AI திறன்களுக்கான அணுகலை ஜனநாயகப்படுத்துவதற்கு தயாராக உள்ளது, தைவான் மற்றும் அதற்கு அப்பால் உள்ள டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்களுக்கு ஃபாக்ஸ்பிரைனின் திறனைப் பயன்படுத்த அதிகாரம் அளிக்கிறது.
திறந்த மூலத்திற்கான இந்த அர்ப்பணிப்பு AI சமூகத்தில் ஒரு பரந்த போக்குடன் ஒத்துப்போகிறது, ஒத்துழைப்பு மற்றும் பகிரப்பட்ட அறிவு ஆகியவை புதுமையின் முக்கிய இயக்கிகள் என்பதை அங்கீகரிக்கிறது. ஃபாக்ஸ்பிரைனை பரந்த சமூகத்திற்கு கிடைக்கச் செய்வதன் மூலம், ஃபாக்ஸ்கான் AI இன் முன்னேற்றத்திற்கு பங்களிப்பது மட்டுமல்லாமல், பகிரப்பட்ட முன்னேற்றத்தின் உணர்வையும் வளர்க்கிறது.
கூட்டாண்மையின் சக்தி: என்விடியாவின் நிபுணத்துவத்தைப் பயன்படுத்துதல்
ஃபாக்ஸ்பிரைனின் உருவாக்கம் ஒரு கூட்டு முயற்சியாகும், என்விடியா ஒரு முக்கிய பங்கு வகிக்கிறது. பயிற்சி செயல்முறை 120 என்விடியா H100 ஜிபியுக்களின் சக்தியைப் பயன்படுத்தியது, என்விடியாவின் குவாண்டம்-2 இன்ஃபினிபேண்ட் நெட்வொர்க்கிங் தொழில்நுட்பம் மூலம் ஒன்றோடொன்று இணைக்கப்பட்டது. இந்த அமைப்பு அதிவேக தரவு பரிமாற்றத்தை இயக்கியது, இந்த அளவிலான மாதிரியை திறம்பட பயிற்றுவிப்பதில் ஒரு முக்கியமான காரணி.
என்விடியாவின் ஆதரவு வன்பொருளை வழங்குவதைத் தாண்டியது. நிறுவனத்தின் Taipei-1 சூப்பர் கம்ப்யூட்டர் வசதி மற்றும் தொழில்நுட்ப ஆலோசனை ஆகியவை ஃபாக்ஸ்கான் என்விடியாவின் NeMo கட்டமைப்பைப் பயன்படுத்த உதவியது, இது AI மாதிரிகளை உருவாக்குவதற்கும் தனிப்பயனாக்குவதற்கும் ஒரு சக்திவாய்ந்த கருவித்தொகுப்பாகும். இந்த கூட்டாண்மை வன்பொருள் மற்றும் மென்பொருள் நிபுணத்துவத்திற்கு இடையிலான ஒருங்கிணைப்பை எடுத்துக்காட்டுகிறது, AI வளர்ச்சியின் எல்லைகளைத் தள்ளுவதில் ஒத்துழைப்பின் முக்கியத்துவத்தை எடுத்துக்காட்டுகிறது.
ஒரு திடமான அடித்தளத்தை உருவாக்குதல்: லாமா 3.1 கட்டமைப்பு
ஃபாக்ஸ்பிரைனின் கட்டமைப்பு மெட்டாவின் லாமா 3.1 இல் வேரூன்றியுள்ளது, இது திறந்த மூல ஒத்துழைப்பின் சக்திக்கு ஒரு சான்றாகும். இந்த அடித்தளம் ஒரு வலுவான மற்றும் நன்கு சோதிக்கப்பட்ட கட்டமைப்பை வழங்குகிறது, இது 70 பில்லியன் அளவுருக்களைக் கொண்டுள்ளது. இந்த அளவுருக்கள் AI அமைப்பு தரவுகளிலிருந்து கற்றுக்கொள்ளும்போது நன்றாகச் சரிசெய்யும் அனுசரிப்பு மதிப்புகள், மாதிரியின் திரட்டப்பட்ட அறிவைக் குறிக்கிறது.
லாமா 3.1 ஐ ஒரு தொடக்க புள்ளியாகத் தேர்ந்தெடுப்பது, சக்கரத்தை மீண்டும் கண்டுபிடிப்பதை விட, ஏற்கனவே உள்ள, நிரூபிக்கப்பட்ட தொழில்நுட்பத்தைப் பயன்படுத்துவதற்கான ஒரு மூலோபாய முடிவை பிரதிபலிக்கிறது. இந்த அணுகுமுறை ஃபாக்ஸ்கான் அதன் முயற்சிகளை பாரம்பரிய சீனத்தின் குறிப்பிட்ட தேவைகளுக்கு ஏற்ப மாதிரியை வடிவமைப்பதற்கும் அதன் நோக்கம் கொண்ட பயன்பாடுகளுக்கான அதன் செயல்திறனை மேம்படுத்துவதற்கும் அனுமதிக்கிறது.
போட்டியை மிஞ்சுதல்: ஃபாக்ஸ்பிரைனின் திறன்களை அளவிடுதல்
ஃபாக்ஸ்கானின் உள் சோதனை, ஃபாக்ஸ்பிரைன் லாமா-3-தைவான்-70B ஐ விட சிறப்பாக செயல்படுகிறது என்பதை வெளிப்படுத்துகிறது, இது மற்றொரு பாரம்பரிய சீன மொழி மாதிரி, பல முக்கிய வகைகளில் ஒப்பிடத்தக்க அளவு. இந்த உயர்ந்த செயல்திறன் ஃபாக்ஸ்கானின் பயிற்சி உத்திகளின் செயல்திறனையும் உள்ளூர்மயமாக்கலில் அதன் கவனத்தையும் அடிக்கோடிட்டுக் காட்டுகிறது.
குறிப்பாக, ஃபாக்ஸ்பிரைன் அடிப்படை மெட்டா லாமா 3.1 மாதிரியுடன் ஒப்பிடும்போது கணித செயல்திறனில் குறிப்பிடத்தக்க மேம்பாடுகளை நிரூபிக்கிறது. இந்த மேம்படுத்தப்பட்ட கணித திறன் குறிப்பாக உற்பத்தி, விநியோக சங்கிலி மேலாண்மை மற்றும் அளவு பகுப்பாய்வை நம்பியிருக்கும் பிற துறைகளில் உள்ள பயன்பாடுகளுக்கு பொருத்தமானது.
செயல்திறனில் ஒரு ஆழமான டைவ்: TMMLU+ பெஞ்ச்மார்க்
ஃபாக்ஸ்பிரைனின் திறன்களை கடுமையாக மதிப்பிடுவதற்கு, ஃபாக்ஸ்கான் TMMLU+ பெஞ்ச்மார்க்கைப் பயன்படுத்தியது, இது பரந்த அளவிலான அறிவு களங்களில் செயல்திறனை அளவிடும் ஒரு விரிவான சோதனை. முடிவுகள் கணிதம் மற்றும் தர்க்கரீதியான பகுத்தறிவில் ஃபாக்ஸ்பிரைனின் பலத்தை எடுத்துக்காட்டுகின்றன, மேலும் அதன் உண்மையான உலக பயன்பாடுகளுக்கான திறனை சரிபார்க்கின்றன.
TMMLU+ பெஞ்ச்மார்க் ஃபாக்ஸ்பிரைனின் செயல்திறனை மற்ற மாடல்களுடன் ஒப்பிடுவதற்கு ஒரு தரப்படுத்தப்பட்ட வழியை வழங்குகிறது, அதன் பலம் மற்றும் சாத்தியமான முன்னேற்றத்திற்கான பகுதிகள் பற்றிய தெளிவான படத்தை வழங்குகிறது. புறநிலை மதிப்பீட்டிற்கான இந்த அர்ப்பணிப்பு ஃபாக்ஸ்கானின் வெளிப்படைத்தன்மை மற்றும் தொடர்ச்சியான முன்னேற்றத்திற்கான அர்ப்பணிப்பை அடிக்கோடிட்டுக் காட்டுகிறது.
தரவு பெருக்கத்தின் கலை: பயிற்சி கார்பஸை விரிவுபடுத்துதல்
ஃபாக்ஸ்பிரைனின் வெற்றியின் முக்கிய மூலப்பொருள் அதன் அதிநவீன தரவு பெருக்க உத்தி ஆகும். இது பயிற்சி தரவை விரிவுபடுத்தவும் மேம்படுத்தவும் நுட்பங்களைப் பயன்படுத்துவதை உள்ளடக்குகிறது, மாதிரி பல்வேறு மற்றும் பிரதிநிதித்துவ மொழி வடிவங்களுக்கு வெளிப்படுவதை உறுதி செய்கிறது.
ஃபாக்ஸ்கானின் குழு 24 தனித்துவமான தலைப்பு வகைகளில் தனியுரிம தரவு பெருக்க முறைகளை உருவாக்கியது, இதன் விளைவாக பாரம்பரிய சீனத்திற்கான 98 பில்லியன் டோக்கன்களின் பாரிய முன் பயிற்சி தரவுத்தொகுப்பு கிடைத்தது. டோக்கன்கள் AI அமைப்பு செயலாக்கும் உரையின் அலகுகளைக் குறிக்கின்றன, பொதுவாக சொற்கள் அல்லது சொற்களின் பகுதிகளைக் கொண்டிருக்கும். இந்த விரிவான தரவுத்தொகுப்பு பல்வேறு வகையான மொழி நுணுக்கங்களைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய ஒரு மாதிரியைப் பயிற்றுவிப்பதற்கு முக்கியமானது.
சூழல் தான் ராஜா: புரிதலுக்கான ஒரு பரந்த சாளரம்
ஃபாக்ஸ்பிரைன் 128,000 டோக்கன்களின் சூழல் சாளரத்தைக் கொண்டுள்ளது. இந்த ஈர்க்கக்கூடிய திறன், மாதிரி ஒரே நேரத்தில் எவ்வளவு தகவலைக் கருத்தில் கொள்ள முடியும் என்பதை தீர்மானிக்கிறது, இது விரிவான உரையாடல் வரலாறு அல்லது ஆவண உள்ளடக்கத்தைப் பற்றிய விழிப்புணர்வைப் பராமரிக்க உதவுகிறது. சிறிய சூழல் சாளரங்களைக் கொண்ட மாடல்களுடன் ஒப்பிடும்போது இது ஒரு குறிப்பிடத்தக்க நன்மை, ஃபாக்ஸ்பிரைன் ஒரு உரையாடல் அல்லது உரையின் பரந்த சூழலைப் புரிந்துகொள்ள அனுமதிக்கிறது, இது மிகவும் ஒத்திசைவான மற்றும் பொருத்தமான பதில்களுக்கு வழிவகுக்கிறது.
ஒரு பெரிய சூழல் சாளரம் குறிப்பாக ஒரு உரையின் வெவ்வேறு பகுதிகளுக்கு இடையே உள்ள சிக்கலான உறவுகளைப் புரிந்துகொள்ள வேண்டிய பணிகளுக்கு நன்மை பயக்கும், அதாவது நீண்ட ஆவணங்களைச் சுருக்குதல் அல்லது பல மூலங்களிலிருந்து தகவல்களை ஒருங்கிணைக்க வேண்டிய கேள்விகளுக்கு பதிலளித்தல்.
முக்கிய கண்டுபிடிப்புகள்: தொழில்நுட்ப சாதனைகளின் சுருக்கம்
ஃபாக்ஸ்பிரைனின் ஃபாக்ஸ்கானின் வளர்ச்சி பல முக்கிய கண்டுபிடிப்புகளால் குறிக்கப்பட்டுள்ளது:
- தனியுரிம தரவு பெருக்கம்: 24 தலைப்பு வகைகளுக்கான தனித்துவமான தரவு பெருக்கம் மற்றும் தர மதிப்பீட்டு நுட்பங்களை உருவாக்குவது பயிற்சி தரவை கணிசமாக வளப்படுத்தியது.
- திறமையான GPU பயன்பாடு: மாதிரி 120 என்விடியா H100 ஜிபியுக்களைப் பயன்படுத்தி மொத்தம் 2,688 ஜிபியு நாட்களில் பயிற்சி அளிக்கப்பட்டது, இது கணக்கீட்டு வளங்களின் மிகவும் திறமையான பயன்பாட்டை நிரூபிக்கிறது.
- மல்டி-நோட் இணை பயிற்சி: உகந்த செயல்திறன் மற்றும் கணினி நிலைத்தன்மையை உறுதி செய்வதற்காக ஒரு மல்டி-நோட் இணை பயிற்சி கட்டமைப்பு செயல்படுத்தப்பட்டது, இது மாதிரி திறம்பட அளவிட அனுமதிக்கிறது.
- தகவமைப்பு பகுத்தறிவு பிரதிபலிப்பு: மாதிரியின் தன்னாட்சி பகுத்தறிவு திறன்களை மேம்படுத்த ஒரு புதுமையான தகவமைப்பு பகுத்தறிவு பிரதிபலிப்பு முறை அறிமுகப்படுத்தப்பட்டது, இது காலப்போக்கில் அதன் பகுத்தறிவு திறன்களைக் கற்றுக்கொள்ளவும் மேம்படுத்தவும் உதவுகிறது.
எதிர்காலத்தைப் பற்றிய ஒரு பார்வை: தொடர்ச்சியான முன்னேற்றம் மற்றும் ஒத்துழைப்பு
டாக்டர். யுங்-ஹுய் லி, ஃபாக்ஸ்பிரைன் ஈர்க்கக்கூடிய செயல்திறனை நிரூபித்தாலும், இன்னும் வளர்ச்சிக்கு இடம் உள்ளது என்பதை ஒப்புக்கொள்கிறார். திறமையான அறிவு பரிமாற்றத்தில் கவனம் செலுத்தும் மற்றொரு AI அமைப்பான டீப்சீக்கின் வடிகட்டுதல் மாதிரியுடன் ஒப்பிடும்போது செயல்திறன் இடைவெளியைக் குறிப்பிடுகிறார். இருப்பினும், ஃபாக்ஸ்பிரைனின் செயல்திறன் “உலக-முன்னணி தரநிலைகளை” நெருங்குகிறது என்பதை அவர் வலியுறுத்துகிறார்.
தொடர்ச்சியான முன்னேற்றத்திற்கான இந்த அர்ப்பணிப்பு ஃபாக்ஸ்கானின் அணுகுமுறையின் அடையாளமாகும். நிறுவனம் ஃபாக்ஸ்பிரைனை தொடர்ந்து செம்மைப்படுத்தவும், புதிய நுட்பங்களை ஆராயவும், திறந்த மூல சமூகத்தின் கருத்துக்களைப் பயன்படுத்தி அதன் திறன்களை மேலும் மேம்படுத்தவும் திட்டமிட்டுள்ளது.
எல்லைகளை விரிவுபடுத்துதல்: கூட்டு பயன்பாடுகள்
ஆரம்பத்தில் உள் பயன்பாட்டிற்காக வடிவமைக்கப்பட்டிருந்தாலும், ஃபாக்ஸ்கான் ஃபாக்ஸ்பிரைனின் திறன்கள் அதன் சொந்த செயல்பாடுகளுக்கு அப்பால் நீட்டிக்கப்படும் ஒரு எதிர்காலத்தை கற்பனை செய்கிறது. நிறுவனம் புதிய பயன்பாடுகளை ஆராயவும், உற்பத்தி, விநியோக சங்கிலி மேலாண்மை மற்றும் முடிவெடுக்கும் செயல்முறைகளில் AI இன் பயன்பாட்டை ஊக்குவிக்கவும் தொழில்நுட்ப கூட்டாளர்களுடன் தீவிரமாக ஒத்துழைக்க திட்டமிட்டுள்ளது.
இந்த கூட்டு அணுகுமுறை ஃபாக்ஸ்கானின் திறந்த மூல தத்துவத்துடன் ஒத்துப்போகிறது, AI இன் உண்மையான திறனை பகிரப்பட்ட அறிவு மற்றும் கூட்டு முயற்சி மூலம் மட்டுமே திறக்க முடியும் என்பதை அங்கீகரிக்கிறது. மற்ற நிறுவனங்களுடன் கூட்டு சேர்வதன் மூலம், ஃபாக்ஸ்கான் AI இன் தத்தெடுப்பை துரிதப்படுத்தவும் பல்வேறு தொழில்களில் புதுமையை இயக்கவும் நோக்கமாக கொண்டுள்ளது.
புதுமையை வெளிப்படுத்துதல்: என்விடியா GTC 2025 இல் விளக்கக்காட்சி
AI சமூகத்துடன் தனது முன்னேற்றங்களைப் பகிர்ந்துகொள்வதற்கான ஃபாக்ஸ்கானின் அர்ப்பணிப்பு, என்விடியா GTC 2025 மாநாட்டில் திட்டமிடப்பட்ட விளக்கக்காட்சி மூலம் மேலும் நிரூபிக்கப்படுகிறது. “திறந்த மூலத்திலிருந்து ஃபிரான்டியர் AI வரை: ஃபவுண்டேஷன் மாடல்களை உருவாக்குதல், தனிப்பயனாக்குதல் மற்றும் நீட்டித்தல்” என்ற தலைப்பில் அமர்வு, ஃபாக்ஸ்பிரைனின் வளர்ச்சியை காட்சிப்படுத்தவும், திறந்த மூல AI இன் பரந்த தாக்கங்களைப் பற்றி விவாதிக்கவும் ஒரு தளத்தை வழங்கும்.
இந்த விளக்கக்காட்சி ஃபாக்ஸ்கானின் வெளிப்படைத்தன்மைக்கான அர்ப்பணிப்பையும், AI இன் எதிர்காலத்தைப் பற்றிய தொடர்ச்சியான உரையாடலுக்கு பங்களிப்பதற்கான அதன் விருப்பத்தையும் அடிக்கோடிட்டுக் காட்டுகிறது. அதன் அனுபவங்களையும் நுண்ணறிவுகளையும் பகிர்வதன் மூலம், ஃபாக்ஸ்கான் AI சமூகத்திற்குள் மேலும் புதுமை மற்றும் ஒத்துழைப்பை ஊக்குவிப்பதை நோக்கமாகக் கொண்டுள்ளது. விளக்கக்காட்சி மார்ச் 20 அன்று நடைபெற்றது.