ரேகா ஃப்ளாஷ் 3: 21B மாதிரி வெளியீடு

இன்றைய AI நிலப்பரப்பில் உள்ள நடைமுறை சவால்கள்

செயற்கை நுண்ணறிவின் விரைவான பரிணாமம் ஏராளமான வாய்ப்புகளைக் கொண்டு வந்துள்ளது, ஆனால் இது டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு குறிப்பிடத்தக்க தடைகளையும் அளித்துள்ளது. மிகவும் அழுத்தமான சிக்கல்களில் ஒன்று பல நவீன AI மாடல்களுடன் தொடர்புடைய அதிக கணக்கீட்டு தேவை. இந்த மாடல்களுக்கு பயிற்சி அளிப்பதற்கும் பயன்படுத்துவதற்கும் பெரும்பாலும் கணிசமான செயலாக்க சக்தி தேவைப்படுகிறது, இது சிறிய நிறுவனங்கள் அல்லது குறைந்த வளங்களைக் கொண்டவர்கள் AI இன் நன்மைகளை முழுமையாகப் பயன்படுத்துவதை கடினமாக்குகிறது.

மேலும், மறைநிலை சிக்கல்கள் பயனர் அனுபவத்தை கணிசமாக பாதிக்கலாம், குறிப்பாக நிகழ்நேர பயன்பாடுகளில். பதிலளிப்பு நேரங்களில் தாமதங்கள் ஒரு AI அமைப்பை நடைமுறைக்கு மாறானதாக மாற்றக்கூடும், அது ஈர்க்கக்கூடிய திறன்களைக் கொண்டிருந்தாலும் கூட. சாட்போட்கள் அல்லது ஊடாடும் கருவிகள் போன்ற உடனடி கருத்தை தேவைப்படும் பயன்பாடுகளுக்கு இது குறிப்பாக உண்மை.

மற்றொரு சவால் உண்மையிலேயே மாற்றியமைக்கக்கூடிய ஓப்பன் சோர்ஸ் மாடல்களின் வரையறுக்கப்பட்ட கிடைக்கும் தன்மையில் உள்ளது. பல ஓப்பன் சோர்ஸ் விருப்பங்கள் இருந்தாலும், அவை குறிப்பிட்ட பயன்பாட்டு நிகழ்வுகளை நிவர்த்தி செய்ய அல்லது உருவாகும் தேவைகளுக்கு ஏற்ப தேவையான நெகிழ்வுத்தன்மையை எப்போதும் வழங்காது. இது புதுமைகளை கட்டுப்படுத்தலாம் மற்றும் டெவலப்பர்களை தனியுரிம தீர்வுகளை நம்பியிருக்க கட்டாயப்படுத்தலாம், அவை அவற்றின் சொந்த வரம்புகள் மற்றும் செலவுகளுடன் வரக்கூடும்.

தற்போதைய பல AI தீர்வுகள் விலையுயர்ந்த கிளவுட் உள்கட்டமைப்புகளை பெரிதும் சார்ந்துள்ளன. கிளவுட் கம்ப்யூட்டிங் அளவிடுதல் மற்றும் வசதியை வழங்கினாலும், இது ஒரு குறிப்பிடத்தக்க நிதிச் சுமையாக இருக்கலாம், குறிப்பாக சிறிய நிறுவனங்கள் அல்லது தனிப்பட்ட டெவலப்பர்களுக்கு. சக்திவாய்ந்த கணினி வளங்களை அணுகுவதற்கான செலவு நுழைவுக்கு ஒரு தடையாக இருக்கலாம், பலர் AI தீர்வுகளை ஆராய்வதற்கும் செயல்படுத்துவதற்கும் தடுக்கிறது.

மேலும், சாதன பயன்பாடுகளுக்கு போதுமான திறமையான மற்றும் நெகிழ்வான மாடல்களுக்கான சந்தையில் ஒரு குறிப்பிடத்தக்க இடைவெளி உள்ளது. தற்போதுள்ள பல மாடல்கள் ஸ்மார்ட்போன்கள் அல்லது உட்பொதிக்கப்பட்ட அமைப்புகள் போன்ற வரையறுக்கப்பட்ட செயலாக்க சக்தி மற்றும் நினைவகம் கொண்ட சாதனங்களில் பயன்படுத்தப்படுவதற்கு மிகவும் பெரியதாகவும் வள-தீவிரமாகவும் உள்ளன. இது AI ஆனது அன்றாட சாதனங்கள் மற்றும் பயன்பாடுகளின் பரந்த வரம்பில் ஒருங்கிணைக்கப்படுவதற்கான சாத்தியத்தை கட்டுப்படுத்துகிறது.

AI ஐ மேலும் அணுகக்கூடியதாகவும் தனிப்பயனாக்கக்கூடியதாகவும் மாற்றுவதற்கு இந்த சவால்களை நிவர்த்தி செய்வது முக்கியம். அதிகப்படியான வளங்கள் தேவைப்படாமல் பல்வேறு பயன்பாடுகளுக்கு ஏற்ப வடிவமைக்கக்கூடிய தீர்வுகளுக்கான தேவை அதிகரித்து வருகிறது. இது அதிக டெவலப்பர்கள் மற்றும் நிறுவனங்களை AI இன் சக்தியைப் பயன்படுத்தவும், அவர்களின் குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்யும் புதுமையான தீர்வுகளை உருவாக்கவும் அதிகாரம் அளிக்கும்.

ரேகா ஃப்ளாஷ் 3 அறிமுகம்: AI மாடலிங்கிற்கான ஒரு புதிய அணுகுமுறை

ரேகா AI’இன் ரேகா ஃப்ளாஷ் 3 மேலே கோடிட்டுக் காட்டப்பட்ட சவால்களை நிவர்த்தி செய்வதில் ஒரு குறிப்பிடத்தக்க படியை முன்வைக்கிறது. இந்த 21-பில்லியன்-அளவுரு ரீசனிங் மாடல் புதிதாக உருவாக்கப்பட்டது, நடைமுறை மற்றும் பன்முகத்தன்மைக்கு முக்கியத்துவம் அளிக்கிறது. இது பின்வரும் பரந்த அளவிலான பயன்பாடுகளுக்கான அடித்தள கருவியாக வடிவமைக்கப்பட்டுள்ளது:

  • பொது உரையாடல்: இயற்கையான மற்றும் ஒத்திசைவான உரையாடல்களில் ஈடுபடுதல்.
  • கோடிங் ஆதரவு: டெவலப்பர்களுக்கு குறியீடு உருவாக்கம் மற்றும் பிழைத்திருத்தத்தில் உதவுதல்.
  • அறிவுறுத்தல் பின்பற்றுதல்: பயனர் வழிமுறைகளை துல்லியமாக விளக்குதல் மற்றும் செயல்படுத்துதல்.
  • செயல்பாடு அழைப்பு: வெளிப்புற கருவிகள் மற்றும் APIகளுடன் தடையின்றி ஒருங்கிணைத்தல்.

ரேகா ஃப்ளாஷ் 3 இன் வளர்ச்சியானது கவனமாக தொகுக்கப்பட்ட பயிற்சி செயல்முறையை உள்ளடக்கியது. இந்த செயல்முறை பின்வருவனவற்றின் கலவையை மேம்படுத்தியது:

  • பொதுவில் அணுகக்கூடிய தரவுத்தொகுப்புகள்: பரந்த அறிவுத் தளத்தை வழங்க உடனடியாக கிடைக்கக்கூடிய தரவைப் பயன்படுத்துதல்.
  • செயற்கை தரவுத்தொகுப்புகள்: குறிப்பிட்ட திறன்களை மேம்படுத்தவும் தரவு இடைவெளிகளை நிவர்த்தி செய்யவும் செயற்கை தரவை உருவாக்குதல்.

இந்த கலப்பு அணுகுமுறை மாதிரி நன்கு வட்டமானது மற்றும் பல்வேறு வகையான பணிகளைக் கையாளும் திறன் கொண்டது என்பதை உறுதி செய்கிறது. மேலும் சுத்திகரிப்பு மூலம் அடையப்பட்டது:

  • கவனமாக அறிவுறுத்தல் ட்யூனிங்: வழிமுறைகளைப் புரிந்துகொண்டு பதிலளிக்கும் மாதிரியின் திறனை மேம்படுத்துதல்.
  • REINFORCE Leave One-Out (RLOO) முறைகளைப் பயன்படுத்தி வலுவூட்டல் கற்றல்: மீண்டும் மீண்டும் வரும் கருத்து மற்றும் முன்னேற்றம் மூலம் மாதிரியின் செயல்திறனை மேம்படுத்துதல்.

இந்த வேண்டுமென்றே மற்றும் பன்முக பயிற்சி முறையானது திறன் மற்றும் செயல்திறன் ஆகியவற்றுக்கு இடையே உகந்த சமநிலையை ஏற்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது. கிடைக்கக்கூடிய AI மாடல்களின் நிலப்பரப்பில் ரேகா ஃப்ளாஷ் 3 ஐ ஒரு நடைமுறை மற்றும் விவேகமான தேர்வாக நிலைநிறுத்துவதே இதன் குறிக்கோள்.

ரேகா ஃப்ளாஷ் 3 இன் தொழில்நுட்ப அம்சங்கள் மற்றும் செயல்திறன்

ஒரு தொழில்நுட்ப கண்ணோட்டத்தில், ரேகா ஃப்ளாஷ் 3 அதன் பன்முகத்தன்மை மற்றும் வள செயல்திறனுக்கு பங்களிக்கும் பல அம்சங்களைக் கொண்டுள்ளது. இந்த அம்சங்கள் மாதிரியை சக்திவாய்ந்ததாகவும், பரந்த அளவிலான வரிசைப்படுத்தல் காட்சிகளுக்கு நடைமுறைக்குரியதாகவும் வடிவமைக்கப்பட்டுள்ளன.

சிறந்த அம்சங்களில் ஒன்று, 32,000 டோக்கன்கள் வரையிலான சூழல் நீளத்தைக் கையாளும் திறன் ஆகும். இது ஒரு குறிப்பிடத்தக்க நன்மை, ஏனெனில் இது மாதிரியை மூழ்கடிக்காமல் நீண்ட ஆவணங்கள் மற்றும் சிக்கலான பணிகளை செயலாக்கவும் புரிந்துகொள்ளவும் அனுமதிக்கிறது. இந்த திறன் குறிப்பாக பின்வருவனவற்றை உள்ளடக்கிய பயன்பாடுகளுக்கு பயனுள்ளதாக இருக்கும்:

  • பெரிய உரைத் தொகுப்புகளை பகுப்பாய்வு செய்தல்: விரிவான தரவுத்தொகுப்புகளிலிருந்து நுண்ணறிவுகளைப் பிரித்தெடுத்தல்.
  • விரிவான சுருக்கங்களை உருவாக்குதல்: நீண்ட தகவல்களை சுருக்கமான சுருக்கங்களாக சுருக்குதல்.
  • நீட்டிக்கப்பட்ட உரையாடல்களில் ஈடுபடுதல்: நீண்ட உரையாடல்களில் சூழல் மற்றும் ஒத்திசைவைப் பேணுதல்.

மற்றொரு புதுமையான அம்சம் ‘பட்ஜெட் ஃபோர்சிங்’ பொறிமுறையின் ஒருங்கிணைப்பு ஆகும். இந்த பொறிமுறையானது நியமிக்கப்பட்ட <reasoning> குறிச்சொற்கள் மூலம் செயல்படுத்தப்படுகிறது, இது பயனர்கள் மாதிரியின் பகுத்தறிவு செயல்முறையை வெளிப்படையாகக் கட்டுப்படுத்த அனுமதிக்கிறது. குறிப்பாக, பயனர்கள்:

  • பகுத்தறிவு படிகளின் எண்ணிக்கையை கட்டுப்படுத்தலாம்: மாதிரியின் கணக்கீட்டு முயற்சியை கட்டுப்படுத்தலாம்.
  • நிலையான செயல்திறனை உறுதிப்படுத்தலாம்: அதிகப்படியான வள நுகர்வை தடுக்கலாம்.
  • பதிலளிப்பு நேரங்களை மேம்படுத்தலாம்: பகுத்தறிவு ஆழத்தை கட்டுப்படுத்துவதன் மூலம் விரைவான முடிவுகளை அடையலாம்.

இந்த அம்சம் மாதிரியின் நடத்தை மீது மதிப்புமிக்க அளவிலான கட்டுப்பாட்டை வழங்குகிறது, இது குறிப்பாக வளக் கட்டுப்பாடுகள் அல்லது நிகழ்நேர செயல்திறன் முக்கியமான பயன்பாடுகளுக்கு ஏற்றதாக அமைகிறது.

மேலும், ரேகா ஃப்ளாஷ் 3 சாதன வரிசைப்படுத்தலை மனதில் கொண்டு வடிவமைக்கப்பட்டுள்ளது. இது ஒரு முக்கியமான கருத்தாகும், ஏனெனில் இது கிளவுட் அடிப்படையிலான சூழல்களுக்கு அப்பால் மாதிரியின் சாத்தியமான பயன்பாடுகளை விரிவுபடுத்துகிறது. மாதிரியின் அளவு மற்றும் செயல்திறன் ஆகியவை வரையறுக்கப்பட்ட செயலாக்க சக்தி மற்றும் நினைவகம் கொண்ட சாதனங்களில் இயக்குவதை சாத்தியமாக்குகிறது.

  • முழு துல்லிய அளவு (fp16): 39GB
  • 4-பிட் குவாண்டிசேஷன் அளவு: 11GB

இந்த சிறிய அளவு, குறிப்பாக குவாண்டிசேஷனுடன், பெரிய, அதிக வள-தீவிர மாடல்களுடன் ஒப்பிடும்போது மென்மையான மற்றும் பதிலளிக்கக்கூடிய உள்ளூர் வரிசைப்படுத்தல்களை அனுமதிக்கிறது. இது AI ஐ ஒருங்கிணைப்பதற்கான சாத்தியக்கூறுகளைத் திறக்கிறது:

  • மொபைல் பயன்பாடுகள்: ஸ்மார்ட்போன்கள் மற்றும் டேப்லெட்டுகளில் பயனர் அனுபவங்களை மேம்படுத்துதல்.
  • உட்பொதிக்கப்பட்ட அமைப்புகள்: வள-கட்டுப்படுத்தப்பட்ட சாதனங்களில் அறிவார்ந்த செயல்பாட்டை இயக்குதல்.
  • ஆஃப்லைன் பயன்பாடுகள்: இணைய இணைப்பு இல்லாவிட்டாலும் AI திறன்களை வழங்குதல்.

மதிப்பீடு மற்றும் செயல்திறன்: ஒரு நடைமுறை முன்னோக்கு

ரேகா ஃப்ளாஷ் 3 இன் நடைமுறைத்தன்மை அதன் மதிப்பீட்டு அளவீடுகள் மற்றும் செயல்திறன் தரவுகளால் மேலும் அடிக்கோடிட்டுக் காட்டப்படுகிறது. ஒவ்வொரு பெஞ்ச்மார்க்கிலும் சாதனை படைக்கும் மதிப்பெண்களை மாதிரி பெறவில்லை என்றாலும், இது பல்வேறு பணிகளில் ஒரு திடமான அளவிலான திறமையை நிரூபிக்கிறது.

உதாரணமாக, மாதிரி MMLU-Pro மதிப்பெண் 65.0 ஐ அடைகிறது. இது துறையில் அதிக மதிப்பெண் இல்லை என்றாலும், சூழலை கருத்தில் கொள்வது அவசியம். ரேகா ஃப்ளாஷ் 3 பொது-நோக்க பயன்பாட்டிற்காக வடிவமைக்கப்பட்டுள்ளது, மேலும் இந்த மதிப்பெண் பரந்த அளவிலான பாடங்களில் மரியாதைக்குரிய புரிதலைக் குறிக்கிறது. மேலும், வெப் சர்ச் போன்ற துணை அறிவு ஆதாரங்களுடன் இணைக்கப்படும்போது மாதிரியின் செயல்திறனை கணிசமாக மேம்படுத்தலாம். இது அதன் துல்லியம் மற்றும் பகுத்தறிவு திறன்களை மேம்படுத்த வெளிப்புற தகவல்களைப் பயன்படுத்துவதற்கான அதன் திறனை எடுத்துக்காட்டுகிறது.

மாதிரியின் பன்மொழி திறன்களும் குறிப்பிடத்தக்கவை. இது WMT’23 இல் 83.2 COMET மதிப்பெண்ணை அடைகிறது, இது இயந்திர மொழிபெயர்ப்புக்கு பரவலாகப் பயன்படுத்தப்படும் ஒரு அளவுகோலாகும். மாதிரி முதன்மையாக ஆங்கிலத்தில் கவனம் செலுத்தினாலும், ஆங்கிலம் அல்லாத உள்ளீடுகளைக் கையாள்வதில் நியாயமான அளவிலான திறமையைக் குறிக்கிறது. இந்த திறன் மாதிரியின் சாத்தியமான பயன்பாட்டை உலகளாவிய பார்வையாளர்கள் மற்றும் பல்வேறு மொழியியல் சூழல்களுக்கு விரிவுபடுத்துகிறது.

ரேகா ஃப்ளாஷ் 3 ஐ Qwen-32B போன்ற அதன் சகாக்களுடன் ஒப்பிடும்போது, அதன் திறமையான அளவுரு எண்ணிக்கை தெளிவாகிறது. இது கணிசமாக சிறிய மாதிரி அளவுடன் போட்டி செயல்திறனை அடைகிறது. இந்த செயல்திறன் பின்வருமாறு மொழிபெயர்க்கிறது:

  • குறைக்கப்பட்ட கணக்கீட்டு தேவைகள்: டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கான நுழைவுக்கான தடையை குறைத்தல்.
  • வேகமான அனுமான வேகங்கள்: நிகழ்நேர பயன்பாடுகளில் விரைவான பதிலளிப்பு நேரங்களை இயக்குதல்.
  • குறைந்த ஆற்றல் நுகர்வு: இது ஒரு சுற்றுச்சூழலுக்கு உகந்த விருப்பமாக அமைகிறது.

இந்த காரணிகள் மிகைப்படுத்தப்பட்ட கூற்றுக்கள் அல்லது நிலையற்ற வள கோரிக்கைகளை நாடாமல், பரந்த அளவிலான உண்மையான உலக பயன்பாடுகளுக்கான மாதிரியின் திறனை எடுத்துக்காட்டுகின்றன.

ரேகா ஃப்ளாஷ் 3: ஒரு சமநிலையான மற்றும் அணுகக்கூடிய AI தீர்வு

ரேகா ஃப்ளாஷ் 3 AI மாதிரி மேம்பாட்டிற்கான சிந்தனைமிக்க மற்றும் நடைமுறை அணுகுமுறையை குறிக்கிறது. இது செயல்திறன் மற்றும் செயல்திறன் ஆகியவற்றுக்கு இடையேயான சமநிலைக்கு முன்னுரிமை அளிக்கிறது, இதன் விளைவாக ஒரு வலுவான மற்றும் மாற்றியமைக்கக்கூடிய மாதிரி கிடைக்கிறது. பொதுவான அரட்டை, கோடிங் மற்றும் அறிவுறுத்தல் பணிகளில் அதன் திறன்கள், அதன் சிறிய வடிவமைப்பு மற்றும் புதுமையான அம்சங்களுடன் இணைந்து, பல்வேறு வரிசைப்படுத்தல் காட்சிகளுக்கு இது ஒரு நடைமுறை விருப்பமாக அமைகிறது.

32,000-டோக்கன் சூழல் சாளரம் சிக்கலான மற்றும் நீண்ட உள்ளீடுகளைக் கையாள மாதிரியை அதிகாரம் செய்கிறது, அதே நேரத்தில் பட்ஜெட் ஃபோர்சிங் பொறிமுறையானது பயனர்களுக்கு அதன் பகுத்தறிவு செயல்முறையின் மீது சிறுமணி கட்டுப்பாட்டை வழங்குகிறது. இந்த அம்சங்கள், சாதன வரிசைப்படுத்தல்கள் மற்றும் குறைந்த தாமத பயன்பாடுகளுக்கான அதன் பொருத்தத்துடன், ரேகா ஃப்ளாஷ் 3 ஐ ஒரு திறமையான மற்றும் நிர்வகிக்கக்கூடிய AI தீர்வைத் தேடும் ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்களுக்கான மதிப்புமிக்க கருவியாக நிலைநிறுத்துகின்றன. இது தேவையற்ற சிக்கலான தன்மை அல்லது அதிகப்படியான வள கோரிக்கைகள் இல்லாமல் நடைமுறைத் தேவைகளுடன் ஒத்துப்போகும் ஒரு நம்பிக்கைக்குரிய அடித்தளத்தை வழங்குகிறது.