நீண்ட சூழல் LLM: NVIDIAவின் UltraLong-8B

பெரிய மொழி மாதிரிகளின் (LLM) சூழல் எல்லை விரிவாக்கம்

LLM-களின் திறன், உரை மற்றும் பல்லூடக பணிகளை திறம்பட செயல்படுத்தும் திறனால், அவற்றின் நிலப்பரப்பு கணிசமாக மறுவடிவமைக்கப்பட்டுள்ளது. இருப்பினும், ஒரு தொடர்ச்சியான சவால் உள்ளது: வரையறுக்கப்பட்ட சூழல் சாளரம். பல பயன்பாடுகள், குறிப்பாக சிக்கலான ஆவண பகுப்பாய்வு, விரிவான வீடியோ புரிதல், அதிநவீன சூழல் கற்றல் மற்றும் பயனுள்ள ஊக நேர அளவிடுதல் ஆகியவை டோக்கன்களின் பரந்த வரிசைகளை செயலாக்க மற்றும் காரணங்காண வேண்டிய அவசியத்தை ஏற்படுத்துகின்றன. இந்த வரம்பு நீண்ட ஆவணங்களில் சிதறிக்கிடக்கும் முக்கியமான தகவல்களை கவனிக்காமல் போகச் செய்து, மாதிரியின் ஒட்டுமொத்த செயல்திறனைத் தடுக்கலாம்.

சூழல் சாளர சிக்கல்

பாரம்பரிய LLM-கள் விரிவான ஆவணங்கள் அல்லது வீடியோக்களை எதிர்கொள்ளும்போது சிரமப்படுகின்றன, பெரும்பாலும் அவற்றின் நிலையான சூழல் சாளரங்களுக்கு வெளியே இருக்கும் முக்கியமான விவரங்களை தவறவிடுகின்றன. இந்த கட்டுப்பாடு, நிலையான பணிகளில் அவற்றின் செயல்திறனை சமரசம் செய்யாமல், மிக நீண்ட சூழல்களை திறமையாக நிர்வகிக்கக்கூடிய மாதிரிகளுக்கான தேவையைத் தூண்டியுள்ளது. சூழல் சாளரத்தை விரிவாக்கும் தேடல் LLM ஆராய்ச்சியில் ஒரு மையப் புள்ளியாக மாறியுள்ளது, பல்வேறு கட்டடக்கலை மற்றும் பயிற்சி முறைகளில் புதுமைகளை இயக்குகிறது.

சூழல் விரிவாக்கத்திற்கான உத்திகள்

நீண்ட சூழல் மொழி மாதிரிகளுக்கான தற்போதைய உத்திகளை மூன்று முதன்மை அணுகுமுறைகளாகப் பிரிக்கலாம்:

  • சரியான கவனம் முறைகள்: இந்த முறைகள் நிலை உட்பொதிப்புகளை மறுவடிவமைப்பதன் மூலம் கவன வழிமுறையை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளன. நிலை இடைக்கணிப்பு, NTK-அறிவு, டைனமிக் NTK, யாஆர்என் மற்றும் CLEX ஆகியவை குறிப்பிடத்தக்க எடுத்துக்காட்டுகள். இந்த நுட்பங்கள் ஒரு நீண்ட வரிசையில் உள்ள டோக்கன்களுக்கு இடையே சிறப்பாக வேறுபடுத்தி மாதிரியை அனுமதிக்கின்றன, இதன் மூலம் நீண்ட தூர சார்புகளைப் பிடிக்க உதவுகின்றன.

  • தோராயமான கவனம் முறைகள்: இந்த முறைகள் கவன வழிமுறையின் கணக்கீட்டு சிக்கலைக் குறைப்பதில் கவனம் செலுத்துகின்றன, இதன் மூலம் மாதிரி நீண்ட வரிசைகளை மிகவும் திறமையாக செயலாக்க உதவுகிறது. அரிதான கவனம் மற்றும் குறைந்த தரவரிசை கவனம் போன்ற நுட்பங்கள் இந்த வகைக்குள் அடங்கும்.

  • கூடுதல் தொகுதிகளை உள்ளடக்கிய அணுகுமுறைகள்: இந்த முறைகள் நீண்ட தூர சார்புகளைக் கையாள சிறப்பாக வடிவமைக்கப்பட்ட வெளிப்புற தொகுதிகளுடன் LLM ஐ மேம்படுத்துகின்றன. நினைவக வலைப்பின்னல்கள் மற்றும் படிநிலை கவனம் வழிமுறைகள் எடுத்துக்காட்டுகள்.

GPT-4o, ஜெமினி மற்றும் கிளாட் போன்ற தனியுரிம மாதிரிகள் நூறாயிரக்கணக்கான டோக்கன்களின் சூழல் சாளரங்களை ஆதரிக்கும் திறனைக் காட்டியிருந்தாலும், அவற்றின் வெளிப்படைத்தன்மை இல்லாமை இனப்பெருக்கம் மற்றும் மேலும் ஆராய்ச்சியை மட்டுப்படுத்துகிறது. NTK-அறிவு அளவிடுதலைப் பயன்படுத்தும் ProLong போன்ற திறந்த மூல முயற்சிகளுக்கு கணிசமான கணக்கீட்டு வளங்கள் தேவைப்படுகின்றன, அதே நேரத்தில் கிராடியன்ட் தொடர்ச்சியான முன் பயிற்சியைப் பயன்படுத்துகிறது, இது நிலையான பணி செயல்திறனை எதிர்மறையாக பாதிக்கும்.

NVIDIA’வின் UltraLong-8B: ஒரு திருப்புமுனை அணுகுமுறை

UIUC மற்றும் NVIDIA-வின் ஆராய்ச்சியாளர்கள், சீரமைக்கப்பட்ட அறிவுறுத்தல் மாதிரிகளிலிருந்து மிக நீண்ட சூழல் LLM-களை உருவாக்குவதற்கான ஒரு திறமையான பயிற்சி முறையை அறிமுகப்படுத்தியுள்ளனர். இந்த புதுமையான அணுகுமுறை சூழல் நீளங்களின் எல்லைகளை 128K இலிருந்து 1M, 2M மற்றும் 4M டோக்கன்களாக உயர்த்துகிறது. இந்த முறை சூழல் சாளரத்தை விரிவாக்க திறமையான, தொடர்ச்சியான முன் பயிற்சி உத்திகளைப் பயன்படுத்துகிறது, அதே நேரத்தில் அறிவுறுத்தல் பின்தொடர்தல் மற்றும் காரணங்காணும் திறன்களைப் பாதுகாக்க அறிவுறுத்தல் சரிசெய்தலைப் பயன்படுத்துகிறது.

UltraLong-8B மாதிரி பல்வேறு நீண்ட சூழல் தரநிலைகளில் அதிநவீன செயல்திறனை அடைகிறது. இந்த அணுகுமுறையைப் பயன்படுத்தி பயிற்சி அளிக்கப்பட்ட மாதிரிகள் நிலையான தரநிலைகளில் போட்டி செயல்திறனைப் பராமரிக்கின்றன, இது நீண்ட மற்றும் குறுகிய சூழல் பணிகள் இரண்டிற்கும் சீரான முன்னேற்றங்களைக் காட்டுகிறது. இந்த ஆராய்ச்சி முக்கிய வடிவமைப்புத் தேர்வுகளின் ஆழமான பகுப்பாய்வை வழங்குகிறது, அளவிடுதல் உத்திகள் மற்றும் தரவு கலவையின் தாக்கத்தை வலியுறுத்துகிறது.

இரண்டு-படி பயிற்சி செயல்முறை

முன்மொழியப்பட்ட முறை இரண்டு முக்கியமான படிகளைக் கொண்டுள்ளது:

  1. தொடர்ச்சியான முன் பயிற்சி: இந்த படி ஒரு பெரிய உரை தரவுத் தொகுப்பில் ஏற்கனவே உள்ள LLM-ஐ மேலும் பயிற்சி செய்வதை உள்ளடக்குகிறது. மாதிரியின் சூழல் சாளரத்தை விரிவாக்குவது மற்றும் நீண்ட வரிசைகளை செயலாக்கும் திறனை மேம்படுத்துவது குறிக்கோள்.

  2. அறிவுறுத்தல் சரிசெய்தல்: இந்த படி அறிவுறுத்தல்கள் மற்றும் தொடர்புடைய பதில்களின் தரவுத்தொகுப்பில் மாதிரியை நன்றாக சரிசெய்வதை உள்ளடக்குகிறது. அறிவுறுத்தல்களைப் பின்பற்றி, ஒத்திசைவான, பொருத்தமான பதில்களை உருவாக்கும் மாதிரியின் திறனை மேம்படுத்துவது குறிக்கோள்.

ஒன்றாக, இந்த படிகள் பரந்த அளவிலான பணிகளில் வலுவான செயல்திறனை பராமரிக்கும் அதே நேரத்தில் மிக நீண்ட உள்ளீடுகளை திறம்பட செயலாக்க உதவுகின்றன. ஆராய்ச்சியாளர்கள் சூழல் விரிவாக்கத்திற்கு யாஆர்என் அடிப்படையிலான அளவிடுதல் அணுகுமுறையை ஏற்றுக்கொண்டனர், NTK-அறிவு அளவிடுதல் உத்திகளுக்கு பதிலாக நிலையான மீமாற்றுகளை (α = 1 மற்றும் β = 4) பயன்படுத்தினர். இலக்கு சூழல் நீளத்தின் அடிப்படையில் அளவுகோல் காரணிகள் கணக்கிடப்படுகின்றன, RoPE உட்பொதிப்புகளுக்கு பெரிய அளவுகோல் காரணிகளைப் பயன்படுத்தி விரிவாக்கப்பட்ட வரிசைகளுக்கு இடமளிக்கிறது மற்றும் அதிகபட்ச நீளங்களில் செயல்திறன் தரமிறக்கத்தைத் தணிக்கிறது.

பயிற்சி தரவுகளுக்காக, ஆராய்ச்சியாளர்கள் பொது, கணிதம் மற்றும் குறியீடு களங்களில் பரவியிருக்கும் உயர்தர SFT தரவுத்தொகுப்புகளை மாதிரியாகக் கொண்டனர். பதில்களைச் செம்மைப்படுத்தவும், கடுமையான தரவு மாசுபாட்டைச் செய்யவும் அவர்கள் GPT-4o மற்றும் GPT-4o-mini ஐ மேலும் பயன்படுத்தினர், இது பயிற்சி தரவுகளின் தரம் மற்றும் நம்பகத்தன்மையை உறுதி செய்கிறது.

UltraLong மாதிரிகளின் செயல்திறனை வெளிப்படுத்துதல்

முன்மொழியப்பட்ட மாதிரிகள் சிறந்த நீண்ட சூழல் மீட்டெடுப்பு திறன்களைக் காட்டுகின்றன, இது ‘வைக்கோல் போரில் ஊசி’ பாஸ்கீ மீட்டெடுப்பு சோதனையில் நிரூபிக்கப்பட்டுள்ளது. Llama-3-8B-Instruct-Gradient-1048k போன்ற அடிப்படை மாதிரிகள் சோதனையில் தேர்ச்சி பெற்றாலும், Llama3.1-8B-Instruct மற்றும் Llama-3-8B-ProLong-512k-Instruct போன்ற பிற மாதிரிகள் பிழைகளைக் காட்டுகின்றன. இதற்கு மாறாக, UltraLong மாதிரிகள் அனைத்து உள்ளீட்டு நீளங்கள் மற்றும் ஆழங்களிலும் 100% துல்லியத்தை அடைகின்றன, இது அவற்றின் குறிப்பிடத்தக்க மீட்டெடுப்பு திறன்களைக் காட்டுகிறது.

மேலும், UltraLong மாதிரிகள் 512K மற்றும் 1M டோக்கன்கள் வரையிலான உள்ளீடுகளுக்கு RULER இல் மிக உயர்ந்த சராசரி மதிப்பெண்களை அடைகின்றன, 128K மற்றும் 256K டோக்கன் நீளங்களுக்குள் LV-Eval இல் மிக உயர்ந்த F1 மதிப்பெண்களை அடைகின்றன, மேலும் InfiniteBench இல் சிறந்த செயல்திறனை அடைகின்றன. இந்த முடிவுகள் மாதிரிகளின் திறன் மற்றும் மிக நீண்ட வரிசைகளில் காரணங்காணும் திறனை அடிக்கோடிட்டுக் காட்டுகின்றன.

இந்த மாதிரிகள் பொது, கணிதம் மற்றும் குறியீடு களங்களில் வலுவான செயல்திறனை பராமரிக்கின்றன, சராசரி மதிப்பெண்கள் 62.47, 61.06 மற்றும் 60.95 ஆகும், இது அடிப்படை மாதிரியின் மதிப்பெண் 61.45 ஐ விட அதிகமாகும். இது மாதிரிகளின் பல்துறைத் தன்மையையும் வெவ்வேறு வகையான பணிகளில் பொதுமைப்படுத்தும் திறனையும் நிரூபிக்கிறது.

UltraLong அணுகுமுறையின் முக்கிய நன்மைகள்

  • விரிவாக்கப்பட்ட சூழல் சாளரம்: UltraLong மாதிரிகள் 4 மில்லியன் டோக்கன்கள் வரையிலான வரிசைகளை செயலாக்க முடியும், இது பாரம்பரிய LLM-களின் திறன்களை கணிசமாக மீறுகிறது.
  • அதிநவீன செயல்திறன்: இந்த மாதிரிகள் பல்வேறு நீண்ட சூழல் தரநிலைகளில் அதிநவீன செயல்திறனை அடைகின்றன.
  • சீரான முன்னேற்றங்கள்: இந்த மாதிரிகள் நீண்ட மற்றும் குறுகிய சூழல் பணிகள் இரண்டிற்கும் சீரான முன்னேற்றங்களைக் காட்டுகின்றன.
  • திறமையான பயிற்சி: பயிற்சி முறை திறமையானது மற்றும் நியாயமான கணக்கீட்டு வளங்களுடன் செயல்படுத்தப்படலாம்.
  • பல்துறைமை: இந்த மாதிரிகள் பொது, கணிதம் மற்றும் குறியீடு களங்களில் வலுவான செயல்திறனை பராமரிக்கின்றன.

எதிர்கால திசைகள் மற்றும் கருத்தாய்வுகள்

UltraLong அணுகுமுறை LLM-களின் துறையில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கும் அதே வேளையில், எதிர்கால ஆராய்ச்சி மற்றும் மேம்பாட்டிற்கான பகுதிகள் இன்னும் உள்ளன. தற்போதைய அணுகுமுறை அறிவுறுத்தல் சரிசெய்தல் கட்டத்தில் அறிவுறுத்தல் தரவுத்தொகுப்புகளில் SFT இல் மட்டுமே கவனம் செலுத்துகிறது, வலுவூட்டல் கற்றல் அல்லது விருப்ப தேர்வுமுறையை ஆராயாமல். இந்த நுட்பங்களை ஒருங்கிணைப்பது மேலும் செயல்திறன் ஆதாயங்களுக்கு வழிவகுக்கும்.

மற்றொரு முக்கியமான கருத்தில் பாதுகாப்பு சீரமைப்பு உள்ளது. தற்போதைய அணுகுமுறை பாதுகாப்பு கவலைகளை வெளிப்படையாகக் குறிப்பிடவில்லை, மேலும் மாதிரிகள் பாதுகாப்பான மற்றும் பொறுப்பான வெளியீடுகளை உருவாக்குகின்றன என்பதை உறுதிப்படுத்த பாதுகாப்பு சீரமைப்பு வழிமுறைகளை இணைப்பதில் எதிர்கால ஆராய்ச்சி கவனம் செலுத்த வேண்டும்.

மேலும் ஆராய்ச்சி செயல்திறன் மற்றும் நம்பகத்தன்மையை மேலும் மேம்படுத்த மேம்பட்ட சரிசெய்தல் உத்திகளை ஆராயலாம். இது விரோதமான பயிற்சி, பாடத்திட்ட கற்றல் மற்றும் பரிமாற்ற கற்றல் போன்ற நுட்பங்களை உள்ளடக்கியிருக்கலாம்.

அல்ட்ரா லாங் கான்டெக்ஸ்ட் மாடல்களின் தாக்கம்

அல்ட்ரா லாங் கான்டெக்ஸ்ட் மொழி மாடல்களை உருவாக்குவது பரவலான பயன்பாடுகளை புரட்சிகரமாக்கும் திறனைக் கொண்டுள்ளது, இதில்:

  • ஆவணப் புரிதல்: அல்ட்ரா லாங் கான்டெக்ஸ்ட் மாடல்களைப் பயன்படுத்தி சட்ட ஒப்பந்தங்கள், அறிவியல் கட்டுரைகள் மற்றும் நிதி அறிக்கைகள் போன்ற நீண்ட ஆவணங்களை பகுப்பாய்வு செய்து சுருக்கலாம்.
  • வீடியோப் புரிதல்: இந்த மாடல்களைப் பயன்படுத்தி வீடியோக்களைப் புரிந்து கொண்டு பகுப்பாய்வு செய்யலாம். வீடியோ சுருக்கம், வீடியோ தேடல் மற்றும் வீடியோ வசனம் போன்ற பயன்பாடுகளை செயல்படுத்தலாம்.
  • இன்-கான்டெக்ஸ்ட் கற்றல்: அல்ட்ரா லாங் கான்டெக்ஸ்ட் மாடல்களைப் பயன்படுத்தி இன்-கான்டெக்ஸ்ட் கற்றலைச் செய்யலாம். மாடல் உள்ளீட்டில் வழங்கப்பட்ட சில எடுத்துக்காட்டுகளிலிருந்து கற்றுக்கொள்கிறது.
  • இன்ஃபெரன்ஸ்-டைம் ஸ்கேலிங்: LLM-களின் இன்ஃபெரன்ஸ் திறனை மேம்படுத்தவும், வேகமான மற்றும் மிகவும் ஸ்கேலபிள் டெப்ளாய்மெண்ட்டை செயல்படுத்தவும் இந்த மாடல்களைப் பயன்படுத்தலாம்.
  • அறிவியல் ஆராய்ச்சி: அல்ட்ரா லாங் கான்டெக்ஸ்ட் மாடல்கள் ஜீனோமிக்ஸ், வானியற்பியல் மற்றும் காலநிலை அறிவியல் போன்ற துறைகளில் பெரிய தரவுத் தொகுப்புகளைப் பகுப்பாய்வு செய்ய உதவுகின்றன. இது கண்டுபிடிப்புகளையும் நுண்ணறிவுகளையும் துரிதப்படுத்துகிறது.
  • வரலாற்று பகுப்பாய்வு: விரிவான வரலாற்று உரைகளை செயலாக்குவதன் மூலம், இந்த மாடல்கள் கைகளால் கண்டுபிடிப்பது கடினம் அல்லது சாத்தியமில்லாத வடிவங்கள், உறவுகள் மற்றும் நுண்ணறிவுகளை வெளிக்கொணர முடியும்.
  • சாஃப்ட்வேர் மேம்பாடு: இந்த மாடல்கள் பெரிய கோட் பேஸ்களைப் பகுப்பாய்வு செய்யலாம். பிழைகளை அடையாளம் கண்டு, சாஃப்ட்வேர் மேம்பாட்டு செயல்முறையை ஒழுங்குபடுத்த பரிந்துரைகளை வழங்கலாம்.
  • கிரியேட்டிவ் ரைட்டிங்: அல்ட்ரா லாங் கான்டெக்ஸ்ட் மாடல்கள் எழுத்தாளர்கள் சிக்கலான கதைகளை உருவாக்கவும், நிலைத்தன்மையை பராமரிக்கவும், ஈர்க்கும் உள்ளடக்கத்தை உருவாக்கவும் உதவுகின்றன.
  • தனிப்பயனாக்கப்பட்ட கல்வி: ஒரு மாணவரின் கற்றல் வரலாறு மற்றும் விருப்பங்களைப் புரிந்துகொள்வதன் மூலம், இந்த மாடல்கள் தனிப்பட்ட தேவைகளுக்கு ஏற்றவாறு தனிப்பயனாக்கப்பட்ட கல்வி அனுபவங்களை வழங்க முடியும்.

முடிவுரை

NVIDIA’வின் UltraLong-8B மாதிரி மற்றும் அதனுடன் தொடர்புடைய பயிற்சி முறை ஆகியவை மிக நீண்ட வரிசைகளை செயலாக்க மற்றும் காரணங்காணக்கூடிய LLM-களை உருவாக்கும் முயற்சியில் ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறிக்கிறது. திறமையான தொடர்ச்சியான முன்கூட்டிய பயிற்சி மற்றும் அறிவுறுத்தல் சரிசெய்தல் ஆகியவற்றை இணைப்பதன் மூலம், ஆராய்ச்சியாளர்கள் நிலையான பணிகளில் போட்டி செயல்திறனைப் பராமரிக்கும் அதே வேளையில், பல்வேறு நீண்ட சூழல் தரநிலைகளில் அதிநவீன செயல்திறனை அடையும் ஒரு மாதிரியை உருவாக்கியுள்ளனர். எதிர்கால ஆராய்ச்சி மற்றும் மேம்பாட்டிற்கான பகுதிகள் இன்னும் இருந்தாலும், UltraLong அணுகுமுறை பரவலான பயன்பாடுகளை புரட்சிகரமாக்கும் மற்றும் LLM-களுக்கான புதிய சாத்தியக்கூறுகளைத் திறக்கும் திறனைக் கொண்டுள்ளது.