IBM Granite 4.0 Tiny முன்னோட்டம்

IBM நிறுவனம் சமீபத்தில் Granite 4.0 Tiny மாதிரியின் முன்னோட்ட வெளியீட்டை அறிவித்துள்ளது. இது Granite 4.0 மொழி மாதிரி வரிசையில் மிகவும் சிறியது. இந்த மாதிரி Apache 2.0 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது. இது நீண்ட சூழல் செயலாக்கம் மற்றும் அறிவுறுத்தல் சார்ந்த பயன்பாடுகளுக்காக வடிவமைக்கப்பட்டுள்ளது. இது திறந்த அணுகல் மற்றும் சிறந்த செயல்திறன் ஆகியவற்றை கவனமாக வழங்குகிறது. திறந்த மற்றும் வெளிப்படையான அடிப்படை மாதிரிகளை உருவாக்குவதற்கும், நிறுவன தர பயன்பாடுகளுக்காக வடிவமைக்கப்பட்ட மாதிரிகளை உருவாக்குவதற்கும் IBM உறுதிபூண்டுள்ளது.

Granite 4.0 Tiny முன்னோட்டத்தில் இரண்டு தனித்துவமான பதிப்புகள் உள்ளன: Base-Preview, இது ஒரு புதுமையான டிகோடர்-மட்டும் கட்டமைப்பைக் காட்டுகிறது, மற்றும் Tiny-Preview (Instruct), இது உரையாடல் மற்றும் பல மொழி தொடர்புகளுக்காக வடிவமைக்கப்பட்டுள்ளது. Granite 4.0 Tiny சிறிய அளவுரு எண்ணிக்கையைக் கொண்டிருந்தாலும், இது பல்வேறு பகுப்பாய்வு மற்றும் உருவாக்கும் தரநிலைகளில் சிறந்த முடிவுகளை அடைகிறது.

கட்டமைப்பு விவரங்கள்: மாம்பா-2-ஈர்க்கப்பட்ட இயக்கவியலுடன் கலப்பின கலவை-நிபுணர்கள் கட்டமைப்பு

Granite 4.0 Tiny இன் மையத்தில் கலப்பின கலவை-நிபுணர்கள் (MoE) கட்டமைப்பு உள்ளது, இது மொத்தம் 7 பில்லியன் அளவுருக்களைக் கொண்டுள்ளது, இதில் ஒவ்வொரு ஃபார்வர்ட் பாஸின் போதும் 1 பில்லியன் அளவுருக்கள் மட்டுமே வேலை செய்கின்றன. இந்த உள்ளார்ந்த அடர்த்தி மாதிரியானது கணக்கீட்டு தேவைகளை கணிசமாகக் குறைக்கும் போது அளவிடக்கூடிய செயல்திறனை வழங்க உதவுகிறது. இது குறைந்த வளமுள்ள சூழல்களில் மற்றும் எட்ஜ் அடிப்படையிலான அனுமானம் காட்சிகளில் பயன்படுத்த ஏற்றது.

Base-Preview மாறுபாடு டிகோடர்-மட்டும் கட்டமைப்பைப் பயன்படுத்துகிறது, இது பாரம்பரிய கவனம் செலுத்தும் வழிமுறைகளுக்கு ஒரு நேரியல் மறுநிகழ்வு மாற்றாக மாம்பா-2-பாணி அடுக்குகளுடன் மேம்படுத்தப்பட்டுள்ளது. இந்த கட்டடக்கலை கண்டுபிடிப்பு உள்ளீட்டு நீளம் அதிகரிக்கும்போது மாதிரியை மிகவும் திறம்பட அளவிட அனுமதிக்கிறது. இதனால் ஆழமான ஆவண பகுப்பாய்வு, விரிவான உரையாடல் சுருக்கம் மற்றும் அறிவு சார்ந்த கேள்வி பதிலளித்தல் போன்ற நீண்ட சூழல் பணிகளில் அதன் செயல்திறனை அதிகரிக்கிறது.

மற்றொரு குறிப்பிடத்தக்க கட்டடக்கலை முடிவு NoPE (நிலை குறியீடுகள் இல்லை) செயல்படுத்தல் ஆகும். நிலையான அல்லது கற்றல் நிலை உட்பொதிவுகளை நம்புவதற்கு பதிலாக, மாதிரி நிலை தகவலை நேரடியாக அதன் அடுக்கு இயக்கவியலில் ஒருங்கிணைக்கிறது. இந்த அணுகுமுறை மாறுபடும் உள்ளீட்டு நீளங்களில் மேம்பட்ட பொதுமைப்படுத்தலை ஊக்குவிக்கிறது மற்றும் நீண்ட வரிசை உருவாக்கம் முழுவதும் நிலைத்தன்மையை பராமரிக்க உதவுகிறது.

தரநிலை செயல்திறன்: திறனை தியாகம் செய்யாமல் செயல்திறன்

ஒரு முன்னோட்ட வெளியீடாக இருந்தாலும், Granite 4.0 Tiny ஏற்கனவே IBM இன் Granite வரிசையில் உள்ள முந்தைய மாதிரிகளை விட குறிப்பிடத்தக்க செயல்திறன் மேம்பாடுகளை நிரூபிக்கிறது. தரநிலை மதிப்பீடுகளில், Base-Preview வெளிப்படுத்துகிறது:

  • DROP இல் 5.6-புள்ளி அதிகரிப்பு (பத்திகளின் மீது தனித்துவமான பகுத்தறிவு), பல-ஹாப் கேள்வி பதிலளிப்பதற்கான பரவலாக அங்கீகரிக்கப்பட்ட தரநிலை இது பதில்களைப் பெற உரையின் பல பிரிவுகளில் பகுத்தறிவு செய்யும் மாதிரியின் திறனை மதிப்பிடுகிறது.
  • AGIEval இல் 3.8-புள்ளி முன்னேற்றம், பொதுவான மொழி புரிதல் மற்றும் பகுத்தறிவு திறன்களை மதிப்பிடுவதற்கு வடிவமைக்கப்பட்ட ஒரு விரிவான தரநிலை, இது மொழியியல் மற்றும் அறிவாற்றல் பணிகளின் பரந்த வரம்பை உள்ளடக்கியது.

இந்த செயல்திறன் ஆதாயங்கள் மாதிரியின் மேம்பட்ட கட்டமைப்பு மற்றும் அதன் விரிவான முன் பயிற்சி முறை ஆகிய இரண்டிற்கும் காரணமாக இருக்கலாம். இந்த முன் பயிற்சி மூலம் 2.5 டிரில்லியன் டோக்கன்களை பல்வேறு களங்கள் மற்றும் மொழியியல் கட்டமைப்புகளிலிருந்து எடுத்துக்கொண்டதாக கூறப்படுகிறது. இந்த விரிவான முன் பயிற்சி தரவுகளுக்குள் பரந்த அளவிலான வடிவங்கள் மற்றும் உறவுகளைப் பிடிக்க மாதிரியை அனுமதிக்கிறது. இதன் விளைவாக பல்வேறு பணிகளில் மேம்பட்ட பொதுமைப்படுத்தல் மற்றும் செயல்திறன் கிடைக்கிறது.

அறிவுறுத்தல்-சரிசெய்யப்பட்ட மாறுபாடு: உரையாடல், தெளிவு மற்றும் பரந்த பல மொழி ஆதரவுக்காக வடிவமைக்கப்பட்டது

Granite-4.0-Tiny-Preview (Instruct) மாறுபாடு அடிப்படை மாதிரியை மேற்பார்வையிடப்பட்ட ஃபைன்-ட்யூனிங் (SFT) மற்றும் வலுவூட்டல் கற்றல் (RL) ஆகியவற்றின் கலவையின் மூலம் உருவாக்குகிறது. இது திறந்த மற்றும் செயற்கையாக உருவாக்கப்பட்ட உரையாடல்களை உள்ளடக்கிய Tülu-பாணி தரவுத்தொகுப்பைப் பயன்படுத்துகிறது. இந்த வடிவமைக்கப்பட்ட அணுகுமுறை அறிவுறுத்தல்-பின்பற்றுதல் மற்றும் ஊடாடும் பயன்பாடுகளுக்கு மாதிரியை மேம்படுத்துகிறது.

8,192 டோக்கன் உள்ளீட்டு சாளரங்கள் மற்றும் 8,192 டோக்கன் உருவாக்கும் நீளங்களை ஆதரிக்கும் இந்த மாதிரி நீட்டிக்கப்பட்ட தொடர்புகளில் ஒருமைப்பாடு மற்றும் துல்லியத்தை பராமரிக்கிறது. செயல்திறன் ஆதாயங்களுக்காக விளக்கத்தை தியாகம் செய்யும் என்கோடர்-டிகோடர் கலப்பினங்களைப் போலல்லாமல், இங்குள்ள டிகோடர்-மட்டும் அமைப்பு தெளிவான மற்றும் அதிக கண்காணிக்கக்கூடிய வெளியீடுகளை உருவாக்குகிறது. இது வெளிப்படைத்தன்மை மற்றும் கணிக்கக்கூடிய தன்மை மிக முக்கியமான நிறுவன மற்றும் பாதுகாப்பு-முக்கிய பயன்பாடுகளுக்கு மிகவும் மதிப்புமிக்கதாக ஆக்குகிறது.

விரிவான மதிப்பீட்டு அளவீடுகள்:

  • IFEval இல் 86.1, இது அறிவுறுத்தல்-பின்பற்றும் தரநிலைகளில் வலுவான செயல்திறனைக் குறிக்கிறது. இது சிக்கலான அறிவுறுத்தல்களை துல்லியமாகவும் திறமையாகவும் செயல்படுத்தும் மாதிரியின் திறனை பிரதிபலிக்கிறது.
  • GSM8K இல் 70.05, இது தரம்-பள்ளி கணித சிக்கல் தீர்க்கும் மையமாகக் கொண்ட ஒரு தரநிலை ஆகும். இது அளவு பகுத்தறிவு மற்றும் எண்கணித செயல்பாடுகளுக்கான மாதிரியின் திறனைக் காட்டுகிறது.
  • HumanEval இல் 82.41, பைதான் குறியீடு உருவாக்கும் துல்லியத்தை அளவிடுகிறது. இது தொடரியல் ரீதியாக சரியான மற்றும் சொற்பொருள் ரீதியாக அர்த்தமுள்ள குறியீடு துணுக்குகளை உருவாக்கும் மாதிரியின் திறனைக் காட்டுகிறது.

மேலும், இந்த அறிவுறுத்தல் மாதிரி 12 மொழிகளில் பல மொழி தொடர்புகளை ஆதரிக்கிறது. இது வாடிக்கையாளர் சேவை, நிறுவன ஆட்டோமேஷன் மற்றும் கல்வி கருவிகளில் உலகளாவிய பயன்பாடுகளை எளிதாக்குகிறது. இந்த பல மொழி திறன் மாதிரியின் வரம்பு மற்றும் பயன்பாட்டை விரிவுபடுத்துகிறது. இது பல்வேறு மொழியியல் சூழல்களில் உள்ள பல்வேறு பயனர்கள் மற்றும் பயன்பாட்டு நிகழ்வுகளுக்கு இடமளிக்க உதவுகிறது. ஆதரிக்கப்படும் மொழிகளில் ஆங்கிலம், ஸ்பானிஷ், பிரஞ்சு, ஜெர்மன், இத்தாலியன், போர்த்துகீசியம், டச்சு, ரஷ்யன், சீனம், ஜப்பானியம், கொரியன் மற்றும் அரபு ஆகியவை அடங்கும், இது உலகின் மக்கள்தொகையில் கணிசமான பகுதியை உள்ளடக்கியது.

திறந்த மூல கிடைக்கும் முக்கியத்துவம்

IBM இன் முடிவு Granite 4.0 Tiny மாதிரிகள் இரண்டையும் Apache 2.0 உரிமத்தின் கீழ் வெளியிட முடிவு செய்தது AI சமூகத்தில் வெளிப்படைத்தன்மை மற்றும் ஒத்துழைப்பை வளர்ப்பதற்கான ஒரு குறிப்பிடத்தக்க படியாகும். மாதிரி எடைகள், உள்ளமைவு கோப்புகள் மற்றும் மாதிரி பயன்பாட்டு ஸ்கிரிப்ட்களுக்கான திறந்த அணுகலை வழங்குவதன் மூலம், ஆராய்ச்சியாளர்கள், டெவலப்பர்கள் மற்றும் நிறுவனங்கள்தங்கள் சொந்த NLP பணிப்பாய்வுகளில் மாதிரிகளை சுதந்திரமாக பரிசோதிக்கவும், ஃபைன்-ட்யூன் செய்யவும் மற்றும் ஒருங்கிணைக்கவும் IBM அதிகாரம் அளிக்கிறது. இந்த திறந்த மூல அணுகுமுறை கண்டுபிடிப்புகளை விரைவுபடுத்துவது மட்டுமல்லாமல், மாதிரியின் திறன்கள் மற்றும் வரம்புகள் பற்றிய ஆழமான புரிதலையும் ஊக்குவிக்கிறது.

Apache 2.0 உரிமம் குறிப்பாக சாதகமானது, ஏனெனில் இது பயனர்கள் எந்த மாற்றங்களையும் அல்லது வழித்தோன்றல் படைப்புகளையும் வெளியிடத் தேவையில்லாமல், மென்பொருளின் வணிக மற்றும் வணிக அல்லாத பயன்பாட்டிற்கு அனுமதிக்கிறது. இந்த அனுமதியளிக்கும் உரிமம் பரவலான தத்தெடுப்பு மற்றும் பரிசோதனையை ஊக்குவிக்கிறது, Granite 4.0 Tiny மாதிரிகளைச் சுற்றி ஒரு துடிப்பான சுற்றுச்சூழல் அமைப்பை வளர்க்கிறது. மேலும், முன் பயிற்சி பெற்ற மாதிரிகளைப் பகிர்வதற்கும் கண்டுபிடிப்பதற்கும் பிரபலமான தளமான Hugging Face இல் மாதிரிகள் கிடைப்பது அவை பரந்த பார்வையாளர்களுக்கு எளிதில் அணுகக்கூடியதாக இருப்பதை உறுதி செய்கிறது.

Granite 4.0 Tiny இன் திறந்த மூல கிடைப்பது பொறுப்பான AI மேம்பாட்டிற்கான IBM இன் பரந்த உறுதிப்பாட்டுடன் ஒத்துப்போகிறது. மாதிரிகளை வெளிப்படையானதாகவும் தணிக்கை செய்யக்கூடியதாகவும் மாற்றுவதன் மூலம், பயனர்கள் அவற்றின் நடத்தையை உன்னிப்பாக கவனிக்கவும், சாத்தியமான சார்புகளை அடையாளம் காணவும், அவை பாதுகாப்பான மற்றும் நெறிமுறை முறையில் பயன்படுத்தப்படுவதை உறுதி செய்யவும் IBM உதவுகிறது. AI அமைப்புகளில் நம்பிக்கையை உருவாக்குவதற்கும், பல்வேறு களங்களில் அவற்றின் பொறுப்பான பயன்பாட்டை ஊக்குவிப்பதற்கும் இந்த வெளிப்படைத்தன்மைக்கான உறுதிப்பாடு முக்கியமானது.

Granite 4.0க்கான அடித்தளத்தை அமைத்தல்: எதிர்காலத்திற்கான ஒரு பார்வை

Granite 4.0 Tiny முன்னோட்டம், அதன் அடுத்த தலைமுறை மொழி மாதிரி தொகுதிக்கான IBM இன் விரிவான மூலோபாயத்தின் ஆரம்ப அறிகுறியை வழங்குகிறது. திறமையான MoE கட்டமைப்புகள், வலுவான நீண்ட சூழல் ஆதரவு மற்றும் அறிவுறுத்தல் சார்ந்த ட்யூனிங் ஆகியவற்றை ஒருங்கிணைப்பதன் மூலம், Granite 4.0 மாதிரி குடும்பம் ஒரு நிர்வகிக்கக்கூடிய மற்றும் வளம்-உகந்த தொகுப்பில் அதிநவீன திறன்களை வழங்க முற்படுகிறது. சக்திவாய்ந்ததாக மட்டுமல்லாமல் நடைமுறை மற்றும் அணுகக்கூடிய AI தீர்வுகளை உருவாக்க IBM உறுதிபூண்டுள்ளது என்பதை இந்த அணுகுமுறை அடிக்கோடிட்டுக் காட்டுகிறது.

இந்த மூன்று முக்கிய கூறுகளின் கலவை - திறமையான கட்டமைப்பு, நீண்ட சூழல் ஆதரவு மற்றும் அறிவுறுத்தல் சார்ந்த ட்யூனிங் - Granite 4.0 ஐ பரந்த அளவிலான பயன்பாடுகளுக்கு ஏற்ற பல்துறை மற்றும் மாற்றியமைக்கக்கூடிய மொழி மாதிரியாக நிலைநிறுத்துகிறது. திறமையான MoE கட்டமைப்பு அதிகரிக்கும் தரவு மற்றும் சிக்கலுடன் மாதிரியை திறம்பட அளவிட அனுமதிக்கிறது, அதே நேரத்தில் நீண்ட சூழல் ஆதரவு நீண்ட ஆவணங்கள் மற்றும் உரையாடல்களை செயலாக்க மற்றும் புரிந்து கொள்ள அனுமதிக்கிறது. மறுபுறம், அறிவுறுத்தல் சார்ந்த ட்யூனிங், மாதிரி சிக்கலான அறிவுறுத்தல்களை துல்லியமாகவும் திறமையாகவும் செயல்படுத்த முடியும் என்பதை உறுதி செய்கிறது, இது கேள்வி பதிலளித்தல், உரை சுருக்கம் மற்றும் குறியீடு உருவாக்கம் போன்ற பணிகளுக்கு ஏற்றதாக அமைகிறது.

Granite 4.0 இன் அதிக மாறுபாடுகள் வெளிப்படுத்தப்படுவதால், IBM பொறுப்பான மற்றும் திறந்த AI இல் தனது முதலீட்டை மேலும் உறுதிப்படுத்தலாம், இது நிறுவன மற்றும் ஆராய்ச்சி பயன்பாடுகளுக்கான வெளிப்படையான மற்றும் உயர் செயல்திறன் மொழி மாதிரிகளின் பாதையை வடிவமைப்பதில் ஒரு முக்கிய சக்தியாக தன்னை நிலைநிறுத்துகிறது. இந்த தொடர்ச்சியான முதலீடு, AI நெறிமுறை மற்றும் சமூகத்திற்கு நன்மை பயக்கும் வகையில் உருவாக்கப்பட்டு பயன்படுத்தப்பட வேண்டும் என்ற IBM இன் நம்பிக்கையை பிரதிபலிக்கிறது. வெளிப்படைத்தன்மை, பொறுப்புக்கூறல் மற்றும் நேர்மைக்கு முன்னுரிமை அளிப்பதன் மூலம், சக்திவாய்ந்ததாக மட்டுமல்லாமல் நம்பகமானதாகவும் மனித விழுமியங்களுடன் ஒத்துப்போகும் AI அமைப்புகளை உருவாக்க IBM இலக்கு கொண்டுள்ளது.

Granite 4.0 தொடர் மொழி மாதிரிகளின் பரிணாம வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க படியாகும். இது செயல்திறன், திறன் மற்றும் வெளிப்படைத்தன்மையின் கட்டாய கலவையை வழங்குகிறது. இந்த துறையில் IBM தொடர்ந்து புதுமைகளை உருவாக்கி வருவதால், AI உடன் நாம் தொடர்பு கொள்ளும் மற்றும் பயன்படுத்தும் விதத்தை மேலும் மாற்றும் இன்னும் அற்புதமான வளர்ச்சிகளை எதிர்பார்க்கலாம். Granite 4.0 Tiny முன்னோட்டம் ஒரு ஆரம்பம் மட்டுமே, மேலும் மொழி மாதிரிகளின் எதிர்காலம் முன்பை விட பிரகாசமாக இருக்கிறது. குறிப்பாக, நீண்ட சூழல் திறன்களுக்கு முக்கியத்துவம் அளிப்பது அறிவியல் ஆராய்ச்சி, சட்ட பகுப்பாய்வு மற்றும் வரலாற்று ஆவண பகுப்பாய்வு போன்ற களங்களில் AI பயன்பாடுகளுக்கு புதிய சாத்தியங்களைத் திறக்கிறது. அங்கு நீண்ட மற்றும் சிக்கலான உரைகளை செயலாக்க மற்றும் புரிந்து கொள்ளும் திறன் மிக முக்கியமானது.

மேலும், Granite 4.0 மாதிரிகளின் பல மொழி திறன்கள் வாடிக்கையாளர் சேவை முதல் கல்வி வரை பல்வேறு தொழில்களில் உலகளாவிய பயன்பாடுகளுக்கு ஏற்றதாக அமைகின்றன. பரந்த அளவிலான மொழிகளை ஆதரிப்பதன் மூலம், IBM தனது AI தீர்வுகள் பூர்வீக மொழி எதுவாக இருந்தாலும், பல்வேறு பார்வையாளர்களுக்கு அணுகக்கூடியதாக இருப்பதை உறுதி செய்கிறது. AI ஐ பரவலாக ஏற்றுக்கொள்வதற்கும் அதன் நன்மைகள் அனைவராலும் பகிர்ந்து கொள்ளப்படுவதை உறுதி செய்வதற்கும் இந்த உள்ளடக்கிய தன்மைக்கான அர்ப்பணிப்பு அவசியம்.

அதன் தொழில்நுட்ப திறன்களுக்கு கூடுதலாக, Granite 4.0 தொடர் பொறுப்பான AI மேம்பாட்டிற்கான IBM இன் அர்ப்பணிப்பையும் பிரதிபலிக்கிறது. வெளிப்படைத்தன்மை, பொறுப்புக்கூறல் மற்றும் நேர்மைக்கு முன்னுரிமை அளிப்பதன் மூலம், IBM சக்திவாய்ந்ததாக மட்டுமல்லாமல் நம்பகமானதாகவும் மனித விழுமியங்களுடன் ஒத்துப்போகும் AI அமைப்புகளை உருவாக்குகிறது. AI இல் பொதுமக்களின் நம்பிக்கையை உருவாக்குவதற்கும் இது சமூகத்தின் நலனுக்காகப் பயன்படுத்தப்படுவதை உறுதி செய்வதற்கும் பொறுப்பான AI க்கான இந்த அர்ப்பணிப்பு முக்கியமானது.