செயற்கை நுண்ணறிவு (AI) உலகில், பெரிய மாடல்களை உருவாக்குவதற்கான போட்டியே அதிகமாக உள்ளது. பல நிறுவனங்கள் அதிக கணினி சக்தியைப் பயன்படுத்தும் மாடல்களை உருவாக்குகின்றன. ஆனால், பல வணிகங்கள் தங்கள் குறிப்பிட்ட தேவைகளுக்கும், வளக் கட்டுப்பாடுகளுக்கும் ஏற்ற நடைமுறை தீர்வுகளைத் தேடுகின்றன.
IBM இந்த வளர்ந்து வரும் தேவையை பூர்த்தி செய்யும் வகையில் தன்னை நிலைநிறுத்திக் கொண்டுள்ளது. உலகளாவிய தொழில்நுட்பம் மற்றும் ஆலோசனை நிறுவனமான இது, நடைமுறை, உண்மையான உலக வணிக பயன்பாடுகளுக்கு ஏற்றவாறு சிறிய மற்றும் திறமையான அமைப்புகளை வலியுறுத்தி, அதன் Granite பெரிய மொழி மாதிரி (LLM) குடும்பத்தின் அடுத்த பதிப்பை சமீபத்தில் அறிமுகப்படுத்தியுள்ளது.
Granite தொடரைச் செம்மைப்படுத்துதல்: கவனம் செலுத்தப்பட்ட திறன், குறைக்கப்பட்ட தடம்
IBM’ன் Granite 3.2 மாடல்கள், சிறிய மாடல்களை உருவாக்கும் நிறுவனத்தின் உத்தியின் தொடர்ச்சியைக் குறிக்கின்றன. இந்த மாடல்கள் கணினி வளங்களில் அதிகப்படியான கோரிக்கைகளை விதிக்காமல் குறிப்பிட்ட திறன்களை வழங்க வடிவமைக்கப்பட்டுள்ளன. இது சக்திவாய்ந்த மற்றும் செலவு குறைந்த AI தீர்வுகள் தேவைப்படும் பல வணிகங்களின் நடைமுறைத் தேவைகளுடன் ஒத்துப்போகிறது.
இந்த மாதிரிகள் Hugging Face இல் Apache 2.0 உரிமத்தின் கீழ் வெளிப்படையாக கிடைக்கின்றன. தேர்ந்தெடுக்கப்பட்ட பதிப்புகள் IBM’ன் சொந்த watsonx.ai தளம், Ollama, Replicate மற்றும் LM Studio மூலமாகவும் அணுகலாம். இந்த பரந்த அணுகல்தன்மை, வரும் மாதங்களில் Red Hat Enterprise Linux AI 1.5 இல் இந்த மாடல்களை ஒருங்கிணைப்பதற்கான திட்டங்களால் மேலும் மேம்படுத்தப்பட்டுள்ளது, இது திறந்த மூல AI க்கான IBM’ன் உறுதிப்பாட்டை பலப்படுத்துகிறது.
ஆவண செயலாக்கத்தை புரட்சிகரமாக்குதல்: Granite விஷன் மாதிரி
இந்த வெளியீட்டின் ஒரு தனித்துவமான அம்சம், ஆவண புரிதல் பணிகளுக்காக சிறப்பாக வடிவமைக்கப்பட்ட ஒரு புதிய விஷன் மொழி மாதிரி. ஆவணங்களிலிருந்து வணிகங்கள் எவ்வாறு தொடர்பு கொள்ளலாம் மற்றும் தகவல்களைப் பெறலாம் என்பதில் இது ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது. IBM’ன் உள் பெஞ்ச்மார்க் சோதனைகளின்படி, இந்த புதிய மாதிரி, எண்டர்பிரைஸ்-லெவல் பணிச்சுமைகளை பிரதிபலிக்கும் வகையில் வடிவமைக்கப்பட்ட சோதனைகளில், மிகப் பெரிய போட்டியாளர் மாடல்களுக்கு இணையாக அல்லது அதைவிட சிறப்பாக செயல்படுகிறது.
இந்த திறனின் வளர்ச்சியில் IBM’ன் திறந்த மூல Docling கருவித்தொகுப்பைப் பயன்படுத்துவது அடங்கும். இந்த கருவித்தொகுப்பு 85 மில்லியன் PDF ஆவணங்களை செயலாக்க பயன்படுத்தப்பட்டது, இது 26 மில்லியன் செயற்கை கேள்வி-பதில் ஜோடிகளை உருவாக்கியது. இந்த விரிவான தயாரிப்பு, நிதி, சுகாதாரம் மற்றும் சட்ட சேவைகள் உள்ளிட்ட பல நிறுவன சூழல்களின் சிறப்பியல்பு கொண்ட ஆவண-தீவிர பணிப்பாய்வுகளை கையாள மாதிரி நன்கு பொருத்தப்பட்டிருப்பதை உறுதி செய்கிறது.
முக்கிய புள்ளிவிவரங்கள் அளவு மற்றும் செயல்திறனை முன்னிலைப்படுத்துகின்றன:
- 85 மில்லியன்: புதிய விஷன் மாதிரியைப் பயிற்றுவிக்க IBM’ன் Docling கருவித்தொகுப்பைப் பயன்படுத்தி செயலாக்கப்பட்ட PDF ஆவணங்களின் எண்ணிக்கை. இந்த மிகப்பெரிய தரவுத்தொகுப்பு, உண்மையான உலக ஆவண செயலாக்க சவால்களுக்கு மாதிரியின் தயார்நிலையை அடிக்கோடிட்டுக் காட்டுகிறது.
- 30%: செயல்திறன் அளவைப் பராமரிக்கும் அதே வேளையில், Granite கார்டியன் பாதுகாப்பு மாடல்களில் அடையப்பட்ட அளவு குறைப்பு. இது பாதுகாப்பை தியாகம் செய்யாமல் செயல்திறனை மேம்படுத்துவதற்கான IBM’ன் உறுதிப்பாட்டை நிரூபிக்கிறது.
- 2 ஆண்டுகள்: 10 மில்லியனுக்கும் குறைவான அளவுருக்கள் இருந்தபோதிலும், IBM’ன் TinyTimeMixers மாடல்களின் அதிகபட்ச முன்னறிவிப்பு வரம்பு. நீண்ட கால முன்னறிவிப்புக்கான இந்த சிறப்பு மாடல்களின் குறிப்பிடத்தக்க திறனை இது காட்டுகிறது.
மேம்படுத்தப்பட்ட பகுத்தறிவு: சிந்தனையின் சங்கிலி மற்றும் அனுமான அளவிடுதல்
IBM, Granite 3.2 இன் 2B மற்றும் 8B அளவுரு பதிப்புகளில் “சிந்தனைச் சங்கிலி” பகுத்தறிவையும் இணைத்துள்ளது. இந்த அம்சம், மனித பகுத்தறிவு செயல்முறைகளைப் பிரதிபலிக்கும் வகையில், சிக்கல்களை ஒரு கட்டமைக்கப்பட்ட, முறையான முறையில் அணுகுவதற்கு மாடல்களை அனுமதிக்கிறது. இது தர்க்கரீதியான விலக்கு தேவைப்படும் சிக்கலான பணிகளைச் சமாளிக்கும் மாடல்களின் திறனை மேம்படுத்துகிறது.
முக்கியமாக, பயனர்கள் பணியின் சிக்கலைப் பொறுத்து இந்த திறனை செயல்படுத்த அல்லது செயலிழக்க நெகிழ்வுத்தன்மையைக் கொண்டுள்ளனர். இந்த தகவமைப்பு ஒரு முக்கிய வேறுபாடு ஆகும், இது நிறுவனங்கள் தங்கள் குறிப்பிட்ட தேவைகளின் அடிப்படையில் வள பயன்பாட்டை மேம்படுத்த அனுமதிக்கிறது. எளிமையான பணிகளுக்கு, கணினி சக்தியைப் பாதுகாக்க சிந்தனைச் சங்கிலி பகுத்தறிவை முடக்கலாம், அதே நேரத்தில் மிகவும் சிக்கலான சிக்கல்களுக்கு, மாதிரியின் முழு பகுத்தறிவு திறனைப் பயன்படுத்த அதை இயக்கலாம்.
இந்த மேம்பாடுகள், அறிவுறுத்தல்-பின்பற்றல் பெஞ்ச்மார்க்குகளில் 8B மாதிரியின் செயல்திறனில் குறிப்பிடத்தக்க முன்னேற்றங்களுக்கு வழிவகுத்தன, முந்தைய பதிப்புகளை விட அதிகமாக உள்ளது. புதுமையான “அனுமான அளவிடுதல்” முறைகள் மூலம், இந்த ஒப்பீட்டளவில் சிறிய மாதிரி கூட கணித பகுத்தறிவு பெஞ்ச்மார்க்குகளில் மிகப் பெரிய அமைப்புகளுடன் திறம்பட போட்டியிட முடியும் என்பதை IBM நிரூபித்துள்ளது. இது குறிப்பிட்ட களங்களில் ஈர்க்கக்கூடிய செயல்திறனை வழங்க சிறிய, உகந்த மாடல்களின் திறனை எடுத்துக்காட்டுகிறது.
பாதுகாப்பு மற்றும் நுணுக்கம்: Granite கார்டியன் புதுப்பிப்புகள்
AI-உருவாக்கிய உள்ளடக்கத்துடன் தொடர்புடைய சாத்தியமான அபாயங்களைக் கண்காணிக்கவும் குறைக்கவும் வடிவமைக்கப்பட்ட Granite கார்டியன் பாதுகாப்பு மாடல்களும் குறிப்பிடத்தக்க புதுப்பிப்புகளைப் பெற்றுள்ளன. இந்த மாடல்கள் அவற்றின் செயல்திறன் அளவைப் பராமரிக்கும் அதே வேளையில் 30% அளவு குறைக்கப்பட்டுள்ளன. இந்த மேம்படுத்தல் அதிக செயல்திறன் மற்றும் குறைக்கப்பட்ட வள நுகர்வுக்கு பங்களிக்கிறது.
மேலும், இந்த மாடல்களில் இப்போது “வாய்மொழி நம்பிக்கை” எனப்படும் ஒரு அம்சம் உள்ளது. இந்த அம்சம் பாதுகாப்பு கண்காணிப்பில் நிச்சயமற்ற தன்மையின் அளவை ஒப்புக்கொள்வதன் மூலம் மிகவும் நுணுக்கமான ஆபத்து மதிப்பீட்டை வழங்குகிறது. பாதுகாப்பான/பாதுகாப்பற்ற வகைப்பாட்டை வழங்குவதற்குப் பதிலாக, மாடல்கள் அவற்றின் மதிப்பீடுகளில் மாறுபட்ட அளவிலான நம்பிக்கையை வெளிப்படுத்தலாம், பயனர்களுக்கு மிகவும் தகவலறிந்த மற்றும் வெளிப்படையான மதிப்பீட்டை வழங்குகிறது.
TinyTimeMixers: மூலோபாய திட்டமிடலுக்கான நீண்ட தூர முன்னறிவிப்பு
Granite புதுப்பிப்புகளுக்கு கூடுதலாக, IBM தனது TinyTimeMixers மாடல்களின் அடுத்த தலைமுறையையும் வெளியிட்டுள்ளது. இந்த மாடல்கள் குறிப்பிடத்தக்க வகையில் சிறியவை, 10 மில்லியனுக்கும் குறைவான அளவுருக்களைக் கொண்டுள்ளன - இது தொழில்துறையில் உள்ள பல மாடல்களின் அளவின் ஒரு பகுதியாகும். அவற்றின் சிறிய அளவு இருந்தபோதிலும், இந்த சிறப்பு மாடல்கள் இரண்டு ஆண்டுகள் வரை நேரத் தொடர் தரவை முன்னறிவிக்கும் திறன் கொண்டவை.
இந்த திறன் வணிக பயன்பாடுகளின் வரம்பிற்கு குறிப்பாக மதிப்புமிக்கது, அவற்றுள்:
- நிதி போக்கு பகுப்பாய்வு: சந்தை நகர்வுகளை கணித்தல் மற்றும் முதலீட்டு வாய்ப்புகளை அடையாளம் காணுதல்.
- விநியோக சங்கிலி திட்டமிடல்: சரக்கு நிலைகளை மேம்படுத்துதல் மற்றும் தேவை ஏற்ற இறக்கங்களை எதிர்பார்ப்பது.
- சில்லறை சரக்கு மேலாண்மை: கழிவுகளை குறைக்கும் அதே வேளையில் வாடிக்கையாளர் தேவையை பூர்த்தி செய்ய போதுமான பங்கு அளவை உறுதி செய்தல்.
இந்த பயன்பாடுகள் அனைத்தும் நீண்ட கால கணிப்புகளின் அடிப்படையில் தகவலறிந்த முடிவுகளை எடுக்கும் திறனை நம்பியுள்ளன, இது TinyTimeMixers மாடல்களை மூலோபாய வணிக திட்டமிடலுக்கான ஒரு சக்திவாய்ந்த கருவியாக மாற்றுகிறது.
உண்மையான உலக வணிக தடைகளை நிவர்த்தி செய்தல்
Granite மாடல்களுக்குள் பகுத்தறிவு திறன்களை மாற்றுவதற்கான திறன் AI செயலாக்கத்தில் ஒரு நடைமுறை சவாலை நேரடியாக நிவர்த்தி செய்கிறது. படிப்படியான பகுத்தறிவு அணுகுமுறைகள், சக்திவாய்ந்ததாக இருந்தாலும், கணிசமான கணினி சக்தி தேவைப்படுகிறது, அது எப்போதும் அவசியமில்லை. இந்த அம்சத்தை விருப்பமானதாக மாற்றுவதன் மூலம், IBM நிறுவனங்கள் எளிமையான பணிகளுக்கான கணினி செலவுகளைக் குறைக்க உதவுகிறது, அதே நேரத்தில் மிகவும் சிக்கலான சிக்கல்களுக்கு மேம்பட்ட பகுத்தறிவின் விருப்பத்தை தக்க வைத்துக் கொள்கிறது.
இந்த அணுகுமுறை உண்மையான உலக வணிக தடைகளைப் பற்றிய ஆழமான புரிதலை பிரதிபலிக்கிறது, அங்கு செயல்திறன் மற்றும் செலவு-செயல்திறன் ஆகியவை பெரும்பாலும் மூல செயல்திறனைப் போலவே முக்கியம். குறிப்பிட்ட வணிகத் தேவைகளுக்கு ஏற்ப வடிவமைக்கக்கூடிய நடைமுறை தீர்வுகளை வழங்குவதில் IBM’ன் கவனம், பெருகிய முறையில் நெரிசலான AI சந்தையில் ஒரு முக்கிய வேறுபாடு ஆகும்.
இழுவைப் பெறுதல்: நடைமுறை தாக்கத்தின் சான்று
சிறிய, சிறப்பு மாடல்களை உருவாக்கும் IBM’ன் உத்தி சந்தையுடன் ஒத்ததாகத் தெரிகிறது. முந்தைய Granite 3.1 8B மாதிரி சமீபத்தில் வாடிக்கையாளர் உறவு மேலாண்மைக்கான (CRM) Salesforce LLM பெஞ்ச்மார்க்கில் வலுவான செயல்திறனை அடைந்தது. இந்த பெஞ்ச்மார்க் குறிப்பாக CRM க்கு தொடர்புடைய பணிகளில் LLM களின் செயல்திறனை மதிப்பிடுவதற்காக வடிவமைக்கப்பட்டுள்ளது, அதாவது வாடிக்கையாளர் தொடர்பு பகுப்பாய்வு மற்றும் தனிப்பயனாக்கப்பட்ட உள்ளடக்க உருவாக்கம்.
இந்த பெஞ்ச்மார்க்கில் Granite 3.1 8B மாதிரியின் வலுவான செயல்திறன், சிறிய, சிறப்பு மாடல்கள் குறிப்பிட்ட வணிகத் தேவைகளை திறம்பட பூர்த்தி செய்ய முடியும் என்று கூறுகிறது. IBM’ன் அணுகுமுறை கோட்பாட்டளவில் சரியானது மட்டுமல்ல, நடைமுறையில் சாத்தியமானது என்பதற்கும் இது மேலும் ஆதாரங்களை வழங்குகிறது.
செயல்திறன், ஒருங்கிணைப்பு மற்றும் உண்மையான உலக தாக்கம் ஆகியவற்றில் கவனம்
IBM AI ஆராய்ச்சியின் துணைத் தலைவர் ஸ்ரீராம் ராகவன், நிறுவனத்தின் தத்துவத்தை சுருக்கமாகக் கூறுகிறார்: “AI இன் அடுத்த சகாப்தம் செயல்திறன், ஒருங்கிணைப்பு மற்றும் உண்மையான உலக தாக்கம் பற்றியது - அங்கு நிறுவனங்கள் கணினியில் அதிக செலவு செய்யாமல் சக்திவாய்ந்த முடிவுகளை அடைய முடியும். IBM’ன் சமீபத்திய Granite வளர்ச்சிகள் திறந்த தீர்வுகளில் கவனம் செலுத்துகின்றன, இது AI ஐ நவீன நிறுவனங்களுக்கு மிகவும் அணுகக்கூடியதாகவும், செலவு குறைந்ததாகவும், மதிப்புமிக்கதாகவும் மாற்றுவதற்கான மற்றொரு படியை நிரூபிக்கிறது.”
இந்த அறிக்கை, தொழில்நுட்ப ரீதியாக முன்னேறியது மட்டுமல்லாமல், நடைமுறை, அணுகக்கூடிய மற்றும் வணிகங்களின் உண்மையான உலகத் தேவைகளுடன் ஒத்துப்போகும் AI தீர்வுகளை உருவாக்குவதற்கான IBM’ன் உறுதிப்பாட்டை உள்ளடக்கியது. திறந்த தீர்வுகளில் கவனம் செலுத்துவது AI சமூகத்திற்குள் ஒத்துழைப்பு மற்றும் கண்டுபிடிப்புகளை வளர்ப்பதற்கான IBM’ன் அர்ப்பணிப்பை மேலும் அடிக்கோடிட்டுக் காட்டுகிறது. கவனம் வெறுமனே மிகப்பெரிய மாடல்களை உருவாக்குவதில் இருந்து, உறுதியானமதிப்பை வழங்கும் மற்றும் வணிகங்கள் தங்கள் மூலோபாய நோக்கங்களை அடைய அதிகாரம் அளிக்கும் AI கருவிகளை உருவாக்குவதற்கு மாறுகிறது.
Granite தொடரைச் செம்மைப்படுத்துதல்
IBM’ன் Granite 3.2 மாதிரிகள், சிறிய, திறமையான AI மாடல்களை உருவாக்கும் உத்தியைத் தொடர்கின்றன. இந்த மாடல்கள், அதிக கணினி வளங்களைப் பயன்படுத்தாமல், குறிப்பிட்ட திறன்களை வழங்குவதற்காக வடிவமைக்கப்பட்டுள்ளன. இது, சக்திவாய்ந்த மற்றும் சிக்கனமான AI தீர்வுகள் தேவைப்படும் வணிகங்களின் நடைமுறைத் தேவைகளுக்கு ஏற்றதாக அமைகிறது.
இந்த மாடல்கள், Hugging Face-ல் Apache 2.0 உரிமத்தின் கீழ் கிடைக்கின்றன. மேலும், IBM’ன் watsonx.ai, Ollama, Replicate, மற்றும் LM Studio மூலமாகவும் இவற்றை அணுகலாம். இந்த பரந்த அணுகல், Red Hat Enterprise Linux AI 1.5-ல் இந்த மாடல்களை ஒருங்கிணைக்கும் திட்டங்களால் மேலும் வலுப்பெறுகிறது. இது, திறந்த மூல AI-க்கான IBM-ன் உறுதிப்பாட்டை நிலைநிறுத்துகிறது.
ஆவண செயலாக்கத்தில் புரட்சி: Granite விஷன் மாதிரி
இந்த வெளியீட்டின் சிறப்பம்சமாக, ஆவணங்களைப் புரிந்துகொள்ளும் பணிகளுக்காக வடிவமைக்கப்பட்ட ஒரு புதிய விஷன் மொழி மாதிரி உள்ளது. வணிகங்கள் ஆவணங்களுடன் எவ்வாறு தொடர்பு கொள்கின்றன மற்றும் தகவல்களைப் பெறுகின்றன என்பதில் இது ஒரு குறிப்பிடத்தக்க முன்னேற்றமாகும். IBM-ன் உள் பெஞ்ச்மார்க் சோதனைகளின்படி, இந்த புதிய மாதிரி, நிறுவன அளவிலான பணிச்சுமைகளைப் பிரதிபலிக்கும் சோதனைகளில், பெரிய போட்டியாளர் மாடல்களுக்கு இணையாகவோ அல்லது அதைவிட சிறப்பாகவோ செயல்படுகிறது.
இந்தத் திறனை உருவாக்க, IBM-ன் திறந்த மூல Docling கருவித்தொகுப்பு பயன்படுத்தப்பட்டது. இந்தக் கருவித்தொகுப்பு, 85 மில்லியன் PDF ஆவணங்களைச் செயல்படுத்தி, 26 மில்லியன் செயற்கைக் கேள்வி-பதில் ஜோடிகளை உருவாக்கியது. இந்தத் தயாரிப்பு, நிதி, சுகாதாரம், சட்டம் போன்ற துறைகளில் உள்ள ஆவணச் சார்ந்த பணிப்பாய்வுகளைக் கையாள இந்த மாதிரியைத் தயார்படுத்துகிறது.
முக்கிய புள்ளிவிவரங்கள்:
- 85 மில்லியன்: புதிய விஷன் மாதிரியைப் பயிற்றுவிக்க, IBM-ன் Docling கருவித்தொகுப்பைப் பயன்படுத்திச் செயலாக்கப்பட்ட PDF ஆவணங்களின் எண்ணிக்கை. இது, உண்மையான உலக ஆவணச் செயலாக்க சவால்களுக்கு மாதிரி தயாராக இருப்பதைக் காட்டுகிறது.
- 30%: Granite கார்டியன் பாதுகாப்பு மாடல்களில், செயல்திறனைப் பாதிக்காமல் செய்யப்பட்ட அளவு குறைப்பு. இது, பாதுகாப்பை சமரசம் செய்யாமல் செயல்திறனை மேம்படுத்துவதற்கான IBM-ன் உறுதிப்பாட்டைக் காட்டுகிறது.
- 2 ஆண்டுகள்: 10 மில்லியனுக்கும் குறைவான அளவுருக்கள் கொண்ட IBM-ன் TinyTimeMixers மாடல்களின் அதிகபட்ச முன்னறிவிப்பு வரம்பு. இது, நீண்ட கால முன்னறிவிப்புக்கான இந்தச் சிறப்பு மாடல்களின் திறனைக் காட்டுகிறது.
மேம்படுத்தப்பட்ட பகுத்தறிவு: சிந்தனைச் சங்கிலி
IBM, Granite 3.2-ன் 2B மற்றும் 8B அளவுரு பதிப்புகளில் “சிந்தனைச் சங்கிலி” (chain of thought) பகுத்தறிவையும் இணைத்துள்ளது. இது, சிக்கல்களை ஒரு படிநிலையான முறையில் அணுக உதவுகிறது. இது, மனித பகுத்தறிவு செயல்முறைகளைப் போன்றது. இது, தர்க்கரீதியான முடிவுகள் தேவைப்படும் சிக்கலான பணிகளைச் சமாளிக்கும் மாதிரியின் திறனை மேம்படுத்துகிறது.
பயனர்கள், பணியின் சிக்கலைப் பொறுத்து, இந்தத் திறனை இயக்கவோ அல்லது முடக்கவோ முடியும். இந்தத் தகவமைப்பு, நிறுவனங்கள் தங்கள் தேவைகளுக்கு ஏற்ப வளங்களைப் பயன்படுத்த உதவுகிறது. எளிய பணிகளுக்கு, கணினி சக்தியைச் சேமிக்க, சிந்தனைச் சங்கிலி பகுத்தறிவை முடக்கலாம். சிக்கலான பணிகளுக்கு, மாதிரியின் முழு பகுத்தறிவு திறனைப் பயன்படுத்த அதை இயக்கலாம்.
இந்த மேம்பாடுகள், அறிவுறுத்தல்-பின்பற்றல் பெஞ்ச்மார்க்குகளில் 8B மாதிரியின் செயல்திறனை அதிகரித்துள்ளன. “அனுமான அளவிடுதல்” (inference scaling) முறைகள் மூலம், இந்த சிறிய மாதிரி கூட, கணித பகுத்தறிவு பெஞ்ச்மார்க்குகளில் பெரிய மாடல்களுடன் போட்டியிட முடியும் என்பதை IBM நிரூபித்துள்ளது. இது, குறிப்பிட்ட துறைகளில் മികച്ച செயல்திறனை வழங்க, சிறிய, உகந்த மாடல்களின் திறனை எடுத்துக்காட்டுகிறது.
பாதுகாப்பு மற்றும் நுணுக்கம்: Granite கார்டியன்
AI உருவாக்கிய உள்ளடக்கத்துடன் தொடர்புடைய அபாயங்களைக் கண்காணிக்கவும் குறைக்கவும் வடிவமைக்கப்பட்ட Granite கார்டியன் பாதுகாப்பு மாடல்களும் புதுப்பிக்கப்பட்டுள்ளன. இந்த மாடல்கள், செயல்திறனைப் பாதிக்காமல், 30% அளவு குறைக்கப்பட்டுள்ளன. இது, செயல்திறனை அதிகரிக்கவும், வள பயன்பாட்டைக் குறைக்கவும் உதவுகிறது.
மேலும், இந்த மாடல்களில் “வாய்மொழி நம்பிக்கை” (verbalized confidence) என்ற அம்சம் உள்ளது. இது, பாதுகாப்பு கண்காணிப்பில் உள்ள நிச்சயமற்ற தன்மையை அங்கீகரிப்பதன் மூலம், ஒரு நுணுக்கமான ஆபத்து மதிப்பீட்டை வழங்குகிறது. பாதுகாப்பான/பாதுகாப்பற்ற என்ற வகைப்பாட்டிற்குப் பதிலாக, மாடல்கள் தங்கள் மதிப்பீடுகளில் நம்பிக்கையின் அளவை வெளிப்படுத்தலாம். இது, பயனர்களுக்கு அதிக தகவல்களை வழங்கும் வெளிப்படையான மதிப்பீட்டை அளிக்கிறது.
TinyTimeMixers: நீண்ட கால முன்னறிவிப்பு
Granite புதுப்பிப்புகளுடன், IBM தனது TinyTimeMixers மாடல்களின் அடுத்த தலைமுறையையும் வெளியிட்டுள்ளது. இந்த மாடல்கள் மிகவும் சிறியவை, 10 மில்லியனுக்கும் குறைவான அளவுருக்களைக் கொண்டவை. இருப்பினும், இவை இரண்டு ஆண்டுகள் வரையிலான காலத் தொடர் தரவை முன்னறிவிக்கும் திறன் கொண்டவை.
இந்தத் திறன், பின்வரும் வணிக பயன்பாடுகளுக்கு மதிப்புமிக்கது:
- நிதி போக்கு பகுப்பாய்வு: சந்தை நகர்வுகளைக் கணித்தல், முதலீட்டு வாய்ப்புகளைக் கண்டறிதல்.
- விநியோக சங்கிலி திட்டமிடல்: சரக்கு நிலைகளை மேம்படுத்துதல், தேவை ஏற்ற இறக்கங்களை கணித்தல்.
- சில்லறை சரக்கு மேலாண்மை: கழிவுகளைக் குறைத்து, வாடிக்கையாளர் தேவையைப் பூர்த்தி செய்யப் போதுமான சரக்குகளை வைத்திருத்தல்.
இந்த பயன்பாடுகள் அனைத்தும், நீண்ட கால கணிப்புகளின் அடிப்படையில் முடிவுகளை எடுக்கும் திறனை நம்பியுள்ளன. இது, TinyTimeMixers மாடல்களை, மூலோபாய வணிக திட்டமிடலுக்கான ஒரு சக்திவாய்ந்த கருவியாக மாற்றுகிறது.
உண்மையான உலக வணிக தடைகளை நிவர்த்தி செய்தல்
Granite மாடல்களில் பகுத்தறிவு திறன்களை மாற்றுவதற்கான திறன், AI செயலாக்கத்தில் உள்ள ஒரு நடைமுறை சவாலை நேரடியாக நிவர்த்தி செய்கிறது. படிப்படியான பகுத்தறிவு அணுகுமுறைகளுக்கு அதிக கணினி சக்தி தேவைப்படுகிறது. இது எப்போதும் அவசியமில்லை. இந்த அம்சத்தை விருப்பமானதாக மாற்றுவதன் மூலம், IBM நிறுவனங்கள் எளிய பணிகளுக்கான கணினி செலவுகளைக் குறைக்க உதவுகிறது. அதே நேரத்தில், சிக்கலான பணிகளுக்கு மேம்பட்ட பகுத்தறிவைப் பயன்படுத்தும் விருப்பத்தையும் வழங்குகிறது.
இந்த அணுகுமுறை, உண்மையான உலக வணிக தடைகளைப் பற்றிய புரிதலை பிரதிபலிக்கிறது. செயல்திறன் மற்றும் செலவு-செயல்திறன் ஆகியவை, மூல செயல்திறனைப் போலவே முக்கியம். குறிப்பிட்ட வணிகத் தேவைகளுக்கு ஏற்ப வடிவமைக்கக்கூடிய நடைமுறை தீர்வுகளை வழங்குவதில் IBM கவனம் செலுத்துகிறது. இது, AI சந்தையில் ஒரு முக்கிய வேறுபாடு ஆகும்.
நடைமுறை தாக்கத்தின் சான்று
சிறிய, சிறப்பு மாடல்களை உருவாக்கும் IBM-ன் உத்தி, சந்தையில் வரவேற்பைப் பெற்றுள்ளது. முந்தைய Granite 3.1 8B மாதிரி, வாடிக்கையாளர் உறவு மேலாண்மைக்கான (CRM) Salesforce LLM பெஞ்ச்மார்க்கில் வலுவான செயல்திறனை அடைந்தது. இந்த பெஞ்ச்மார்க், CRM தொடர்பான பணிகளில் LLM-களின் செயல்திறனை மதிப்பிடுவதற்காக வடிவமைக்கப்பட்டுள்ளது.
இந்த பெஞ்ச்மார்க்கில் Granite 3.1 8B மாதிரியின் வலுவான செயல்திறன், சிறிய, சிறப்பு மாடல்கள் குறிப்பிட்ட வணிகத் தேவைகளைத் திறம்பட பூர்த்தி செய்ய முடியும் என்பதைக் காட்டுகிறது. IBM-ன் அணுகுமுறை கோட்பாட்டளவில் சரியானது மட்டுமல்ல, நடைமுறையில் சாத்தியமானது என்பதற்கும் இது சான்றாகும்.
செயல்திறன், ஒருங்கிணைப்பு, தாக்கம்
IBM AI ஆராய்ச்சியின் துணைத் தலைவர் ஸ்ரீராம் ராகவன், நிறுவனத்தின் தத்துவத்தைச் சுருக்கமாகக் கூறுகிறார்: “AI-ன் அடுத்த சகாப்தம் செயல்திறன், ஒருங்கிணைப்பு மற்றும் உண்மையான உலக தாக்கம் பற்றியது. நிறுவனங்கள் அதிக செலவு செய்யாமல் சக்திவாய்ந்த முடிவுகளை அடைய முடியும். IBM-ன் சமீபத்திய Granite வளர்ச்சிகள், AI-ஐ நவீன நிறுவனங்களுக்கு மிகவும் அணுகக்கூடியதாகவும், செலவு குறைந்ததாகவும், மதிப்புமிக்கதாகவும் மாற்றுவதற்கான ஒரு படியாகும்.”
இந்த அறிக்கை, தொழில்நுட்ப ரீதியாக முன்னேறியது மட்டுமல்லாமல், நடைமுறை, அணுகக்கூடிய மற்றும் வணிகங்களின் உண்மையான உலகத் தேவைகளுடன் ஒத்துப்போகும் AI தீர்வுகளை உருவாக்குவதற்கான IBM-ன் உறுதிப்பாட்டை சுருக்கமாக கூறுகிறது.