செயற்கை நுண்ணறிவு, குறிப்பாக மொழியைக் கையாளும் கிளை, சமீபத்திய ஆண்டுகளில் பெரிய மொழி மாதிரிகளின் (LLMs) அளவும் சக்தியும் ஆதிக்கம் செலுத்தியுள்ளன. பரந்த தரவுக் கடல்களில் பயிற்சி பெற்ற இந்த பிரம்மாண்டங்கள், குறிப்பிடத்தக்க திறன்களை வெளிப்படுத்தி, பொதுமக்களின் கற்பனையையும் முதலீட்டு டாலர்களையும் கவர்ந்தன. ஆயினும், பெரிய மாதிரிகளை அறிவிக்கும் தலைப்புச் செய்திகளுக்குக் கீழே, அமைதியான ஆனால் அதிக மாற்றத்தை ஏற்படுத்தக்கூடிய ஒரு புரட்சி உருவாகி வருகிறது: சிறிய மொழி மாதிரிகளின் (SLMs) எழுச்சி. இந்த மெலிதான, அதிக கவனம் செலுத்தும் AI அமைப்புகள் விரைவாக ஒரு குறிப்பிடத்தக்க இடத்தை செதுக்கி வருகின்றன, அவற்றின் பெரிய உறவினர்கள் திறமையாகவோ அல்லது பொருளாதார ரீதியாகவோ செயல்பட முடியாத சூழல்களுக்கு அதிநவீன AI திறன்களைக் கொண்டுவருவதாக உறுதியளிக்கின்றன.
SLMs மீதான வளர்ந்து வரும் ஆர்வம் வெறும் கல்வி சார்ந்தது அல்ல; இது உறுதியான சந்தை வேகத்திற்கு மொழிபெயர்க்கிறது. தொழில் ஆய்வாளர்கள் SLM துறைக்கு ஒரு வியத்தகு ஏற்றத்தை முன்னறிவிக்கின்றனர், 2025 இல் மதிப்பிடப்பட்ட சந்தை அளவு சுமார் $0.93 பில்லியனில் இருந்து 2032 க்குள் $5.45 பில்லியன் என்ற வியக்கத்தக்க அளவிற்கு விரிவடையும் என்று கணித்துள்ளனர். இந்த பாதை முன்னறிவிப்பு காலத்தில் தோராயமாக 28.7% கூட்டு வருடாந்திர வளர்ச்சி விகிதத்தை (CAGR) குறிக்கிறது. இத்தகைய வெடிக்கும் வளர்ச்சி ஒரு வெற்றிடத்தில் நடக்காது; இது சக்திவாய்ந்த தொழில்நுட்ப மற்றும் சந்தை சக்திகளின் சங்கமத்தால் உந்தப்படுகிறது.
இந்த இயக்கிகளில் முதன்மையானது Edge AI மற்றும் சாதன நுண்ணறிவு (on-device intelligence) க்கான இடைவிடாத தேவை. எண்ணற்ற துறைகளில் உள்ள வணிகங்கள், ஸ்மார்ட்போன்கள், சென்சார்கள், தொழில்துறை உபகரணங்கள் மற்றும் பிற உட்பொதிக்கப்பட்ட அமைப்புகளில் நேரடியாகச் செயல்படக்கூடிய AI தீர்வுகளை அதிகளவில் நாடுகின்றன, நிலையான கிளவுட் இணைப்புடன் தொடர்புடைய தாமதம், செலவு அல்லது தனியுரிமை கவலைகள் இல்லாமல். AI ஐ உள்நாட்டில் இயக்குவது, தன்னாட்சி வாகன அமைப்புகள் முதல் ஊடாடும் மொபைல் உதவியாளர்கள் மற்றும் ஸ்மார்ட் தொழிற்சாலை ஆட்டோமேஷன் வரையிலான பயன்பாடுகளுக்கு முக்கியமான நிகழ்நேரப் பதிலளிப்பை செயல்படுத்துகிறது. LLMs உடன் ஒப்பிடும்போது கணிசமாக சிறிய கணக்கீட்டுத் தடம் கொண்ட SLMs, இந்த வளம் குறைந்த சூழல்களுக்கு மிகவும் பொருத்தமானவை.
அதே நேரத்தில், மாதிரி சுருக்க நுட்பங்களில் (model compression techniques) குறிப்பிடத்தக்க முன்னேற்றங்கள் ஒரு சக்திவாய்ந்த முடுக்கியாக செயல்பட்டுள்ளன. குவாண்டைசேஷன் (மாதிரியில் பயன்படுத்தப்படும் எண்களின் துல்லியத்தைக் குறைத்தல்) மற்றும் ப்ரூனிங் (நரம்பியல் நெட்வொர்க்கில் குறைவான முக்கிய இணைப்புகளை அகற்றுதல்) போன்ற புதுமைகள் டெவலப்பர்களை மாதிரி அளவைக் குறைக்கவும், செயலாக்க வேகத்தை வியத்தகு முறையில் அதிகரிக்கவும் அனுமதிக்கின்றன. முக்கியமாக, இந்த நுட்பங்கள் மாதிரியின் செயல்திறன் மற்றும் துல்லியத்தின் மீதான தாக்கத்தைக் குறைக்கும் அதே வேளையில் அதிக செயல்திறனை அடைய உருவாகி வருகின்றன. இந்த இரட்டை நன்மை - சிறிய அளவு மற்றும் தக்கவைக்கப்பட்ட திறன் - வளர்ந்து வரும் பணிகளின் வரம்பிற்கு LLMs க்கு மாற்றாக SLMs ஐ பெருகிய முறையில் சாத்தியமாக்குகிறது.
மேலும், நிறுவனங்கள் SLMs ஐ தங்கள் முக்கிய செயல்பாடுகளில் ஒருங்கிணைப்பதன் நடைமுறை மதிப்பை அங்கீகரிக்கின்றன. IT ஆட்டோமேஷன் இல், SLMs பதிவுகளை பகுப்பாய்வு செய்து கணினி தோல்விகளைக் கணிக்க முடியும், சைபர் பாதுகாப்பு இல், அவை நெட்வொர்க் போக்குவரத்தில் முரண்பாடுகளைக் கண்டறிய முடியும், மேலும் உற்பத்தித்திறனை மேம்படுத்துவதையும் முடிவெடுக்கும் செயல்முறைகளைச் செம்மைப்படுத்துவதையும் நோக்கமாகக் கொண்ட பல்வேறு வணிகப் பயன்பாடுகள் வரை, சாத்தியமான தாக்கம் பரந்தது. SLMs, செலவு, தனியுரிமை அல்லது உடனடி செயலாக்கம் தேவைப்படும் சூழ்நிலைகளில், குறிப்பாக AI ஐ பரவலாகப் பயன்படுத்த ஒரு பாதையை வழங்குகின்றன. எட்ஜ் கம்ப்யூட்டிங் தேவைகள், சுருக்கத்தின் மூலம் செயல்திறன் ஆதாயங்கள் மற்றும் தெளிவான நிறுவன பயன்பாட்டு நிகழ்வுகளின் இந்த சங்கமம் SLMs ஐ LLMs இன் சிறிய பதிப்புகளாக மட்டுமல்லாமல், குறிப்பிடத்தக்க செல்வாக்கிற்கு தயாராக இருக்கும் AI இன் ஒரு தனித்துவமான மற்றும் முக்கிய வகையாக நிலைநிறுத்துகிறது.
மூலோபாயப் பிரிவு: சுற்றுச்சூழல் கட்டுப்பாடு vs. முக்கிய நிபுணத்துவம்
SLM நிலப்பரப்பு வடிவம் பெறும்போது, ஆதிக்கத்திற்காக போட்டியிடும் முக்கிய வீரர்களிடையே தனித்துவமான மூலோபாய அணுகுமுறைகள் வெளிப்படுகின்றன. போட்டி இயக்கவியல் பெரும்பாலும் இரண்டு முதன்மை தத்துவங்களைச் சுற்றி ஒருங்கிணைக்கப்படுகிறது, ஒவ்வொன்றும் வெவ்வேறு வணிக மாதிரிகள் மற்றும் AI மதிப்பு எவ்வாறு கைப்பற்றப்படும் என்பதற்கான நீண்டகால பார்வைகளை பிரதிபலிக்கிறது.
ஒரு முக்கிய பாதை தனியுரிம சுற்றுச்சூழல் கட்டுப்பாட்டு உத்தி (proprietary ecosystem control strategy) ஆகும். இந்த அணுகுமுறை பல தொழில்நுட்ப ஜாம்பவான்கள் மற்றும் நன்கு நிதியளிக்கப்பட்ட AI ஆய்வகங்களால் விரும்பப்படுகிறது, அவர்கள் தங்கள் SLM சலுகைகளைச் சுற்றி சுவர் தோட்டங்களைக் கட்டும் நோக்கம் கொண்டுள்ளனர். OpenAI, அதன் GPT பரம்பரையில் இருந்து பெறப்பட்ட வகைகளுடன் (எதிர்பார்க்கப்படும் GPT-4 மினி குடும்பம் போன்றவை), Google அதன் Gemma மாதிரிகளுடன், Anthropic அதன் Claude Haiku ஐ ஆதரிக்கிறது, மற்றும் Cohere Command R+ ஐ ஊக்குவிக்கிறது, ஆகியவை முக்கிய எடுத்துக்காட்டுகள். அவர்களின் உத்தி பொதுவாக SLM களை பரந்த தளங்களின் ஒருங்கிணைந்த கூறுகளாக வணிகமயமாக்குவதை உள்ளடக்கியது, பெரும்பாலும் சந்தா அடிப்படையிலான பயன்பாட்டு நிரலாக்க இடைமுகங்கள் (APIs), ஒருங்கிணைந்த கிளவுட் சேவைகள் (Azure AI அல்லது Google Cloud AI போன்றவை) அல்லது நிறுவன உரிம ஒப்பந்தங்கள் மூலம் வழங்கப்படுகிறது.
இந்த மூலோபாயத்தின் கவர்ச்சி, இறுக்கமான ஒருங்கிணைப்பு, நிலையான செயல்திறன், மேம்பட்ட பாதுகாப்பு மற்றும் நிறுவப்பட்ட நிறுவன பணிப்பாய்வுகளுக்குள் எளிமைப்படுத்தப்பட்ட வரிசைப்படுத்தல் ஆகியவற்றில் உள்ளது. சுற்றுச்சூழலைக் கட்டுப்படுத்துவதன் மூலம், இந்த வழங்குநர்கள் நம்பகத்தன்மை மற்றும் ஆதரவு தொடர்பான உத்தரவாதங்களை வழங்க முடியும், இது அவர்களின் SLM களை வலுவான AI-உந்துதல் ஆட்டோமேஷன், மென்பொருள் தொகுப்புகளில் உட்பொதிக்கப்பட்ட அதிநவீன ‘copilot’ உதவியாளர்கள் மற்றும் நம்பகமான முடிவெடுக்கும் ஆதரவுக் கருவிகளைத் தேடும் வணிகங்களுக்கு கவர்ச்சிகரமானதாக ஆக்குகிறது. இந்த மாதிரி சேவை வழங்கல் மற்றும் இயங்குதளப் பூட்டுதல் மூலம் மதிப்பைப் பிடிப்பதற்கு முன்னுரிமை அளிக்கிறது, வழங்குநர்களின் தற்போதைய உள்கட்டமைப்பு மற்றும் சந்தை வரம்பைப் பயன்படுத்துகிறது. இது தடையற்ற ஒருங்கிணைப்பு மற்றும் நிர்வகிக்கப்பட்ட AI சேவைகளுக்கு முன்னுரிமை அளிக்கும் நிறுவனங்களுக்கு திறம்பட உதவுகிறது.
சுற்றுச்சூழல் விளையாட்டுக்கு முற்றிலும் மாறாக சிறப்பு டொமைன்-குறிப்பிட்ட மாதிரி உத்தி (specialized domain-specific model strategy) உள்ளது. இந்த அணுகுமுறை குறிப்பிட்ட தொழில்களின் தனித்துவமான கோரிக்கைகள், சொற்களஞ்சியங்கள் மற்றும் ஒழுங்குமுறை கட்டுப்பாடுகளுக்கு உன்னிப்பாக வடிவமைக்கப்பட்ட மற்றும் நன்றாகச் சரிசெய்யப்பட்ட SLM களை உருவாக்குவதை மையமாகக் கொண்டுள்ளது. பரந்த பயன்பாட்டினை நோக்கமாகக் கொள்வதற்குப் பதிலாக, இந்த மாதிரிகள் நிதி, சுகாதாரம், சட்ட சேவைகள் அல்லது மென்பொருள் மேம்பாடு போன்ற சிறப்பு தொழில்நுட்பத் துறைகள் போன்ற செங்குத்துகளுக்குள் உயர் செயல்திறனுக்காக மெருகூட்டப்படுகின்றன.
இந்த இடத்தில் முன்னோடிகளில் Hugging Face போன்ற தளங்கள் அடங்கும், இது குறியீட்டு பணிகளுக்காக வெளிப்படையாக உகந்ததாக்கப்பட்ட Zephyr 7B போன்ற மாதிரிகளைக் கொண்டுள்ளது, மற்றும் IBM போன்ற நிறுவப்பட்ட நிறுவன வீரர்கள், அதன் Granite குடும்ப மாதிரிகள் நிறுவன AI தேவைகளுடன் வடிவமைக்கப்பட்டுள்ளன, தரவு ஆளுகை மற்றும் இணக்கம் உட்பட, அவற்றின் மையத்தில். இங்குள்ள மூலோபாய நன்மை அகலத்தை விட ஆழத்தில் உள்ளது. தொழில்-குறிப்பிட்ட தரவுத்தொகுப்புகளில் மாதிரிகளைப் பயிற்றுவிப்பதன் மூலமும், குறிப்பிட்ட பணிகளுக்காக அவற்றை மேம்படுத்துவதன் மூலமும் (எ.கா., நிதிச் சொற்களைப் புரிந்துகொள்வது, மருத்துவக் குறிப்புகளை விளக்குவது, சட்டப் பிரிவுகளை வரைவது), இந்த SLM கள் அவற்றின் நியமிக்கப்பட்ட களங்களுக்குள் உயர்ந்த துல்லியம் மற்றும் சூழல் சார்ந்த பொருத்தத்தை அடைய முடியும். இந்த உத்தி ஒழுங்குபடுத்தப்பட்ட அல்லது அறிவு-தீவிர துறைகளில் உள்ள நிறுவனங்களுடன் வலுவாக எதிரொலிக்கிறது, அங்கு பொதுவான மாதிரிகள் குறையக்கூடும், இது சிறப்பு, பணி-முக்கியமான பயன்பாட்டு நிகழ்வுகளுக்கு மிகவும் துல்லியமான, சூழல்-விழிப்புணர்வு AI தீர்வுகளை வரிசைப்படுத்த உதவுகிறது. பரந்த-அடிப்படையிலான மாதிரிகள் கவனிக்கப்படக்கூடிய குறிப்பிட்ட வலி புள்ளிகள் மற்றும் இணக்கத் தேவைகளை நிவர்த்தி செய்வதன் மூலம் இது தத்தெடுப்பை வளர்க்கிறது.
இந்த இரண்டு மேலாதிக்க உத்திகளும் முழு சந்தைக்கும் பரஸ்பரம் பிரத்தியேகமானவை அல்ல, ஆனால் அவை போட்டியை வடிவமைக்கும் முதன்மை பதட்டங்களைக் குறிக்கின்றன. சுற்றுச்சூழல் வீரர்கள் அளவு, ஒருங்கிணைப்பு மற்றும் இயங்குதள வலிமை ஆகியவற்றில் பந்தயம் கட்டுகிறார்கள், அதே நேரத்தில் வல்லுநர்கள் ஆழம், துல்லியம் மற்றும் தொழில் நிபுணத்துவம் ஆகியவற்றில் கவனம் செலுத்துகிறார்கள். SLM சந்தையின் பரிணாமம் இந்த அணுகுமுறைகளுக்கு இடையிலான இடைவினை மற்றும் போட்டியை உள்ளடக்கியதாக இருக்கலாம், இது தொழில்நுட்பம் முதிர்ச்சியடையும் போது கலப்பின மாதிரிகள் அல்லது மேலும் மூலோபாய பல்வகைப்படுத்தலுக்கு வழிவகுக்கும்.
டைட்டன்கள் களத்தில் நுழைகிறார்கள்: பதவியில் இருப்பவர்களின் விளையாட்டு புத்தகம்
சிறிய மொழி மாதிரிகளால் முன்வைக்கப்படும் சாத்தியமான இடையூறு மற்றும் வாய்ப்பு தொழில்நுட்ப உலகின் நிறுவப்பட்ட ஜாம்பவான்களால் கவனிக்கப்படாமல் போகவில்லை. தங்கள் பரந்த வளங்கள், தற்போதைய வாடிக்கையாளர் உறவுகள் மற்றும் விரிவான உள்கட்டமைப்பைப் பயன்படுத்தி, இந்த பதவியில் இருப்பவர்கள் இந்த வளர்ந்து வரும் துறையில் ஒரு முன்னணி நிலையைப் பாதுகாக்க மூலோபாய ரீதியாக சூழ்ச்சி செய்கிறார்கள்.
Microsoft
நிறுவன மென்பொருள் மற்றும் கிளவுட் கம்ப்யூட்டிங்கில் ஒரு நிரந்தர சக்தி மையமான Microsoft, SLM களை அதன் தொழில்நுட்ப கட்டமைப்பில் தீவிரமாக நெசவு செய்கிறது. ஒரு தனியுரிம சுற்றுச்சூழல் கட்டுப்பாட்டு உத்தியை (proprietary ecosystem control strategy) ஏற்றுக்கொண்டு, ரெட்மண்ட் ஜாம்பவான் இந்த சுறுசுறுப்பான மாதிரிகளை அதன் Azure கிளவுட் தளம் மற்றும் பரந்த நிறுவன தீர்வுகள் தொகுப்பிற்குள் ஆழமாக ஒருங்கிணைக்கிறது. Phi series (Phi-2 உட்பட) மற்றும் Orca family போன்ற சலுகைகள் வணிக ரீதியாகக் கிடைக்கும் SLM களைக் குறிக்கின்றன, அவை நிறுவன AI பணிகளுக்காக குறிப்பாக உகந்ததாக்கப்பட்டுள்ளன, அதன் Copilot உதவியாளர்களுக்குள் அம்சங்களை இயக்குகின்றன மற்றும் Microsoft ஸ்டேக்கில் உருவாக்கும் டெவலப்பர்களுக்கு சக்திவாய்ந்த கருவிகளை வழங்குகின்றன.
Microsoft இன் உந்துதலை ஆதரிக்கும் ஒரு முக்கிய திறன் அதன் வலிமையான AI ஆராய்ச்சிப் பிரிவு மற்றும் அதன் உலகம் முழுவதும் பரவியுள்ள Azure கிளவுட் உள்கட்டமைப்பு ஆகும். இந்த கலவையானது Microsoft ஐ அதிநவீன மாதிரிகளை உருவாக்குவதோடு மட்டுமல்லாமல், அவற்றை அதன் பாரிய நிறுவன வாடிக்கையாளர் தளத்திற்கு அளவிடக்கூடிய, பாதுகாப்பான மற்றும் நம்பகமான சேவைகளாக வழங்கவும் அனுமதிக்கிறது. OpenAI உடனான நிறுவனத்தின் பல பில்லியன் டாலர் மூலோபாய கூட்டாண்மை அதன் AI மூலோபாயத்தின் ஒரு மூலக்கல்லாகும், இது OpenAI இன் மாதிரிகளுக்கு (சாத்தியமான SLM வகைகள் உட்பட) சிறப்புரிமை பெற்ற அணுகலை வழங்குகிறது மற்றும் Office 365, Bing மற்றும் பல்வேறு Azure AI சேவைகள் போன்ற Microsoft தயாரிப்புகளில் அவற்றின் இறுக்கமான ஒருங்கிணைப்பை செயல்படுத்துகிறது. இந்த கூட்டுறவு உறவு Microsoft க்கு உள்நாட்டில் உருவாக்கப்பட்ட SLM களையும், ஜெனரேட்டிவ் AI இல் மிகவும் அங்கீகரிக்கப்பட்ட பிராண்டிற்கான அணுகலையும் வழங்குகிறது.
மேலும், மூலோபாய கையகப்படுத்துதல்கள் Microsoft இன் நிலையை வலுப்படுத்துகின்றன. உரையாடல் AI மற்றும் சுகாதார ஆவணப்படுத்தல் தொழில்நுட்பத்தில் முன்னணியில் உள்ள Nuance Communications ஐ வாங்கியது, செங்குத்து-குறிப்பிட்ட AI பயன்பாடுகளில், குறிப்பாக சுகாதாரம் மற்றும் நிறுவன ஆட்டோமேஷன் சூழ்நிலைகளில் அதன் திறன்களை கணிசமாக வலுப்படுத்தியது, அங்கு சிறப்பு மொழி புரிதல் மிக முக்கியமானது. இந்த கணக்கிடப்பட்ட நகர்வுகள் - உள் வளர்ச்சி, மூலோபாய கூட்டாண்மை, கையகப்படுத்துதல்கள் மற்றும் அதன் மேலாதிக்க கிளவுட் மற்றும் மென்பொருள் தளங்களுடன் ஆழமான ஒருங்கிணைப்பு ஆகியவற்றைக் கலந்து - Microsoft ஐ அதன் சுற்றுச்சூழல் அமைப்பை பல்வேறு தொழில்களில் நிறுவன SLM தத்தெடுப்புக்கான இயல்புநிலை தேர்வாக மாற்றும் நோக்கில் ஒரு வலிமையான சக்தியாக நிலைநிறுத்துகின்றன.
IBM
International Business Machines (IBM), நிறுவனக் கணினியில் ஆழமாக வேரூன்றிய அதன் நீண்ட வரலாற்றைக் கொண்டு, SLM சந்தையை வணிகம் சார்ந்த பயன்பாடுகள், நம்பிக்கை மற்றும் ஆளுகை (business-centric applications, trust, and governance) ஆகியவற்றில் ஒரு சிறப்பியல்பு கவனத்துடன் அணுகுகிறது. Big Blue அதன் watsonx.ai தளத்திற்குள் SLM களை தீவிரமாக உருவாக்கி மேம்படுத்துகிறது, அவற்றை செலவு குறைந்த, திறமையான மற்றும் டொமைன்-விழிப்புணர்வு AI தீர்வுகளாக வடிவமைக்கிறது, அவை குறிப்பாக நிறுவனத் தேவைகளுக்கு ஏற்ப வடிவமைக்கப்பட்டுள்ளன.
IBM இன் உத்தி நுகர்வோர் எதிர்கொள்ளும் அல்லது பொது நோக்கத்திற்கான மாதிரிகளுக்கு முன்னுரிமை அளிக்கும் அணுகுமுறைகளுடன் வேண்டுமென்றே முரண்படுகிறது. மாறாக, நிறுவன வரிசைப்படுத்தலுக்கு முக்கியமான பண்புகளில் கவனம் செலுத்தப்படுகிறது: நம்பகத்தன்மை, தரவு ஆளுகை மற்றும் AI நெறிமுறைக் கொள்கைகளைக் கடைப்பிடித்தல். இது IBM இன் SLM சலுகைகளை, Granite மாதிரிகள் போன்றவை, பாதுகாப்பான சூழல்களிலும், கடுமையான ஒழுங்குமுறை இணக்கத்திற்கு உட்பட்ட தொழில்களிலும் வரிசைப்படுத்துவதற்கு குறிப்பாகப் பொருத்தமானதாக ஆக்குகிறது. பல பெரிய நிறுவனங்களுக்கு, குறிப்பாக நிதி மற்றும் சுகாதாரத் துறையில், AI இன் தணிக்கை, கட்டுப்பாடு மற்றும் பொறுப்பான பயன்பாட்டை உறுதி செய்யும் திறன் பேரம் பேச முடியாதது என்பதை IBM புரிந்துகொள்கிறது.
இந்த ஆளுகை-கவனம் செலுத்தும் SLM களை அதன் கலப்பின கிளவுட் தீர்வுகள் மற்றும் ஆலோசனை சேவைகளில் இணைப்பதன் மூலம், பாதுகாப்பு அல்லது நெறிமுறை தரங்களில் சமரசம் செய்யாமல் ஆட்டோமேஷனை மேம்படுத்தவும், தரவு சார்ந்த முடிவெடுப்பதை மேம்படுத்தவும், செயல்பாட்டுத் திறனை நெறிப்படுத்தவும் வணிகங்களுக்கு அதிகாரம் அளிப்பதை IBM நோக்கமாகக் கொண்டுள்ளது. அவர்களின் ஆழமான நிறுவன உறவுகள் மற்றும் நம்பகத்தன்மைக்கான நற்பெயர், சிக்கலான நிறுவன கட்டமைப்புகளுக்குள் டிஜிட்டல் மாற்றத்திற்கான நடைமுறை, நம்பகமான கருவிகளாக SLM களை ஊக்குவிப்பதில் முக்கிய சொத்துக்களாக செயல்படுகின்றன. பல வணிகங்களுக்கு, AI வரிசைப்படுத்தலின் ‘எப்படி’ - பாதுகாப்பாகவும் பொறுப்புடனும் - ‘என்ன’ என்பதைப் போலவே முக்கியமானது என்று IBM பந்தயம் கட்டுகிறது.
Gemini போன்ற அதன் பெரிய அளவிலான மாதிரிகளுடன் மிகவும் வெளிப்படையாக தொடர்புடையதாக இருந்தாலும், Google SLM அரங்கிலும் ஒரு குறிப்பிடத்தக்க வீரராக உள்ளது, முதன்மையாக அதன் பரந்த சுற்றுச்சூழல் மற்றும் ஆராய்ச்சி திறன்களை (ecosystem and research capabilities) மேம்படுத்துகிறது. Gemma (எ.கா., Gemma 7B) போன்ற மாதிரிகள் மூலம், Google ஒப்பீட்டளவில் இலகுரக மற்றும் திறமையான திறந்த மாதிரிகளை வழங்குகிறது, டெவலப்பர் தத்தெடுப்பு மற்றும் அதன் சொந்த சுற்றுச்சூழல் அமைப்பிற்குள், குறிப்பாக Google Cloud Platform (GCP) ஒருங்கிணைப்பை வளர்ப்பதை நோக்கமாகக் கொண்டுள்ளது.
Google இன் உத்தி சுற்றுச்சூழல் கட்டுப்பாடு மற்றும் ஒரு பரந்த சமூகத்தை வளர்ப்பது ஆகிய இரண்டின் கூறுகளையும் கலப்பதாகத் தெரிகிறது. Gemma போன்ற மாதிரிகளை வெளியிடுவதன் மூலம், இது பரிசோதனையை ஊக்குவிக்கிறது மற்றும் டெவலப்பர்களை Google இன் அடிப்படை உள்கட்டமைப்பைப் (திறமையான பயிற்சி மற்றும் அனுமானத்திற்கான TPUs போன்றவை) பயன்படுத்தி பயன்பாடுகளை உருவாக்க அனுமதிக்கிறது. இந்த அணுகுமுறை GCP AI சேவைகளின் பயன்பாட்டை இயக்க உதவுகிறது மற்றும் Google ஐ அடித்தள மாதிரிகள் மற்றும் அவற்றை திறம்பட வரிசைப்படுத்துவதற்கான கருவிகள் இரண்டையும் வழங்குபவராக நிலைநிறுத்துகிறது. தேடல், மொபைல் (Android) மற்றும் கிளவுட் உள்கட்டமைப்பில் அவர்களின் ஆழ்ந்த நிபுணத்துவம், ஏற்கனவே உள்ள தயாரிப்புகளை மேம்படுத்த அல்லது புதிய சாதன அனுபவங்களை உருவாக்க SLM களை ஒருங்கிணைக்க பல வழிகளை வழங்குகிறது. Google இன் பங்கேற்பு SLM சந்தை தீவிரமாக போட்டித்தன்மையுடன் இருப்பதை உறுதி செய்கிறது, செயல்திறன் மற்றும் அணுகல் ஆகியவற்றின் எல்லைகளைத் தள்ளுகிறது.
AWS
Amazon Web Services (AWS), கிளவுட் உள்கட்டமைப்பில் ஆதிக்கம் செலுத்தும் வீரர், இயற்கையாகவே SLM களை அதன் விரிவான AI மற்றும் இயந்திர கற்றல் போர்ட்ஃபோலியோவில் ஒருங்கிணைக்கிறது. Amazon Bedrock போன்ற சேவைகள் மூலம், AWS வணிகங்களுக்கு பல்வேறு வழங்குநர்களிடமிருந்து SLM கள் உட்பட (சாத்தியமான அதன் சொந்த, சில சூழல்களில் குறிப்பிடப்பட்டுள்ள கருத்தியல் Nova மாதிரிகள் போன்றவை, இருப்பினும் விவரக்குறிப்புகள் மாறுபடலாம்) அடித்தள மாதிரிகளின் தேர்ந்தெடுக்கப்பட்ட தேர்வுக்கு அணுகலை வழங்குகிறது.
AWS இன் உத்தி பெரும்பாலும் அதன் சக்திவாய்ந்த கிளவுட் சூழலுக்குள் தேர்வு மற்றும் நெகிழ்வுத்தன்மையை வழங்குவதை (providing choice and flexibility) மையமாகக் கொண்டுள்ளது. Bedrock வழியாக SLM களை வழங்குவதன் மூலம், AWS அதன் வாடிக்கையாளர்களை இந்த மாதிரிகளைப் பரிசோதிக்கவும், தனிப்பயனாக்கவும் மற்றும் வரிசைப்படுத்தவும் பழக்கமான AWS கருவிகள் மற்றும் உள்கட்டமைப்பைப் பயன்படுத்தி எளிதாக அனுமதிக்கிறது. இந்த இயங்குதளத்தை மையமாகக் கொண்ட அணுகுமுறை, அடிப்படை வன்பொருள் அல்லது சிக்கலான மாதிரி வரிசைப்படுத்தல் குழாய்களை நிர்வகிக்காமல் AI ஐப் பயன்படுத்த விரும்பும் வணிகங்களுக்கான செயல்பாட்டுச் சுமையைக் குறைத்து, SLM களை நிர்வகிக்கப்பட்ட சேவைகளாக அணுகுவதை மையமாகக் கொண்டுள்ளது. AWS, பெரிய அல்லது சிறிய மாதிரிகளைத் தேர்வுசெய்தாலும், நிறுவனங்கள் தங்கள் AI பயன்பாடுகளை உருவாக்கவும் இயக்கவும் கூடிய அடித்தள தளமாக இருக்க வேண்டும், அதன் அளவு, பாதுகாப்பு மற்றும் விரிவான சேவை சலுகைகளைப் பயன்படுத்தி AI சகாப்தத்தில் அதன் கிளவுட் தலைமையை பராமரிக்க வேண்டும்.
இடையூறு செய்பவர்கள் மற்றும் நிபுணர்கள்: புதிய பாதைகளை உருவாக்குதல்
நிறுவப்பட்ட தொழில்நுட்ப டைட்டன்களுக்கு அப்பால், புதிய நுழைபவர்கள் மற்றும் சிறப்பு நிறுவனங்களின் துடிப்பான குழு சிறிய மொழி மாதிரி சந்தையின் திசையையும் இயக்கவியலையும் கணிசமாக பாதிக்கிறது. இந்த நிறுவனங்கள் பெரும்பாலும் புதிய முன்னோக்குகளைக் கொண்டு வருகின்றன, திறந்த மூலக் கொள்கைகள், குறிப்பிட்ட தொழில் முக்கியத்துவங்கள் அல்லது தனித்துவமான தொழில்நுட்ப அணுகுமுறைகளில் கவனம் செலுத்துகின்றன.
OpenAI
OpenAI, ஜெனரேட்டிவ் AI ஆர்வத்தில் சமீபத்திய எழுச்சிக்கு வினையூக்கியாக வாதிடலாம், SLM இடத்தில் ஒரு கட்டளை இருப்பைக் கொண்டுள்ளது, அதன் முன்னோடி ஆராய்ச்சி மற்றும் வெற்றிகரமான வரிசைப்படுத்தல் உத்திகளை உருவாக்குகிறது. அதன் பெரிய மாடல்களுக்குப் பெயர் பெற்றிருந்தாலும், OpenAI சிறிய, திறமையான வகைகளை தீவிரமாக உருவாக்கி வரிசைப்படுத்துகிறது, அதாவது எதிர்பார்க்கப்படும் GPT-4o mini family, o1-mini family, மற்றும் o3-mini family. இது வெவ்வேறு பயன்பாட்டு நிகழ்வுகளுக்கு வெவ்வேறு மாதிரி அளவுகள் மற்றும் செயல்திறன் பண்புகள் தேவை என்ற மூலோபாய புரிதலை பிரதிபலிக்கிறது.
இயற்கை மொழி செயலாக்கத்தில் ஒரு முன்னோடியாக, OpenAI இன் போட்டி முனை அதன் ஆழமான ஆராய்ச்சி நிபுணத்துவம் (research expertise) மற்றும் ஆராய்ச்சியை வணிக ரீதியாக சாத்தியமான தயாரிப்புகளாக மொழிபெயர்க்கும் அதன் நிரூபிக்கப்பட்ட திறனிலிருந்து உருவாகிறது. அதன் கவனம் மூல திறனைத் தாண்டி செயல்திறன், பாதுகாப்பு மற்றும் AI இன் நெறிமுறை வரிசைப்படுத்தல் (efficiency, safety, and the ethical deployment) போன்ற முக்கியமான அம்சங்களை உள்ளடக்கியது, மாதிரிகள் மிகவும் பரவலாக மாறும்போது இது குறிப்பாக பொருத்தமானது. நிறுவனத்தின் API-அடிப்படையிலான விநியோக மாதிரி (API-based delivery model) சக்திவாய்ந்த AI க்கான அணுகலை ஜனநாயகப்படுத்துவதில் கருவியாக உள்ளது, இது உலகெங்கிலும் உள்ள டெவலப்பர்கள் மற்றும் வணிகங்களை அதன் தொழில்நுட்பத்தை ஒருங்கிணைக்க அனுமதிக்கிறது. Microsoft உடனான மூலோபாய கூட்டாண்மை குறிப்பிடத்தக்க மூலதனத்தையும் இணையற்ற சந்தை வரம்பையும் வழங்குகிறது, OpenAI இன் தொழில்நுட்பத்தை ஒரு பரந்த நிறுவன சுற்றுச்சூழல் அமைப்பிற்குள் உட்பொதிக்கிறது.
OpenAI மேம்பட்ட மாதிரி சுருக்க நுட்பங்களை (model compression techniques) தீவிரமாக ஆராய்வதன் மூலமும், கணக்கீட்டு கோரிக்கைகளைக் குறைக்கும் அதே வேளையில் செயல்திறனை மேம்படுத்த வெவ்வேறு மாதிரி அளவுகளின் பலங்களை இணைக்கக்கூடிய கலப்பின கட்டமைப்புகளை (hybrid architectures) ஆராய்வதன் மூலமும் உறையைத் தொடர்ந்து தள்ளுகிறது. மாதிரிகளை நன்றாகச் சரிசெய்தல் மற்றும் தனிப்பயனாக்குதல் (fine-tuning and customizing) க்கான நுட்பங்களை உருவாக்குவதில் அதன் தலைமை, நிறுவனங்கள் OpenAI இன் சக்திவாய்ந்த அடிப்படை மாதிரிகளை குறிப்பிட்ட தொழில் தேவைகள் மற்றும் தனியுரிம தரவுத்தொகுப்புகளுக்கு மாற்றியமைக்க அனுமதிக்கிறது, இது ஒரு புதுமைப்பித்தன் மற்றும் பயன்பாட்டு AI இன் முக்கிய இயக்கி என அதன் சந்தை நிலையை மேலும் உறுதிப்படுத்துகிறது.
Anthropic
Anthropic அதன் வளர்ச்சி தத்துவத்தின் முன்னணியில் பாதுகாப்பு, நம்பகத்தன்மை மற்றும் நெறிமுறைக் கருத்தாய்வுகளை (safety, reliability, and ethical considerations) வைப்பதன் மூலம் AI நிலப்பரப்பில் ஒரு தனித்துவமான அடையாளத்தை செதுக்கியுள்ளது. இந்த கவனம் அதன் SLM களுக்கான அணுகுமுறையில் தெளிவாக பிரதிபலிக்கிறது, Claude Haiku போன்ற மாதிரிகளால் எடுத்துக்காட்டுகிறது. நிறுவன சூழல்களில் பாதுகாப்பான மற்றும் நம்பகமான செயல்திறனுக்காக வெளிப்படையாக வடிவமைக்கப்பட்ட, Haiku தீங்கு விளைவிக்கும், பக்கச்சார்பான அல்லது பொய்யான உள்ளடக்கத்தை உருவாக்கும் அபாயங்களைக் குறைக்கும் அதே வேளையில் பயனுள்ள AI திறன்களை வழங்குவதை நோக்கமாகக் கொண்டுள்ளது.
நம்பகமான AI (trustworthy AI) வழங்குநராக தன்னை நிலைநிறுத்திக் கொள்வதன் மூலம், Anthropic குறிப்பாக முக்கியமான களங்களில் செயல்படும் நிறுவனங்களுக்கு அல்லது பொறுப்பான AI தத்தெடுப்புக்கு முன்னுரிமை அளிப்பவர்களுக்கு முறையிடுகிறது. அரசியலமைப்பு AI மற்றும் கடுமையான பாதுகாப்பு சோதனைகளில் அவர்களின் முக்கியத்துவம், மூல செயல்திறனுக்கு எல்லாவற்றிற்கும் மேலாக முன்னுரிமை அளிக்கக்கூடிய போட்டியாளர்களிடமிருந்து அவர்களை வேறுபடுத்துகிறது. திறமையானவை மட்டுமல்லாமல், தவறான பயன்பாட்டிற்கு எதிரான பாதுகாப்பு தண்டவாளங்களுடன் வடிவமைக்கப்பட்ட SLM களை வழங்குவதன் மூலம், Anthropic கார்ப்பரேட் மதிப்புகள் மற்றும் ஒழுங்குமுறை எதிர்பார்ப்புகளுடன் ஒத்துப்போகும் AI தீர்வுகளுக்கான வளர்ந்து வரும் தேவையை பூர்த்தி செய்கிறது, இது அவர்களை ஒரு முக்கிய போட்டியாளராக ஆக்குகிறது, குறிப்பாக நம்பகமான மற்றும் நெறிமுறையாக அடித்தளமாக உள்ள AI கூட்டாளர்களைத் தேடும் வணிகங்களுக்கு.
Mistral AI
ஐரோப்பிய தொழில்நுட்பக் காட்சியிலிருந்து விரைவாக வெளிவந்த Mistral AI, 2023 இல் நிறுவப்பட்ட ஒரு பிரெஞ்சு நிறுவனம், SLM துறையில் குறிப்பிடத்தக்க அலைகளை உருவாக்கியுள்ளது. அதன் முக்கிய உத்தி, உள்ளூர் சாதனங்களில் அல்லது எட்ஜ் கம்ப்யூட்டிங் சூழல்களுக்குள் கூட, செயல்திறன் மற்றும் வரிசைப்படுத்தலுக்காக வெளிப்படையாக வடிவமைக்கப்பட்ட சிறிய, அதிக செயல்திறன் கொண்ட AI மாதிரிகளை (compact, highly efficient AI models) உருவாக்குவதை மையமாகக் கொண்டுள்ளது. Mistral 7B போன்ற மாதிரிகள் (ஆரம்பத்தில் வெளியிடப்பட்டது, அசல் உரை குழப்பமாக 3B/8B ஐக் குறிப்பிட்டாலும் - நன்கு அறியப்பட்ட 7B இல் கவனம் செலுத்துவது பாதுகாப்பானது) அவற்றின் மிதமான அளவிற்கு (7 பில்லியன் அளவுருக்கள்) தொடர்புடைய குறிப்பிடத்தக்க செயல்திறனை வழங்குவதற்காக பரவலான கவனத்தைப் பெற்றன, இது கணக்கீட்டு வளங்கள் குறைவாக உள்ள சூழ்நிலைகளுக்கு மிகவும் பொருத்தமானதாக அமைகிறது.
Mistral AI க்கான ஒரு முக்கிய வேறுபாடு திறந்த மூல வளர்ச்சிக்கு (open-source development) அதன் வலுவான அர்ப்பணிப்பு ஆகும். அதன் பல மாதிரிகள் மற்றும் கருவிகளை அனுமதிக்கும் உரிமங்களின் கீழ் வெளியிடுவதன் மூலம், Mistral AI பரந்த AI சமூகத்திற்குள் ஒத்துழைப்பு, வெளிப்படைத்தன்மை மற்றும் விரைவான கண்டுபிடிப்புகளை வளர்க்கிறது. இந்த அணுகுமுறை சில பெரிய வீரர்களின் தனியுரிம சுற்றுச்சூழல் அமைப்புகளுடன் முரண்படுகிறது மற்றும் டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்களிடையே விரைவாக ஒரு விசுவாசமான பின்தொடர்பை உருவாக்கியுள்ளது. அதன் அடித்தள மாதிரிகளுக்கு அப்பால், நிறுவனம் மத்திய கிழக்கு மற்றும் தெற்காசிய மொழிகளுக்கு ஏற்றவாறு Mistral Saba போன்ற வகைகளை தயாரிப்பதன் மூலம் பல்துறைத்திறனை வெளிப்படுத்தியுள்ளது, மேலும் Pixtral (பட புரிதலை நோக்கமாகக் கொண்டது) போன்ற கருத்துகளுடன் பன்முறை திறன்களை ஆராய்ந்து, பல்வேறு மொழியியல் மற்றும் செயல்பாட்டு தேவைகளை நிவர்த்தி செய்வதற்கான அதன் லட்சியத்தை வெளிப்படுத்துகிறது. Mistral AI இன் விரைவான ஏற்றம் AI சந்தையில் உயர் செயல்திறன், திறமையான மற்றும் பெரும்பாலும் திறந்த மூல மாற்றுகளுக்கான குறிப்பிடத்தக்க பசியை எடுத்துக்காட்டுகிறது.
Infosys
Infosys, IT சேவைகள் மற்றும் ஆலோசனையில் ஒரு உலகளாவிய முன்னோடி, தொழில்-குறிப்பிட்ட தீர்வுகளில் (industry-specific solutions) கவனம் செலுத்தி, SLM சந்தையில் ஒரு முக்கிய இடத்தைப் பிடிக்க அதன் ஆழ்ந்த தொழில் நிபுணத்துவம் மற்றும் வாடிக்கையாளர் உறவுகளை மேம்படுத்துகிறது. Infosys Topaz BankingSLM மற்றும் Infosys Topaz ITOpsSLM ஆகியவற்றின் வெளியீடு இந்த மூலோபாயத்தை எடுத்துக்காட்டுகிறது. இந்த மாதிரிகள் வங்கி மற்றும் IT செயல்பாட்டுத் துறைகளுக்குள் உள்ள தனித்துவமான சவால்கள் மற்றும் பணிப்பாய்வுகளை நிவர்த்தி செய்ய நோக்கத்திற்காக உருவாக்கப்பட்டவை.
Infosys க்கான ஒரு முக்கிய இயக்கி NVIDIA உடனான அதன் மூலோபாய கூட்டாண்மை ஆகும், இந்த சிறப்பு SLM களுக்கான அடித்தளமாக NVIDIA இன் AI ஸ்டேக்கைப் பயன்படுத்துகிறது. இந்த மாதிரிகள் ஏற்கனவே உள்ள நிறுவன அமைப்புகளுடன் தடையற்ற ஒருங்கிணைப்புக்காக வடிவமைக்கப்பட்டுள்ளன, இதில் Infosys இன் சொந்த பரவலாகப் பயன்படுத்தப்படும் Finacle வங்கி தளமும் அடங்கும். NVIDIA தொழில்நுட்பங்களில் கவனம் செலுத்தும் ஒரு பிரத்யேக சிறப்பு மையத்திற்குள் உருவாக்கப்பட்டது, மேலும் Sarvam AI போன்ற கூட்டாளர்களுடனான ஒத்துழைப்பு மூலம் மேலும் வலுப்படுத்தப்பட்டது, இந்த SLM கள் பொது நோக்கம் மற்றும் துறை சார்ந்த தரவு இரண்டிலும் பயிற்சியிலிருந்து பயனடைகின்றன. முக்கியமாக, Infosys மாதிரிகளை மட்டும் வழங்கவில்லை; இது முன் பயிற்சி மற்றும் நன்றாகச் சரிசெய்தல் சேவைகளையும் (pre-training and fine-tuning services) வழங்குகிறது, இது நிறுவனங்கள் தங்கள் தனியுரிம தரவு மற்றும் குறிப்பிட்ட செயல்பாட்டுத் தேவைகளுக்கு ஏற்ப வடிவமைக்கப்பட்ட தனிப்பயன் AI மாதிரிகளை உருவாக்க உதவுகிறது, அதே நேரத்தில் பாதுகாப்பு மற்றும் தொடர்புடைய தொழில் தரங்களுடன் இணக்கத்தை உறுதி செய்கிறது. இந்த சேவை சார்ந்த அணுகுமுறை Infosys ஐ பெரிய நிறுவனங்களுக்கான SLM தொழில்நுட்பத்தின் ஒருங்கிணைப்பாளர் மற்றும் தனிப்பயனாக்குபவராக நிலைநிறுத்துகிறது.
பிற குறிப்பிடத்தக்க வீரர்கள்
SLM புலம் இந்த முன்னிலைப்படுத்தப்பட்ட நிறுவனங்களை விட பரந்தது. பிற குறிப்பிடத்தக்க பங்களிப்பாளர்கள் புதுமைகளைத் தள்ளி, குறிப்பிட்ட சந்தைப் பிரிவுகளை வடிவமைக்கின்றனர்:
- Cohere: நிறுவன AI இல் கவனம் செலுத்துகிறது, வணிக பயன்பாட்டு நிகழ்வுகளுக்காக வடிவமைக்கப்பட்ட Command R+ போன்ற மாதிரிகளை வழங்குகிறது மற்றும் பெரும்பாலும் தரவு தனியுரிமை மற்றும் வரிசைப்படுத்தல் நெகிழ்வுத்தன்மையை வலியுறுத்துகிறது (எ.கா., பல்வேறு கிளவுட்கள் அல்லது ஆன்-பிரமிஸ்).
- Hugging Face: முதன்மையாக ஒரு தளம் மற்றும் சமூக மையமாக அறியப்பட்டாலும், Hugging Face மாதிரி வளர்ச்சிக்கும் (குறியீட்டிற்கான Zephyr 7B போன்றவை) பங்களிக்கிறது மற்றும் பல SLM கள் உட்பட ஆயிரக்கணக்கான மாடல்களுக்கான அணுகலை ஜனநாயகப்படுத்துவதில் முக்கிய பங்கு வகிக்கிறது, ஆராய்ச்சி மற்றும் பயன்பாட்டு மேம்பாட்டை எளிதாக்குகிறது.
- Stability AI: ஆரம்பத்தில் பட உருவாக்கத்தில் (Stable Diffusion) அதன் பணிக்காகப் புகழ் பெற்ற Stability AI, மொழி மாதிரிகளில் அதன் போர்ட்ஃபோலியோவை விரிவுபடுத்துகிறது, சாதனத்தில் வரிசைப்படுத்தல் மற்றும் பல்வேறு நிறுவன பயன்பாடுகளுக்கு ஏற்ற சிறிய மற்றும் திறமையான SLM களை ஆராய்கிறது, ஜெனரேட்டிவ் AI இல் அதன் நிபுணத்துவத்தைப் பயன்படுத்துகிறது.
இந்த நிறுவனங்கள், பெரிய வீரர்களுடன் சேர்ந்து, ஒரு மாறும் மற்றும் விரைவாக உருவாகி வரும் சுற்றுச்சூழல் அமைப்புக்கு பங்களிக்கின்றன. அவர்களின் மாறுபட்ட உத்திகள் - திறந்த மூல, தனியுரிம தளங்கள், தொழில் நிபுணத்துவம் மற்றும் அடித்தள ஆராய்ச்சி ஆகியவற்றை உள்ளடக்கியது - SLM செயல்திறன், அணுகல் மற்றும் திறன் ஆகியவற்றில் கூட்டாக முன்னேற்றங்களைத் தூண்டுகின்றன, இந்த சிறிய மாதிரிகள் எண்ணற்ற பயன்பாடுகள் மற்றும் தொழில்களில் செயற்கை நுண்ணறிவின் எதிர்காலத்தில் பெருகிய முறையில் மையப் பங்கு வகிப்பதை உறுதி செய்கின்றன.