சாதனத்தில் AI-க்கான சிறிய பவர்ஹவுஸ்
Google’ன் Gemma 3 1B, மொபைல் மற்றும் வலை பயன்பாடுகளில் அதிநவீன மொழி திறன்களை ஒருங்கிணைக்க விரும்பும் டெவலப்பர்களுக்கான ஒரு அற்புதமான தீர்வாக வெளிவருகிறது. வெறும் 529MB எடையுள்ள இந்த சிறிய மொழி மாதிரி (SLM), விரைவான பதிவிறக்கங்கள் மற்றும் பதிலளிக்கக்கூடிய செயல்திறன் மிக முக்கியமான சூழல்களுக்காக சிறப்பாக உருவாக்கப்பட்டது. இதன் சிறிய அளவு, சாதனத்தில் AI-க்கான புதிய சாத்தியக்கூறுகளைத் திறக்கிறது, பாரம்பரிய, பெரிய மாடல்களின் தடைகள் இல்லாமல் தடையற்ற பயனர் அனுபவங்களை செயல்படுத்துகிறது.
AI திறனை வெளிக்கொணர்தல், ஆஃப்லைன் மற்றும் ஆன்-டிவைஸ்
Gemma 3 1B இன் மிகவும் கவர்ச்சிகரமான நன்மைகளில் ஒன்று, அது முற்றிலும் உள்நாட்டில் செயல்படும் திறன் ஆகும். அதாவது, வைஃபை அல்லது செல்லுலார் இணைப்பு இல்லாத நிலையிலும் பயன்பாடுகள் அதன் சக்தியைப் பயன்படுத்த முடியும். இந்த ஆஃப்லைன் செயல்பாடு பயனர் வசதியை மேம்படுத்துவது மட்டுமல்லாமல், வரையறுக்கப்பட்ட அல்லது நம்பகத்தன்மையற்ற இணைப்பு உள்ள பகுதிகளில் பயன்பாடுகளுக்கான கதவுகளையும் திறக்கிறது. தொலைதூர மலைப்பகுதியில் கூட சீராகச் செயல்படும் மொழி கற்றல் செயலி அல்லது சர்வதேச விமானப் பயணத்தின்போது தடையின்றி வேலை செய்யும் மொழிபெயர்ப்பு கருவியை கற்பனை செய்து பாருங்கள்.
இணைப்புக்கு அப்பால், ஆன்-டிவைஸ் செயலாக்கம் தாமதம் மற்றும் செலவு ஆகியவற்றின் அடிப்படையில் குறிப்பிடத்தக்க நன்மைகளை வழங்குகிறது. தொலை சேவையகத்துடன் தொடர்பு கொள்ள வேண்டிய தேவையை நீக்குவதன் மூலம், Gemma 3 1B பதிலளிப்பு நேரங்களைக் குறைக்கிறது, பயனருக்கு ஒரு திரவ மற்றும் இயற்கையான தொடர்புகளை உருவாக்குகிறது. மேலும், டெவலப்பர்கள் கிளவுட் அடிப்படையிலான AI சேவைகளுடன் தொடர்புடைய தொடர்ச்சியான செலவுகளைத் தவிர்க்கலாம், இது நீண்ட கால வரிசைப்படுத்தலுக்கு செலவு குறைந்த தீர்வாக அமைகிறது.
தனியுரிமைக்கு முன்னுரிமை
இன்றைய டிஜிட்டல் உலகில், தரவு தனியுரிமை என்பது வளர்ந்து வரும் கவலையாக உள்ளது. Gemma 3 1B பயனர் தரவை சாதனத்திற்குள் பாதுகாப்பாக வைத்திருப்பதன் மூலம் இந்தக் கவலையை நேரடியாக எதிர்கொள்கிறது. மாதிரியுடனான தொடர்புகள் உள்நாட்டில் நிகழ்வதால், முக்கியமான தகவல்கள் பயனரின் தொலைபேசி அல்லது கணினியை விட்டு வெளியேற வேண்டியதில்லை. இந்த உள்ளார்ந்த தனியுரிமை, ஹெல்த் டிராக்கர்ஸ், ஃபைனான்சியல் டூல்ஸ் அல்லது கம்யூனிகேஷன் பிளாட்ஃபார்ம்ஸ் போன்ற தனிப்பட்ட தரவைக் கையாளும் பயன்பாடுகளுக்கு ஒரு பெரிய நன்மை.
நேச்சுரல் லாங்குவேஜ் ஒருங்கிணைப்பு: ஆப் இன்டராக்ஷனுக்கான ஒரு புதிய முன்னுதாரணம்
Gemma 3 1B க்காக எதிர்பார்க்கப்படும் முதன்மை பயன்பாடு, பயன்பாடுகளில் நேச்சுரல் லாங்குவேஜ் இடைமுகங்களை தடையின்றி ஒருங்கிணைப்பதாகும். இது டெவலப்பர்களுக்கு மிகவும் உள்ளுணர்வு மற்றும் ஈர்க்கக்கூடிய பயனர் அனுபவங்களை உருவாக்குவதற்கான சாத்தியக்கூறுகளின் உலகத்தைத் திறக்கிறது. பாரம்பரிய பொத்தான் அழுத்தங்கள் மற்றும் மெனு நேவிகேஷனை மட்டுமே நம்புவதற்குப் பதிலாக, பயனர்கள் இயற்கையான, உரையாடல் மொழியைப் பயன்படுத்தி பயன்பாடுகளுடன் தொடர்பு கொள்ளலாம்.
பின்வரும் காட்சிகளைக் கவனியுங்கள்:
- உள்ளடக்க உருவாக்கம்: ஒரு புகைப்பட எடிட்டிங் செயலி, அதன் உள்ளடக்கத்தின் அடிப்படையில் படங்களுக்கு தானாகவே கவர்ச்சிகரமான தலைப்புகளை உருவாக்க முடியும் என்று கற்பனை செய்து பாருங்கள். அல்லது ஒரு குறிப்பு எடுக்கும் செயலி, நீண்ட ஆவணங்களை சுருக்கமான புல்லட் புள்ளிகளாக சுருக்க முடியும்.
- உரையாடல் ஆதரவு: மொபைல் பேங்கிங் செயலியினுள் உட்பொதிக்கப்பட்ட ஒரு வாடிக்கையாளர் சேவை சாட்போட்டைப் பற்றி சிந்தியுங்கள், இது மனித தலையீடு இல்லாமல் பரந்த அளவிலான விசாரணைகளைக் கையாளும் திறன் கொண்டது. அல்லது ஒரு பயண செயலி, இடங்கள், பயணத்திட்டங்கள் மற்றும் உள்ளூர் பழக்கவழக்கங்களைப் பற்றிய கேள்விகளுக்கு இயற்கையான, உரையாடல் வழியில் பதிலளிக்க முடியும்.
- தரவு சார்ந்த நுண்ணறிவு: உடற்பயிற்சி தரவை பகுப்பாய்வு செய்து, தனிப்பயனாக்கப்பட்ட பரிந்துரைகளை எளிய ஆங்கிலத்தில் வழங்கக்கூடிய ஒரு ஃபிட்னஸ் செயலியை கற்பனை செய்து பாருங்கள். அல்லது ஒரு நிதி திட்டமிடல் கருவி, சிக்கலான முதலீட்டு உத்திகளை எளிதில் புரிந்துகொள்ளக்கூடிய வகையில் விளக்க முடியும்.
- சூழல் சார்ந்த உரையாடல்: இணைக்கப்பட்ட சாதனங்களின் தற்போதைய நிலையின் அடிப்படையில் குரல் கட்டளைகளுக்கு பதிலளிக்கக்கூடிய ஒரு ஸ்மார்ட் ஹோம் செயலியைப் பற்றி சிந்தியுங்கள். உதாரணமாக, ‘வரவேற்பறையில் யாரும் இல்லை என்றால் விளக்குகளை அணைக்கவும்’ என்பதற்கு, செயலி கட்டளை மற்றும் சூழல் இரண்டையும் புரிந்து கொள்ள வேண்டும்.
உகந்த செயல்திறனுக்கான ஃபைன்-ட்யூனிங்
Gemma 3 1B பெட்டியிலிருந்து வெளியே ஈர்க்கக்கூடிய திறன்களை வழங்கினாலும், அதன் உண்மையான ஆற்றல் ஃபைன்-ட்யூனிங் மூலம் திறக்கப்படுகிறது. டெவலப்பர்கள் தங்கள் குறிப்பிட்ட பயன்பாட்டிற்கான செயல்திறனை மேம்படுத்தி, குறிப்பிட்ட பணிகள் மற்றும் தரவுத்தொகுப்புகளுக்கு மாதிரியை வடிவமைக்க முடியும். ஃபைன்-ட்யூனிங்கிற்கான பல முறைகளை Google வழங்குகிறது, அவற்றுள்:
- Synthetic Reasoning Datasets: இந்த தரவுத்தொகுப்புகள் மாதிரியின் பகுத்தறியும் மற்றும் சிக்கல்களைத் தீர்க்கும் திறனை மேம்படுத்த சிறப்பாக வடிவமைக்கப்பட்டுள்ளன.
- LoRA Adaptors: Low-Rank Adaptation (LoRA) என்பது மாதிரியின் அளவுருக்களின் ஒரு சிறிய துணைக்குழுவை மட்டும் மாற்றுவதன் மூலம் திறமையான ஃபைன்-ட்யூனிங்கை அனுமதிக்கும் ஒரு நுட்பமாகும். இது தனிப்பயனாக்கலுக்குத் தேவையான கணக்கீட்டு வளங்களை கணிசமாகக் குறைக்கிறது.
ஃபைன்-ட்யூனிங் செயல்முறையை எளிதாக்க, Google பயன்படுத்த தயாராக உள்ள Colab நோட்புக்கை வழங்குகிறது. இந்த ஊடாடும் சூழல், synthetic reasoning datasets மற்றும் LoRA அடாப்டர்களை எவ்வாறு இணைப்பது என்பதையும், அதன் விளைவாக வரும் மாதிரியை LiteRT வடிவத்திற்கு (முன்னர் TensorFlow Lite என அழைக்கப்பட்டது) மாற்றுவதையும் நிரூபிக்கிறது. இந்த நெறிப்படுத்தப்பட்ட பணிப்பாய்வு டெவலப்பர்கள் தங்கள் குறிப்பிட்ட தேவைகளுக்கு Gemma 3 1B ஐ விரைவாகவும் எளிதாகவும் தனிப்பயனாக்க உதவுகிறது.
மாதிரி பயன்பாடுகளுடன் நெறிப்படுத்தப்பட்ட ஒருங்கிணைப்பு
மேம்பாட்டு செயல்முறையை மேலும் எளிதாக்க, Google Android க்கான மாதிரி அரட்டை பயன்பாட்டை வெளியிட்டுள்ளது. இந்த பயன்பாடு பல்வேறு காட்சிகளில் Gemma 3 1B இன் நடைமுறை பயன்பாட்டை காட்சிப்படுத்துகிறது, அவற்றுள்:
- உரை உருவாக்கம்: சுருக்கங்கள், ஆக்கப்பூர்வமான எழுத்துத் துண்டுகள் அல்லது பயனர் தூண்டுதல்களுக்கான பதில்கள் போன்ற அசல் உரை உள்ளடக்கத்தை உருவாக்குதல்.
- தகவல் பெறுதல் மற்றும் சுருக்கம்: பெரிய ஆவணங்களிலிருந்து முக்கிய தகவல்களைப் பிரித்தெடுத்து, அதை சுருக்கமான மற்றும் புரிந்துகொள்ளக்கூடிய வடிவத்தில் வழங்குதல்.
- மின்னஞ்சல் வரைவு: சொற்றொடர்களைப் பரிந்துரைப்பதன் மூலமோ, வாக்கியங்களை முடிப்பதன் மூலமோ அல்லது சில முக்கிய வார்த்தைகளின் அடிப்படையில் முழு வரைவுகளையும் உருவாக்குவதன் மூலமோ பயனர்களுக்கு மின்னஞ்சல்களை எழுதுவதில் உதவுதல்.
Android மாதிரி பயன்பாடு, MediaPipe LLM Inference API ஐப் பயன்படுத்துகிறது, இது மொழி மாதிரிகளை மொபைல் பயன்பாடுகளில் ஒருங்கிணைப்பதற்கான ஒரு சக்திவாய்ந்த கருவியாகும். இருப்பினும், டெவலப்பர்கள் LiteRT ஸ்டேக்கை நேரடியாகப் பயன்படுத்தும் விருப்பத்தையும் கொண்டுள்ளனர், இது ஒருங்கிணைப்பு செயல்பாட்டில் அதிக நெகிழ்வுத்தன்மையையும் கட்டுப்பாட்டையும் வழங்குகிறது.
iOS க்கான இதேபோன்ற மாதிரி பயன்பாடு இன்னும் கிடைக்கவில்லை என்றாலும், புதிய மாதிரிக்கான ஆதரவை விரிவுபடுத்த Google தீவிரமாக செயல்பட்டு வருகிறது. தற்போது, Gemma 2 ஐப் பயன்படுத்தும் பழைய மாதிரி பயன்பாடு iOS டெவலப்பர்களுக்கு கிடைக்கிறது, ஆனால் அது இன்னும் MediaPipe LLM Inference API ஐப் பயன்படுத்தவில்லை.
செயல்திறன் அளவுகோல்கள்: ஒரு முன்னேற்றம்
Gemma 3 1B உடன் அடையப்பட்ட குறிப்பிடத்தக்க முன்னேற்றங்களை நிரூபிக்கும் செயல்திறன் புள்ளிவிவரங்களை Google வெளியிட்டுள்ளது. இந்த மாதிரி அதன் முன்னோடியான Gemma 2 2B ஐ விட சிறப்பாக செயல்படுகிறது, அதே நேரத்தில் வரிசைப்படுத்தல் அளவில் 20% மட்டுமே தேவைப்படுகிறது. இந்த குறிப்பிடத்தக்க முன்னேற்றம் Google பொறியாளர்களால் மேற்கொள்ளப்பட்ட விரிவான மேம்படுத்தல் முயற்சிகளுக்கு ஒரு சான்றாகும்.
முக்கிய மேம்படுத்தல் உத்திகள் பின்வருமாறு:
- Quantization-Aware Training: இந்த நுட்பம் மாதிரியின் எடைகள் மற்றும் ஆக்டிவேஷன்களின் துல்லியத்தை குறைக்கிறது, இதன் விளைவாக நினைவக தடம் சிறியதாகவும், துல்லியம் கணிசமான இழப்பு இல்லாமல் வேகமான அனுமானமும் கிடைக்கும்.
- மேம்படுத்தப்பட்ட KV Cache செயல்திறன்: Key-Value (KV) கேச் என்பது டிரான்ஸ்ஃபார்மர் மாடல்களின் ஒரு முக்கியமான அங்கமாகும், இது தலைமுறை செயல்முறையை துரிதப்படுத்த இடைநிலை கணக்கீடுகளை சேமிக்கிறது. அதன் செயல்திறனை மேம்படுத்துவது குறிப்பிடத்தக்க வேக மேம்பாடுகளுக்கு வழிவகுக்கிறது.
- Optimized Weight Layouts: மாதிரியின் எடைகளை நினைவகத்தில் கவனமாக ஒழுங்கமைப்பது ஏற்றுதல் நேரத்தைக் குறைக்கிறது மற்றும் ஒட்டுமொத்த செயல்திறனை மேம்படுத்துகிறது.
- Weight Sharing: மாதிரியின் prefill மற்றும் decode கட்டங்களில் எடைகளைப் பகிர்வது நினைவக பயன்பாடு மற்றும் கணக்கீட்டு செலவை மேலும் குறைக்கிறது.
இந்த மேம்படுத்தல்கள் பொதுவாக அனைத்து ஓபன்-வெயிட் மாடல்களுக்கும் பொருந்தும் என்றாலும், மாதிரியை இயக்கப் பயன்படுத்தப்படும் சாதனம் மற்றும் அதன் இயக்க நேர கட்டமைப்பு ஆகியவற்றைப் பொறுத்து குறிப்பிட்ட செயல்திறன் ஆதாயங்கள் மாறுபடலாம் என்பதை கவனத்தில் கொள்ள வேண்டும். CPU/GPU திறன்கள், நினைவக கிடைக்கும் தன்மை மற்றும் இயக்க முறைமை போன்ற காரணிகள் அனைத்தும் இறுதி முடிவுகளை பாதிக்கலாம்.
வன்பொருள் தேவைகள் மற்றும் கிடைக்கும் தன்மை
Gemma 3 1B குறைந்தது 4GB நினைவகம் கொண்ட மொபைல் சாதனங்களில் திறமையாக இயங்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது. இது செயலாக்கத்திற்கு CPU அல்லது GPU ஐப் பயன்படுத்தலாம், GPU பொதுவாக சிறந்த செயல்திறனை வழங்கும். இந்த மாதிரி, மெஷின் லேர்னிங் மாடல்களைப் பகிர்வதற்கும் ஒத்துழைப்பதற்கும் பிரபலமான தளமான Hugging Face இலிருந்து பதிவிறக்கம் செய்ய உடனடியாகக் கிடைக்கிறது. இது Google’ன் பயன்பாட்டு உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளது, இது அதன் பயன்பாட்டிற்கான விதிமுறைகள் மற்றும் நிபந்தனைகளை கோடிட்டுக் காட்டுகிறது.
Gemma 3 1B இன் அறிமுகம் ஆன்-டிவைஸ் AI இன் பரிணாம வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க மைல்கல்லைக் குறிக்கிறது. இதன் சிறிய அளவு, ஆஃப்லைன் திறன்கள், தனியுரிமை அம்சங்கள் மற்றும் சக்திவாய்ந்த செயல்திறன் ஆகியவை பல்வேறு வகையான மொபைல் மற்றும் வலை பயன்பாடுகளுக்கு ஏற்ற தீர்வாக அமைகின்றன. டெவலப்பர்கள் தொடர்ந்து அதன் திறனை ஆராய்வதால், Gemma 3 1B இன் நுண்ணறிவால் இயக்கப்படும் புதுமையான மற்றும் ஈர்க்கக்கூடிய பயனர் அனுபவங்களின் புதிய அலையை நாம் எதிர்பார்க்கலாம்.