ஜெம்மா 3n: AI-ன் புதிய யுகம்

Google-ன் ஜெம்மா 3n ஒரு புதிய சகாப்தத்தை உருவாக்கியுள்ளது. இந்த மாதிரி சிறியது மற்றும் வேகமானது மட்டுமின்றி, மொபைலிலும் ஆஃப்லைனில் இயங்கக்கூடியது. ஜெம்மா 3n ஆடியோ, படங்கள் மற்றும் உரையைப் புரிந்துகொள்ளும் திறன் கொண்டது. Chatbot Arena-வில் இதனுடைய செயல்பாடு GPT-4.1 Nano-வையும் மிஞ்சும் அளவிற்கு உள்ளது.

ஜெம்மா 3n-ன் புதுமையான கட்டமைப்பு

சாதன AI-யின் எதிர்காலத்தை கருத்தில் கொண்டு, Google DeepMind ஆனது Qualcomm Technologies, MediaTek மற்றும் Samsung System LSI போன்ற மொபைல் ஹார்டுவேர் நிறுவனங்களுடன் இணைந்து ஒரு புதிய கட்டமைப்பை உருவாக்கியுள்ளது.

இந்த கட்டமைப்பானது மொபைல்கள், டேப்லெட்டுகள் மற்றும் லேப்டாப்கள் போன்ற சாதனங்களில் செயல்திறனை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது. இதை அடைய மூன்று முக்கிய புதுமைகள் பயன்படுத்தப்பட்டுள்ளன: அடுக்கு-வாரியான உட்பொதிப்பு (PLE) கேச்சிங், MatFormer கட்டமைப்பு மற்றும் நிபந்தனைக்குட்பட்ட அளவுரு ஏற்றுதல்.

PLE கேச்சிங்: மெமரி வரம்புகளை மீறுதல்

PLE கேச்சிங் என்பது மாடலின் செயல்திறனை பாதிக்காத வகையில், வெளிப்புற சேமிப்பகத்திற்கு அடுக்கு-வாரியான உட்பொதிப்பு அளவுருக்களை திறம்பட மாற்றியமைக்கும் ஒரு நுட்பமாகும். இந்த அளவுருக்கள் மாடலின் செயல்பாட்டு நினைவகத்திற்கு வெளியே உருவாக்கப்படுகின்றன. மேலும் தேவைப்படும்போது மீட்டெடுக்கப்படுகின்றன. இது குறைந்த ஆதாரங்களைக் கொண்ட சாதனங்களில் கூட திறமையான செயல்பாட்டை செயல்படுத்துகிறது.

உங்களுடைய சாதனத்தில் மெமரி குறைவாக இருக்கும்போது, சிக்கலான AI மாடலை இயக்குவதாக கற்பனை செய்து பாருங்கள். PLE கேச்சிங் ஒரு அறிவார்ந்த நூலகர் போல செயல்பட்டு, பொதுவாகப் பயன்படுத்தப்படாத புத்தகங்களை (அளவுருக்கள்) அருகிலுள்ள கிடங்கில் (வெளிப்புற நினைவகம்) சேமிக்கிறது. மாடலுக்கு இந்த அளவுருக்கள் தேவைப்படும்போது, அந்த நூலகர் விரைவாக அவற்றை மீட்டெடுத்து மாடல் செயல்பட உதவுகிறார்.

PLE கேச்சிங் நினைவக பயன்பாடு மற்றும் செயல்திறனை எவ்வாறு மேம்படுத்துகிறது என்பதைப் பார்ப்போம்:

  • நினைவக பயன்பாட்டைக் குறைக்கிறது: வெளிப்புற நினைவகத்தில் வழக்கமாகப் பயன்படுத்தப்படாத அளவுருக்களை சேமிப்பதன் மூலம், PLE கேச்சிங் மாடலுக்குத் தேவையான நினைவகத்தின் அளவைக் குறைக்கிறது. இது குறைந்த ஆதாரமுள்ள சாதனங்களில் பெரிய AI மாடல்களை இயக்குவதை சாத்தியமாக்குகிறது.

  • செயல்திறனை மேம்படுத்துகிறது: வெளிப்புற நினைவகத்திலிருந்து அளவுருக்களை மீட்டெடுக்க சிறிது நேரம் தேவைப்பட்டாலும், PLE கேச்சிங் எந்த அளவுருக்கள் எதிர்காலத்தில் பயன்படுத்தப்படும் என்பதைக் கணித்து, அவற்றை முன்கூட்டியே கேச்சில் ஏற்றுவதன் மூலம் தாமதத்தை குறைக்கிறது. இது மாடல் கிட்டத்தட்ட நிகழ்நேரத்தில் இயங்குவதை உறுதி செய்கிறது.

  • பெரிய மாதிரிகளை ஆதரிக்கிறது: நினைவகத் தேவைகளைக் குறைப்பதன் மூலம், பெரிய மற்றும் சிக்கலான AI மாடல்களை உருவாக்க PLE கேச்சிங் உதவுகிறது. இந்த மாதிரிகள் அதிக திறன் கொண்டவை மற்றும் சிக்கலான பணிகளைச் செய்யக்கூடியவை.

MatFormer கட்டமைப்பு: ரஷ்ய பொம்மை போன்ற வடிவமைப்பு

Matryoshka Transformer (MatFormer) கட்டமைப்பு, சிறிய துணை-மாடல்கள் பெரிய மாதிரிகளுக்குள் உட்பொதிக்கப்பட்டிருப்பதால் ரஷ்ய பொம்மையைப் போன்ற வடிவமைப்பைக் கொண்டுள்ளது. இந்த அமைப்பு துணை-மாடல்களைத் தேர்ந்தெடுக்க செயல்படுத்துகிறது. இதனால் மாதிரி அதன் அளவு மற்றும் கணக்கீட்டுத் தேவைகளை மாறும் தன்மையுடன் சரிசெய்து கொள்ள முடியும். இந்த நெகிழ்வுத்தன்மை கணக்கீட்டுச் செலவுகள், பிரதிபலிப்பு நேரம் மற்றும் ஆற்றல் நுகர்வு ஆகியவற்றைக் குறைக்கிறது.

MatFormer கட்டமைப்பின் முக்கிய யோசனை என்னவென்றால், எல்லா பணிகளுக்கும் முழு AI மாதிரியும் தேவையில்லை. எளிய பணிகளுக்கு, சிறிய துணை-மாடலை மட்டும் செயல்படுத்தலாம். சிக்கலான பணிகளுக்கு, அதிக துல்லியத்திற்காக பெரிய துணை-மாடலை செயல்படுத்தலாம்.

MatFormer கட்டமைப்பின் நன்மைகளை ஒரு உதாரணத்தின் மூலம் விளக்கலாம். நீங்கள் படங்களிலுள்ள பொருட்களை அடையாளம் காண ஒரு AI மாதிரியைப் பயன்படுத்துகிறீர்கள் என்று வைத்துக்கொள்வோம். ஒரு பொருள் மட்டுமே உள்ள எளிய படத்திற்கு, அந்த குறிப்பிட்ட வகை பொருளை அடையாளம் காண ஒரு சிறிய துணை-மாடலை செயல்படுத்தலாம். பல பொருள்கள் உள்ள ஒரு சிக்கலான படத்திற்கு, பல்வேறு பொருட்களை அடையாளம் காணக்கூடிய ஒரு பெரிய துணை-மாடலைச் செயல்படுத்தலாம்.

MatFormer கட்டமைப்பின் நன்மைகள்:

  • கணக்கீட்டுச் செலவுகளைக் குறைக்கிறது: தேவையான துணை-மாடல்களை மட்டும் செயல்படுத்துவதன் மூலம், MatFormer கட்டமைப்பு கணக்கீட்டுச் செலவுகளைக் கணிசமாகக் குறைக்கிறது. ஆதாரங்கள் குறைவாக உள்ள சாதனங்களில் AI மாடல்களை இயக்குவதற்கு இது மிகவும் முக்கியமானது.

  • பதில் நேரத்தைக் குறைக்கிறது: MatFormer கட்டமைப்பு பணிக்கேற்ப மாடல் அளவை மாறும் தன்மையுடன் சரிசெய்வதால், பதில் நேரம் குறைகிறது. இது AI மாடலை பயனர் கோரிக்கைகளுக்கு வேகமாகப் பதிலளிக்க வைக்கிறது.

  • ஆற்றல் நுகர்வைக் குறைக்கிறது: கணக்கீட்டுச் செலவுகளைக் குறைப்பதன் மூலம், MatFormer கட்டமைப்பு ஆற்றல் நுகர்வையும் குறைக்கிறது. இது பேட்டரி ஆயுளை நீட்டிக்க அவசியமானது.

நிபந்தனை அளவுரு ஏற்றுதல்: தேவைக்கேற்ப ஏற்றுதல்

நிபந்தனை அளவுரு ஏற்றுதல் டெவலப்பர்கள் பயன்படுத்தப்படாத அளவுருக்களை பதிவேற்றுவதைத் தவிர்க்க உதவுகிறது. தேவைப்பட்டால், இந்த அளவுருக்கள் இயக்க நேரத்தில் ஏற்றப்படலாம். இது நினைவகப் பயன்பாட்டை மேலும் மேம்படுத்தவும், பல்வேறு சாதனங்கள் மற்றும் பணிகளுக்கு மாதிரியை மாற்றியமைக்கவும் உதவுகிறது.

நீங்கள் உரையைச் செயலாக்க ஒரு AI மாதிரியைப் பயன்படுத்துகிறீர்கள் என்று வைத்துக்கொள்வோம். உங்கள் பணிக்கு ஆடியோ அல்லது விஷுவல் செயலாக்கம் எதுவும் தேவையில்லை என்றால், ஆடியோ அல்லது விஷுவல் செயலாக்கத்திற்கான அளவுருக்களை ஏற்றுவது ஒரு வீண் முயற்சி. நிபந்தனை அளவுரு ஏற்றுதல் மாதிரியானது, தேவையான அளவுருக்களை மட்டும் ஏற்ற அனுமதிக்கிறது. இதன் மூலம் நினைவக பயன்பாடு குறைக்கப்பட்டுச் செயல்திறன் மேம்படுத்தப்படுகிறது.

நிபந்தனை அளவுரு ஏற்றுதல் எவ்வாறு செயல்படுகிறது:

  1. மாடல் தற்போதைய பணியை பகுப்பாய்வு செய்து, எந்த அளவுருக்கள் தேவை என்பதை தீர்மானிக்கிறது.
  2. தேவையான அளவுருக்களை மட்டுமே மாடல் நினைவகத்தில் ஏற்றுகிறது.
  3. பணி முடிந்ததும், மாடல் இனி தேவைப்படாத அளவுருக்களை விடுவிக்கிறது.

நிபந்தனை அளவுரு ஏற்றுதலின் நன்மைகள்:

  • நினைவக பயன்பாட்டை மேம்படுத்துகிறது: தேவையான அளவுருக்களை மட்டும் ஏற்றுவதன் மூலம், நிபந்தனை அளவுரு ஏற்றுதல் நினைவகப் பயன்பாட்டை கணிசமாக மேம்படுத்துகிறது. ஆதாரங்கள் குறைவாக உள்ள சாதனங்களில் AI மாடல்களை இயக்குவது மிகவும் முக்கியமானது.

  • செயல்திறனை அதிகரிக்கிறது: ஏற்றப்படும் அளவுருக்களின் எண்ணிக்கையைக் குறைப்பதன் மூலம், நிபந்தனை அளவுரு ஏற்றுதல் செயல்திறனை அதிகரிக்கும். இது Al மாடல்களை பயனர் கோரிக்கைகளுக்கு வேகமாகப் பதிலளிக்க வைக்கிறது.

  • பரந்த சாதனங்களை ஆதரிக்கிறது: நினைவகப் பயன்பாட்டை மேம்படுத்துவதன் மூலம், Al மாடல்களை நினைவகம் குறைவாக உள்ள சாதனங்கள் உட்பட பரந்த அளவிலான சாதனங்களில் இயக்க முடியும்.

ஜெம்மா 3n-ன் சிறப்பான அம்சங்கள்

ஜெம்மா 3n பல புதுமையான தொழில்நுட்பங்களையும் அம்சங்களையும் அறிமுகப்படுத்துகிறது. இவை சாதன AI-ன் சாத்தியக்கூறுகளை மறுவரையறை செய்கின்றன.

முக்கிய செயல்பாடுகளைப் பற்றி பார்ப்போம்:

  1. சாதன செயல்திறன் மற்றும் திறன்: ஜெம்மா 3n அதன் முந்தைய பதிப்பான ஜெம்மா 3 4B-ஐ விட 1.5 மடங்கு வேகமானது. அதே நேரத்தில் அதிக வெளியீட்டுத் தரத்தையும் பராமரிக்கிறது. அதாவது, கிளவுட் இணைப்பு இல்லாமல் சாதனத்தில் வேகமான மற்றும் துல்லியமான முடிவுகளைப் பெற முடியும்.

  2. PLE கேச்சிங்: PLE கேச்சிங் அமைப்பு ஜெம்மா 3n அளவுருக்களை வேகமான உள்ளூர் நினைவகத்தில் சேமிக்க உதவுகிறது. இது நினைவக వినియోగத்தைக் குறைத்து செயல்திறனை மேம்படுத்துகிறது.

  3. MatFormer கட்டமைப்பு: ஜெம்மா 3n, MatFormer கட்டமைப்பைப் பயன்படுத்துகிறது. இந்த கட்டமைப்பு குறிப்பிட்ட கோரிக்கைகளின் அடிப்படையில் மாதிரி அளவுருக்களைத் தேர்ந்தெடுத்துச் செயல்படுத்துகிறது. இதன் மூலம் மாடல் அதன் அளவு மற்றும் கணக்கீட்டுத் தேவைகளை மாற்றியமைத்து, ஆதாரங்களைச் சிறப்பாகப் பயன்படுத்துகிறது.

  4. நிபந்தனை அளவுரு ஏற்றுதல்: நினைவகச் செலவைக் குறைப்பதற்காக, ஜெம்மா 3n தேவையற்ற அளவுருக்களை ஏற்றாமல் தவிர்க்கலாம். எடுத்துக்காட்டாக, விஷுவல் அல்லது ஆடியோ தேவையில்லை என்றால், அது தொடர்பான அளவுருக்களை ஏற்றத் தேவையில்லை. இது திறனை மேம்படுத்துகிறது.

  5. தனியுரிமை மற்றும் ஆஃப்லைன்: இணைய இணைப்பு இல்லாமலேயே AI அம்சங்களை இயக்கலாம். பயனர் தனியுரிமை உறுதி செய்யப்படுகிறது. இதன் பொருள் உங்கள் தரவு உங்கள் சாதனத்தை விட்டு வெளியேறாது. மேலும் நெட்வொர்க் இணைப்பு இல்லாமல் AI அம்சங்களைப் பயன்படுத்திக் கொள்ள முடியும்.

  6. பன்முகப் புரிதல்: ஜெம்மா 3n ஆடியோ, உரை, படங்கள் மற்றும் வீடியோ உள்ளீடுகளுக்கு மேம்பட்ட ஆதரவை வழங்குகிறது. இது சிக்கலான, நிகழ்நேர மற்றும் பன்முகத் தொடர்புகளைச் செயல்படுத்துகிறது. Al மாதிரிகள் பல்வேறு உள்ளீடுகளைப் புரிந்துகொண்டு பதிலளிக்க உதவுகிறது. மேலும் இயல்பான பயனர் அனுபவத்தை வழங்குகிறது.

  7. ஆடியோ செயல்பாடு: தானியங்கி பேச்சு அங்கீகாரம் (ASR) மற்றும் பேச்சு-உரை மொழிபெயர்ப்பு ஆகியவற்றை வழங்குகிறது. இது பல மொழி ஆதரவுடன் உயர்தர டிரான்ஸ்கிரிப்ஷனையும் வழங்குகிறது. ஜெம்மா 3n பேசும் சொற்களை எழுத்துக்களாக மாற்றவும், ஒரு மொழியின் பேச்சை மற்றொரு மொழிக்கு மொழிபெயர்க்கவும் உதவுகிறது.

  8. பன்மொழித் திறன் மேம்பாடு: ஜப்பானியம், ஜெர்மன், கொரியன், ஸ்பானிஷ் மற்றும் பிரெஞ்சு போன்ற மொழிகளில் செயல்திறன் கணிசமாக மேம்படுத்தப்பட்டுள்ளது. இதனால் ஜெம்மா 3n பல்வேறு மொழிகளைத் துல்லியமாகப் புரிந்துகொள்ளவும், உரையை உருவாக்கவும் முடியும்.

  9. 32K டோக்கன் சூழல்: ஒரு கோரிக்கையில் பெரிய அளவிலான தரவைப் பயன்படுத்த உதவுகிறது. நீண்ட உரையாடல்கள் மற்றும் சிக்கலான பணிகளைச் செய்ய உதவுகிறது.

ஜெம்மா 3n-ஐ விரைவாகப் பயன்படுத்துவது எப்படி?

ஜெம்மா 3n-ஐப் பயன்படுத்துவது மிகவும் எளிதானது, டெவலப்பர்கள் சக்திவாய்ந்த மாதிரியை ஆராயவும் ஒருங்கிணைக்கவும் இரண்டு வழிகள் உள்ளன.

1. Google AI Studio: விரைவான முன்மாதிரி

Google Al Studio-வில் உள்நுழைந்து, ஸ்டுடியோவிற்குச் சென்று, Gemma 3n E4B மாதிரியைத் தேர்ந்தெடுக்கவும். முழுமையாகச் செயல்படுத்துவதற்கு முன்பு யோசனைகளை விரைவாக சோதிக்கவும் முன்மாதிரிகளை உருவாக்கவும் இந்த ஸ்டுடியோ உதவுகிறது.

நீங்கள் API விசையைப் பெற்று, உங்கள் உள்ளூர் AI சாட்போட்டுடன் மாதிரியை ஒருங்கிணைக்கலாம், குறிப்பாக Msty பயன்பாட்டின் மூலம்.

Google GenAl பைதான் SDK-ஐ பயன்படுத்தலாம். இதன் மூலம் உங்கள் அப்ளிகேஷனில் மாதிரியை ஒருங்கிணைக்க முடியும்.

2. Google AI Edge-ஐ பயன்படுத்தி சாதன மேம்பாடு: உள்நாட்டில் அப்ளிகேஷன்களை உருவாக்குதல்

டெவலப்பர்கள் ஜெம்மா 3n-ஐ தங்கள் அப்ளிகேஷனில் நேரடியாக ஒருங்கிணைக்க விரும்பினால், Android மற்றும் Chrome சாதனங்களில் சாதன மேம்பாட்டிற்கு தேவையான கருவிகள் மற்றும் லைப்ரரிகளை Google Al Edge வழங்குகிறது.

Google Al Edge பல்வேறு கருவிகள் மற்றும் தொகுப்புகளை வழங்குகிறது. அவை டெவலப்பர்கள் ஜெம்மா 3n-ஐ தங்கள் அப்ளிகேஷன்களில் எளிதாக ஒருங்கிணைக்க உதவுகின்றன. இந்த கருவிகளில் அடங்குபவை:

  • TensorFlow Lite: மொபைல் சாதனங்களில் AI மாதிரிகளை இயக்க ஒரு எளிய கட்டமைப்பு.
  • ML Kit: மொபைல் அப்ளிகேஷன்களில் மெஷின் லேர்னிங் அம்சங்களைச் சேர்க்க API-களின் தொகுப்பு.
  • Android Neural Networks API (NNAPI): சாதனத்தில் ஹார்டுவேர் ஆக்சலரேட்டர்களைப் பயன்படுத்தி AI மாதிரிகளை இயக்க API.

Google AI Edge-ஐப் பயன்படுத்துவதன் மூலம், டெவலப்பர்கள் பல்வேறு புதுமையான அப்ளிகேஷன்களை உருவாக்க முடியும்:

  • ஆஃப்லைன் பேச்சு அங்கீகாரம்: இணைய இணைப்பு இல்லாமல் சாதனத்தைக் குரல் கட்டளை மூலம் கட்டுப்படுத்த அனுமதிக்கிறது.
  • நிகழ்நேர பட அங்கீகாரம்: படத்தை கிளவுடில் பதிவேற்றாமல் படங்களில் இருக்கும் பொருட்களை அடையாளம் காண அனுமதிக்கிறது.
  • ஸ்மார்ட் உரை உருவாக்கம்: மின்னஞ்சல்கள், கட்டுரைகள் மற்றும் குறியீடு போன்ற பல்வேறு வகையான உரைகளை உருவாக்க அனுமதிக்கிறது.