Gemma 3n: சாதனத்தில் AI புரட்சி

சாதனத்துக்குரிய AI-ல் Google DeepMind-இன் ஜெம்மா 3n: ஒரு புரட்சி

தனிப்பட்ட சாதனங்களில் வேகமான, சிறந்த, மற்றும் அதிக பாதுகாப்பான செயற்கை நுண்ணறிவைத் (AI) தொடர்ச்சியாகப் பின்தொடர்வது, AI மாதிரிகள் எவ்வாறு வடிவமைக்கப்பட்டு பயன்படுத்தப்படுகின்றன என்பதில் ஒரு ஆழமான மாற்றத்தை ஏற்படுத்துகிறது. நாம் ஒரு புதிய சகாப்தத்தில் நுழைந்து கொண்டிருக்கிறோம், அங்கு AI ஒரு தொலைதூர சேவை மட்டுமல்ல; அது நேரடியாக நமது தொலைபேசிகள், டேப்லெட்டுகள் மற்றும் லேப்டாப்களில் உட்பொதிக்கப்பட்ட உள்ளூர் நுண்ணறிவு ஆகும். இந்த மாற்றம் கிட்டத்தட்ட உடனடி பதிலளிக்கும் திறனையும், கணிசமாகக் குறைக்கப்பட்ட நினைவகத் தேவைகளையும், பயனர் தனியுரிமைக்கு ஒரு புதிய முக்கியத்துவத்தையும் உறுதியளிக்கிறது. மொபைல் ஹார்ட்வேர் தொடர்ந்து வேகமாக வளர்ச்சியடைந்து வருவதால், நமது அன்றாட டிஜிட்டல் தொடர்புகளை மறுவரையறை செய்யக்கூடிய சிறிய, மின்னல் வேக மாதிரிகளை உருவாக்குவதில் கவனம் செலுத்தப்படுகிறது.

சாதனத்துக்குரிய பல்லூடக AI-ன் சவால்

இந்த முயற்சியில் உள்ள மிக முக்கியமான தடைகளில் ஒன்று, மொபைல் சாதனங்களின் வள-கட்டுப்படுத்தப்பட்ட சூழல்களில் உயர்தர, பல்லூடக AI-ஐ வழங்குவதாகும். பரந்த கணக்கீட்டு சக்தியிலிருந்து பயனடையும் கிளவுட் அடிப்படையிலான அமைப்புகளைப் போலல்லாமல், சாதனத்துக்குரிய மாதிரிகள் RAM மற்றும் செயலாக்கத் திறனில் கடுமையான வரம்புகளுடன் செயல்பட வேண்டும். பல்லூடக AI என்பது உரை, படங்கள், ஆடியோ மற்றும் வீடியோவை விளக்கும் திறனைக் கொண்டுள்ளது, மேலும் இது பொதுவாக பெரும்பாலான மொபைல் சாதனங்களை மூழ்கடிக்கக்கூடிய பெரிய மாதிரிகள் தேவைப்படுகின்றன. மேலும், கிளவுடை நம்பியிருப்பது தாமதம் மற்றும் தனியுரிமை கவலைகளை அறிமுகப்படுத்துகிறது, எனவே செயல்திறனை சமரசம் செய்யாமல் உள்நாட்டில் இயங்கும் மாதிரிகள் தேவைப்படுகின்றன.

ஜெம்மா 3n: மொபைல் AI-ல் ஒரு முன்னோக்கி பாய்ச்சல்

இந்த சவால்களை எதிர்கொள்ள, Google மற்றும் Google DeepMind ஆகியவை ஜெம்மா 3n ஐ அறிமுகப்படுத்தியுள்ளன, இது மொபைல்-முதல் பயன்பாட்டிற்காக வடிவமைக்கப்பட்ட ஒரு அற்புதமான AI மாதிரி. ஜெம்மா 3n ஆண்ட்ராய்டு மற்றும் Chrome தளங்களில் செயல்திறனுக்காக மேம்படுத்தப்பட்டுள்ளது மற்றும் ஜெமினி நானோவின் அடுத்த மறு செய்கைக்கு அடிப்படையாக விளங்குகிறது. இந்த கண்டுபிடிப்பு ஒரு கணிசமான முன்னேற்றத்தைக் குறிக்கிறது, இது மிகச் சிறிய நினைவகத் தடயங்களைக் கொண்ட சாதனங்களுக்கு பல்லூடக AI திறன்களைக் கொண்டுவருகிறது, அதே நேரத்தில் நிகழ்நேர பதில் நேரங்களையும் பராமரிக்கிறது. மேலும், இது இந்த பகிரப்பட்ட உள்கட்டமைப்பில் கட்டமைக்கப்பட்ட முதல் திறந்த மாதிரி, இது சோதனைக்கு உடனடி அணுகலை உருவாக்குநர்களுக்கு வழங்குகிறது.

அடுக்கு-ஒருமைப்புகள் (PLE): ஒரு முக்கிய கண்டுபிடிப்பு

ஜெம்மா 3n-ன் இதயத்தில் பர்-லேயர் எம்பேடிங்ஸ் (PLE) பயன்பாடு உள்ளது, இது RAM பயன்பாட்டைக் குறைக்கும் ஒரு நுட்பமாகும். மூல மாதிரி அளவுகள் முறையே 5 பில்லியன் மற்றும் 8 பில்லியன் அளவுருக்கள் என்றாலும், அவை 2 பில்லியன் மற்றும் 4 பில்லியன் அளவுரு மாதிரிகளுக்குச் சமமான நினைவக தடயங்களுடன் செயல்படுகின்றன. டைனமிக் நினைவக நுகர்வு 5B மாதிரிக்கு 2GB மற்றும் 8B பதிப்பிற்கு 3GB மட்டுமே. இது ஒரு நெஸ்டட் மாதிரி உள்ளமைவின் மூலம் அடையப்படுகிறது, அங்கு 4B செயலில் உள்ள நினைவக தடய மாதிரி MatFormer எனப்படும் முறையைப் பயன்படுத்தி பயிற்சி செய்யப்பட்ட 2B துணை மாதிரியைக் கொண்டுள்ளது. இது தனித்தனி மாதிரிகளை ஏற்ற வேண்டிய அவசியமின்றி டெவலப்பர்கள் செயல்திறன் முறைகளை மாறும் வகையில் மாற்ற அனுமதிக்கிறது. KVC பகிர்வு மற்றும் ஆக்டிவேஷன் குவாண்ட்டிசேஷன் போன்ற மேலும் மேம்பாடுகள், தாமதத்தைக் குறைத்து பதில் வேகத்தை விரைவுபடுத்துகின்றன. உதாரணமாக, ஜெம்மா 3 4B உடன் ஒப்பிடும்போது மொபைலில் பதில் நேரம் 1.5x மேம்பட்டுள்ளது, அதே நேரத்தில் சிறந்த வெளியீட்டு தரத்தையும் பராமரிக்கிறது.

செயல்திறன் தரநிலைகள்

ஜெம்மா 3n ஆல் அடையப்பட்ட செயல்திறன் அளவீடுகள் மொபைல் பயன்பாட்டிற்கு அதன் பொருத்தத்தை எடுத்துக்காட்டுகின்றன. இது தானியங்கி பேச்சு அங்கீகாரம் மற்றும் மொழிபெயர்ப்பு போன்ற பணிகளில் சிறந்து விளங்குகிறது, பேச்சு மொழிபெயர்க்கப்பட்ட உரையாக தடையின்றி மாற்ற உதவுகிறது. WMT24++ (ChrF) போன்ற பன்மொழி தரநிலைகளில், இது 50.1% மதிப்பெண்ணை அடைகிறது, இது ஜப்பானீஸ், ஜெர்மன், கொரியன், ஸ்பானிஷ் மற்றும் பிரெஞ்சு போன்ற மொழிகளில் அதன் வலிமையைக் காட்டுகிறது. இதன் “mix’n’match” திறன் பல்வேறு தரம் மற்றும் தாமத கலவைகளுக்காக மேம்படுத்தப்பட்ட துணை மாதிரிகளை உருவாக்க உதவுகிறது, இது உருவாக்குநர்களுக்கு இன்னும் அதிகமான தனிப்பயனாக்கத்தை வழங்குகிறது.

பல்லூடக திறன்கள் மற்றும் பயன்பாடுகள்

ஜெம்மா 3n-ன் கட்டமைப்பானது உரை, ஆடியோ, படங்கள் மற்றும் வீடியோ உட்பட பல்வேறு முறைகளிலிருந்து இடைவிடாத உள்ளீடுகளை ஆதரிக்கிறது, இது மிகவும் இயற்கையான மற்றும் சூழல் நிறைந்த தொடர்புகளுக்கு அனுமதிக்கிறது. இது ஆஃப்லைனிலும் இயங்க முடியும், இது நெட்வொர்க் இணைப்பு இல்லாமல் தனியுரிமை மற்றும் நம்பகத்தன்மையை உறுதி செய்கிறது. சாத்தியமான பயன்பாட்டு நிகழ்வுகள் பரந்தவை, இதில்:

  • நேரடி காட்சி மற்றும் செவிவழி பின்னூட்டம்: காட்சி மற்றும் செவிவழி சேனல்கள் இரண்டின் வழியாகவும் பயனர் உள்ளீட்டிற்கு நிகழ்நேர பதில்களை வழங்குகிறது.
  • சூழல்-அறிந்த உள்ளடக்க உருவாக்கம்: பயனர் தற்போதைய சூழலின் அடிப்படையில் வடிவமைக்கப்பட்ட உள்ளடக்கத்தை உருவாக்குதல், பல்வேறு சென்சார் உள்ளீடுகளால் தீர்மானிக்கப்படுகிறது.
  • மேம்பட்ட குரல் அடிப்படையிலான பயன்பாடுகள்: மிகவும் அதிநவீன குரல் தொடர்புகள் மற்றும் கட்டுப்பாட்டை செயல்படுத்துகிறது.

ஜெம்மா 3n-ன் முக்கிய அம்சங்கள்

ஜெம்மா 3n பல்வேறு அம்சங்களை உள்ளடக்கியது, இதில்:

  • மொபைல்-முதல் வடிவமைப்பு: உகந்த மொபைல் செயல்திறனுக்காக Google, DeepMind, Qualcomm, MediaTek மற்றும் Samsung System LSI ஆகியவற்றுக்கு இடையேயான ஒத்துழைப்பு மூலம் உருவாக்கப்பட்டது.
  • குறைக்கப்பட்ட நினைவக தடயம்: பர்-லேயர் எம்பேடிங்ஸ் (PLE) ஐப் பயன்படுத்தி முறையே 5B மற்றும் 8B அளவுரு மாதிரிகளுக்கு 2GB மற்றும் 3GB പ്രവർത്തനத் தடயங்களை அடைகிறது.
  • மேம்படுத்தப்பட்ட பதில் நேரம்: ജെమ్മാ 3 4B உடன் ஒப்பிடும்போது மொபைலில் 1.5x வேகமான பதிலை அளிக்கிறது.
  • பன்மொழி திறன்: WMT24++ (ChrF) இல் 50.1% பன்மொழி தரநிலை ஸ்கோரை அடைகிறது.
  • பல்லூடக உள்ளீடு: ஆடியோ, உரை, படம் மற்றும் வீடியோவை ஏற்றுக்கொண்டு புரிந்துகொள்கிறது, சிக்கலான மல்டிமாடல் செயலாக்கம் மற்றும் இடைவிடாத உள்ளீடுகளை செயல்படுத்துகிறது.
  • டைனமிக் துணை மாதிரிகள்: நெஸ்டட் துணை மாதிரிகள் மற்றும் mix’n’match திறன்களுடன் MatFormer பயிற்சியைப் பயன்படுத்தி டைனமிக் வர்த்தகங்களை ஆதரிக்கிறது.
  • ஆஃப்லைன் செயல்பாடு: இணைய இணைப்பு இல்லாமல் செயல்படுகிறது, தனியுரிமை மற்றும் நம்பகத்தன்மையை உறுதி செய்கிறது.
  • எளிதான அணுகல் Google AI ஸ்டுடியோ மற்றும் Google AI Edge மூலம் கிடைக்கிறது, உரை மற்றும் பட செயலாக்க திறன்களுடன்.

தாக்கங்கள் மற்றும் எதிர்கால திசைகள்

ஜெம்மா 3n அதிக செயல்திறன் கொண்ட AI-ஐ எடுத்துச் செல்லக்கூடியதாகவும் தனிப்பட்டதாகவும் மாற்றுவதற்கான ஒரு தெளிவான பாதையை வழங்குகிறது. புதுமையான கட்டமைப்பின் மூலம் RAM வரம்புகளை நிவர்த்தி செய்து, பன்மொழி மற்றும் பல்லூடக திறன்களை மேம்படுத்துவதன் மூலம், ஆராய்ச்சியாளர்கள் மேம்பட்ட AI-ஐ அன்றாட சாதனங்களுக்கு நேரடியாகக் கொண்டுவருவதற்கான சாத்தியமான தீர்வை உருவாக்கியுள்ளனர். நெகிழ்வான துணை மாடல் மாறுதல், ஆஃப்லைன் தயார்நிலை மற்றும் வேகமான प्रतिसाद நேரங்கள் ஆகியவை மொபைல்-முதல் AI க்கான ஒரு விரிவான அணுகுமுறையை பிரதிபலிக்கின்றன. எதிர்கால ஆராய்ச்சி மாதிரியின் திறன்களை மேம்படுத்துவதிலும், பரந்த அளவிலான சாதனங்களுடன் அதன் இணக்கத்தன்மையை விரிவுபடுத்துவதிலும், ஆக்மென்டட் ரியாலிட்டி, ரோபாட்டிக்ஸ் மற்றும் IoT போன்ற பகுதிகளில் புதிய பயன்பாடுகளை ஆராய்வதிலும் கவனம் செலுத்தக்கூடும்.