Google DeepMind ਵੱਲੋਂ Gemma 3n ਦਾ ਖੁਲਾਸਾ

ਮੋਬਾਈਲ ਉੱਤੇ ਤੇਜ਼, ਚੁਸਤ ਅਤੇ ਵੱਧ ਨਿੱਜੀ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਨੂੰ ਲਿਆਉਣ ਦੀ ਨਿਰੰਤਰ ਕੋਸ਼ਿਸ਼ AI ਮਾਡਲਾਂ ਦੇ ਡਿਜ਼ਾਈਨ ਅਤੇ ਤਾਇਨਾਤੀ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਤਬਦੀਲੀ ਲਿਆ ਰਹੀ ਹੈ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਯੁੱਗ ਵਿੱਚ ਦਾਖਲ ਹੋ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI ਸਿਰਫ਼ ਇੱਕ ਰਿਮੋਟ ਸੇਵਾ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਸਥਾਨਕ ਬੁੱਧੀ ਹੈ ਜੋ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਸਾਡੇ ਫ਼ੋਨਾਂ, ਟੈਬਲੇਟਾਂ ਅਤੇ ਲੈਪਟਾਪਾਂ ਵਿੱਚ ਸਥਾਪਿਤ ਕੀਤੀ ਗਈ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਤੁਰੰਤ ਜਵਾਬਦੇਹੀ, ਘੱਟ ਮੈਮੋਰੀ ਦੀ ਮੰਗ ਅਤੇ ਉਪਭੋਗਤਾ ਦੀ ਨਿੱਜਤਾ ‘ਤੇ ਨਵੇਂ ਸਿਰੇ ਤੋਂ ਜ਼ੋਰ ਦੇਣ ਦਾ ਵਾਅਦਾ ਕਰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ ਮੋਬਾਈਲ ਹਾਰਡਵੇਅਰ ਦਾ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਾਸ ਜਾਰੀ ਹੈ, ਧਿਆਨ ਸੰਖੇਪ, ਬਿਜਲੀ ਦੀ ਗਤੀ ਵਾਲੇ ਮਾਡਲ ਬਣਾਉਣ ‘ਤੇ ਹੈ ਜੋ ਸਾਡੀਆਂ ਰੋਜ਼ਾਨਾ ਡਿਜੀਟਲ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹਨ।

ਆਨ-ਡਿਵਾਈਸ ਮਲਟੀਮੋਡਲ AI ਦੀ ਚੁਣੌਤੀ

ਇਸ ਕੋਸ਼ਿਸ਼ ਵਿੱਚ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਰੁਕਾਵਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਮੋਬਾਈਲ ਡਿਵਾਈਸਾਂ ਦੇ ਸੀਮਤ ਸਰੋਤ ਵਾਲੇ ਵਾਤਾਵਰਣ ਵਿੱਚ ਉੱਚ-ਗੁਣਵੱਤਾ, ਮਲਟੀਮੋਡਲ AI ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ। ਕਲਾਉਡ-ਬੇਸਡ ਸਿਸਟਮਾਂ ਦੇ ਉਲਟ, ਜੋ ਕਿ ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸ਼ਕਤੀ ਤੋਂ ਲਾਭ ਉਠਾਉਂਦੇ ਹਨ, ਆਨ-ਡਿਵਾਈਸ ਮਾਡਲਾਂ ਨੂੰ RAM ਅਤੇ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾ ‘ਤੇ ਸਖ਼ਤ ਸੀਮਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਮਲਟੀਮੋਡਲ AI, ਜਿਸ ਵਿੱਚ ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ ਅਤੇ ਵੀਡੀਓ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸ਼ਾਮਲ ਹੈ, ਆਮ ਤੌਰ ‘ਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਜ਼ਿਆਦਾਤਰ ਮੋਬਾਈਲ ਡਿਵਾਈਸਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦੇ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕਲਾਉਡ ‘ਤੇ ਨਿਰਭਰਤਾ ਲੇਟੈਂਸੀ ਅਤੇ ਨਿੱਜਤਾ ਸੰਬੰਧੀ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦੀ ਹੈ, ਇਸ ਲਈ ਅਜਿਹੇ ਮਾਡਲਾਂ ਦੀ ਲੋੜ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਜੋ ਪ੍ਰਦਰਸ਼ਨ ਨਾਲ ਸਮਝੌਤਾ ਕੀਤੇ ਬਿਨਾਂ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚੱਲਣ ਦੇ ਸਮਰੱਥ ਹੋਣ।

Gemma 3n: ਮੋਬਾਈਲ AI ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਕਦਮ

ਇਹਨਾਂ ਚੁਣੌਤੀਆਂ ਦਾ ਹੱਲ ਕਰਨ ਲਈ, Google ਅਤੇ Google DeepMind ਨੇ Gemma 3n ਪੇਸ਼ ਕੀਤਾ ਹੈ, ਇੱਕ ਗਰਾਊਂਡਬ੍ਰੇਕਿੰਗ AI ਮਾਡਲ ਜੋ ਖਾਸ ਤੌਰ ‘ਤੇ ਮੋਬਾਈਲ-ਫਸਟ ਤਾਇਨਾਤੀ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ। Gemma 3n ਨੂੰ Android ਅਤੇ Chrome ਪਲੇਟਫਾਰਮਾਂ ‘ਤੇ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਗਿਆ ਹੈ ਅਤੇ ਇਹ Gemini Nano ਦੇ ਅਗਲੇ ਦੁਹਰਾਓ ਲਈ ਇੱਕ ਬੁਨਿਆਦ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਹ ਨਵੀਨਤਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਮਲਟੀਮੋਡਲ AI ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਬਹੁਤ ਛੋਟੇ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਵਾਲੇ ਡਿਵਾਈਸਾਂ ਵਿੱਚ ਲਿਆਉਂਦੀ ਹੈ ਅਤੇ ਨਾਲ ਹੀ ਰੀਅਲ-ਟਾਈਮ ਜਵਾਬੀ ਸਮੇਂ ਨੂੰ ਵੀ ਬਰਕਰਾਰ ਰੱਖਦੀ ਹੈ। ਇਹ ਇਸ ਸਾਂਝੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਬਣਾਇਆ ਗਿਆ ਪਹਿਲਾ ਖੁੱਲਾ ਮਾਡਲ ਵੀ ਹੈ, ਜੋ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਪ੍ਰਯੋਗ ਲਈ ਤੁਰੰਤ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਪਰ-ਲੇਅਰ ਐਮਬੈਡਿੰਗਜ਼ (PLE): ਇੱਕ ਮੁੱਖ ਨਵੀਨਤਾ

Gemma 3n ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਪਰ-ਲੇਅਰ ਐਮਬੈਡਿੰਗਜ਼ (PLE) ਦੀ ਐਪਲੀਕੇਸ਼ਨ ਹੈ, ਇੱਕ ਤਕਨੀਕ ਜੋ RAM ਦੀ ਵਰਤੋਂ ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਘਟਾਉਂਦੀ ਹੈ। ਜਦੋਂ ਕਿ ਕੱਚੇ ਮਾਡਲ ਦਾ ਆਕਾਰ ਕ੍ਰਮਵਾਰ 5 ਬਿਲੀਅਨ ਅਤੇ 8 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਨ, ਉਹ 2 ਬਿਲੀਅਨ ਅਤੇ 4 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ। ਡਾਇਨਾਮਿਕ ਮੈਮੋਰੀ ਦੀ ਖਪਤ 5B ਮਾਡਲ ਲਈ ਸਿਰਫ਼ 2GB ਅਤੇ 8B ਵਰਜ਼ਨ ਲਈ 3GB ਹੈ। ਇਹ ਇੱਕ ਨੇਸਟਡ ਮਾਡਲ ਕੌਂਫਿਗਰੇਸ਼ਨ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਜਿੱਥੇ ਇੱਕ 4B ਐਕਟਿਵ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਮਾਡਲ ਵਿੱਚ MatFormer ਨਾਮਕ ਇੱਕ ਵਿਧੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਇੱਕ 2B ਸਬਮਾਡਲ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਵੱਖਰੇ ਮਾਡਲਾਂ ਨੂੰ ਲੋਡ ਕੀਤੇ ਬਿਨਾਂ ਪ੍ਰਦਰਸ਼ਨ ਮੋਡਾਂ ਨੂੰ ਗਤੀਸ਼ੀਲ ਰੂਪ ਨਾਲ ਬਦਲਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਹੋਰ ਸੁਧਾਰ, ਜਿਵੇਂ ਕਿ KVC ਸ਼ੇਅਰਿੰਗ ਅਤੇ ਐਕਟੀਵੇਸ਼ਨ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ, ਲੇਟੈਂਸੀ ਨੂੰ ਹੋਰ ਘਟਾਉਂਦੇ ਹਨ ਅਤੇ ਜਵਾਬੀ ਗਤੀ ਨੂੰ ਤੇਜ਼ ਕਰਦੇ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਮੋਬਾਈਲ ‘ਤੇ ਜਵਾਬੀ ਸਮਾਂ Gemma 3 4B ਦੇ ਮੁਕਾਬਲੇ 1.5 ਗੁਣਾ ਸੁਧਾਰਿਆ ਗਿਆ ਹੈ, ਇਹ ਸਭ ਵਧੀਆ ਆਉਟਪੁੱਟ ਗੁਣਵੱਤਾ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹੋਏ।

ਪ੍ਰਦਰਸ਼ਨ ਬੈਂਚਮਾਰਕ

Gemma 3n ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੇ ਪ੍ਰਦਰਸ਼ਨ ਮੈਟ੍ਰਿਕਸ ਮੋਬਾਈਲ ਤਾਇਨਾਤੀ ਲਈ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਨ। ਇਹ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ ਅਤੇ ਅਨੁਵਾਦ ਵਰਗੇ ਕੰਮਾਂ ਵਿੱਚ ਉੱਤਮ ਹੈ, ਜੋ ਸਪੀਚ ਨੂੰ ਅਨੁਵਾਦ ਕੀਤੇ ਟੈਕਸਟ ਵਿੱਚ ਸਹਿਜ ਰੂਪਾਂਤਰਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ। WMT24++ (ChrF) ਵਰਗੇ ਬਹੁਭਾਸ਼ਾਈ ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ, ਇਹ 50.1% ਦਾ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਜੋ ਜਾਪਾਨੀ, ਜਰਮਨ, ਕੋਰੀਅਨ, ਸਪੈਨਿਸ਼ ਅਤੇ ਫ੍ਰੈਂਚ ਵਰਗੀਆਂ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਇਸਦੀ ਤਾਕਤ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਸਦੀ "ਮਿਕਸ’ਨ’ਮੈਚ" ਸਮਰੱਥਾ ਵੱਖ-ਵੱਖ ਗੁਣਵੱਤਾ ਅਤੇ ਲੇਟੈਂਸੀ ਸੰਜੋਗਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਸਬਮਾਡਲ ਬਣਾਉਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ, ਜੋ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਹੋਰ ਵੀ ਜ਼ਿਆਦਾ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀ ਹੈ।

ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ

Gemma 3n ਦਾ ਆਰਕੀਟੈਕਚਰ ਵੱਖ-ਵੱਖ ਮੋਡੈਲਿਟੀਆਂ ਤੋਂ ਇੰਟਰਲੀਵਡ ਇਨਪੁਟ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਟੈਕਸਟ, ਆਡੀਓ, ਚਿੱਤਰ ਅਤੇ ਵੀਡੀਓ ਸ਼ਾਮਲ ਹਨ, ਜਿਸ ਨਾਲ ਵਧੇਰੇ ਕੁਦਰਤੀ ਅਤੇ ਸੰਦਰਭ-ਅਮੀਰ ਗੱਲਬਾਤ ਹੁੰਦੀ ਹੈ। ਇਹ ਔਫਲਾਈਨ ਵੀ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ, ਨੈੱਟਵਰਕ ਕਨੈਕਟੀਵਿਟੀ ਤੋਂ ਬਿਨਾਂ ਵੀ ਨਿੱਜਤਾ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ। ਸੰਭਾਵੀ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਵਿਸ਼ਾਲ ਹਨ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • ਲਾਈਵ ਵਿਜ਼ੂਅਲ ਅਤੇ ਆਡੀਟੋਰੀ ਫੀਡਬੈਕ: ਵਿਜ਼ੂਅਲ ਅਤੇ ਆਡੀਟੋਰੀ ਦੋਵਾਂ ਚੈਨਲਾਂ ਰਾਹੀਂ ਉਪਭੋਗਤਾ ਇਨਪੁਟਸ ‘ਤੇ ਰੀਅਲ-ਟਾਈਮ ਜਵਾਬ ਪ੍ਰਦਾਨ ਕਰਨਾ।
  • ਸੰਦਰਭ-ਜਾਣੂ ਸਮੱਗਰੀ ਉਤਪਾਦਨ: ਉਪਭੋਗਤਾ ਦੇ ਮੌਜੂਦਾ ਸੰਦਰਭ ਦੇ ਆਧਾਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੀ ਗਈ ਸਮੱਗਰੀ ਬਣਾਉਣਾ, ਜਿਵੇਂ ਕਿ ਵੱਖ-ਵੱਖ ਸੈਂਸਰ ਇਨਪੁਟਸ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ ਹੈ।
  • ਐਡਵਾਂਸਡ ਵੌਇਸ-ਬੇਸਡ ਐਪਲੀਕੇਸ਼ਨਾਂ: ਵਧੇਰੇ ਆਧੁਨਿਕ ਵੌਇਸ ਗੱਲਬਾਤ ਅਤੇ ਨਿਯੰਤਰਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣਾ।

Gemma 3n ਦੀਆਂ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ

Gemma 3n ਵਿੱਚ ਕਈ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸ਼ਾਮਲ ਹਨ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • ਮੋਬਾਈਲ-ਫਸਟ ਡਿਜ਼ਾਈਨ: ਗੂਗਲ, ਡੀਪਮਾਈਂਡ, ਕੁਆਲਕਾਮ, ਮੀਡੀਆਟੇਕ ਅਤੇ ਸੈਮਸੰਗ ਸਿਸਟਮ LSI ਦੁਆਰਾ ਸਰਵੋਤਮ ਮੋਬਾਈਲ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਸਹਿਯੋਗ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ।
  • ਘੱਟ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ: ਪਰ-ਲੇਅਰ ਐਮਬੈਡਿੰਗਜ਼ (PLE) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਕ੍ਰਮਵਾਰ 5B ਅਤੇ 8B ਪੈਰਾਮੀਟਰ ਮਾਡਲਾਂ ਲਈ 2GB ਅਤੇ 3GB ਦੇ ਸੰਚਾਲਨ ਫੁੱਟਪ੍ਰਿੰਟ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।
  • ਸੁਧਾਰਿਆ ਜਵਾਬੀ ਸਮਾਂ: Gemma 3 4B ਦੇ ਮੁਕਾਬਲੇ ਮੋਬਾਈਲ ‘ਤੇ 1.5 ਗੁਣਾ ਤੇਜ਼ ਜਵਾਬ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
  • ਬਹੁਭਾਸ਼ਾਈ ਮੁਹਾਰਤ: WMT24++ (ChrF) ‘ਤੇ 50.1% ਦਾ ਬਹੁਭਾਸ਼ਾਈ ਬੈਂਚਮਾਰਕ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।
  • ਮਲਟੀਮੋਡਲ ਇਨਪੁਟ: ਆਡੀਓ, ਟੈਕਸਟ, ਚਿੱਤਰ ਅਤੇ ਵੀਡੀਓ ਨੂੰ ਸਵੀਕਾਰ ਅਤੇ ਸਮਝਦਾ ਹੈ, ਗੁੰਝਲਦਾਰ ਮਲਟੀਮੋਡਲ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਇੰਟਰਲੀਵਡ ਇਨਪੁਟਸ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ।
  • ਡਾਇਨਾਮਿਕ ਸਬਮਾਡਲ: ਨੇਸਟਡ ਸਬਮਾਡਲਸ ਅਤੇ ਮਿਕਸ’ਨ’ਮੈਚ ਸਮਰੱਥਾਵਾਂ ਨਾਲ MatFormer ਸਿਖਲਾਈ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਇਨਾਮਿਕ ਵਪਾਰ-ਬੰਦ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ।
  • ਔਫਲਾਈਨ ਓਪਰੇਸ਼ਨ: ਇੰਟਰਨੈੱਟ ਕਨੈਕਸ਼ਨ ਤੋਂ ਬਿਨਾਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਨਿੱਜਤਾ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ।
  • ਆਸਾਨ ਪਹੁੰਚ ਗੂਗਲ AI ਸਟੂਡੀਓ ਅਤੇ ਗੂਗਲ AI ਐਜ ਦੁਆਰਾ ਉਪਲਬਧ, ਟੈਕਸਟ ਅਤੇ ਚਿੱਤਰ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾਵਾਂ ਨਾਲ।

ਪ੍ਰਭਾਵ ਅਤੇ ਭਵਿੱਖ ਦੀਆਂ ਦਿਸ਼ਾਵਾਂ

Gemma 3n ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੀ AI ਨੂੰ ਪੋਰਟੇਬਲ ਅਤੇ ਨਿੱਜੀ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸਪੱਸ਼ਟ ਮਾਰਗ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਨਵੀਨਤਾਕਾਰੀ ਆਰਕੀਟੈਕਚਰ ਦੁਆਰਾ RAM ਸੀਮਾਵਾਂ ਨੂੰ ਹੱਲ ਕਰਕੇ ਅਤੇ ਬਹੁਭਾਸ਼ਾਈ ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾ ਕੇ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਰੋਜ਼ਾਨਾ ਉਪਕਰਣਾਂ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਐਡਵਾਂਸਡ AI ਲਿਆਉਣ ਲਈ ਇੱਕ ਵਿਹਾਰਕ ਹੱਲ ਵਿਕਸਤ ਕੀਤਾ ਹੈ। ਲਚਕਦਾਰ ਸਬਮਾਡਲ ਸਵਿਚਿੰਗ, ਔਫਲਾਈਨ ਤਿਆਰੀ ਅਤੇ ਤੇਜ਼ ਜਵਾਬੀ ਸਮਾਂ ਮੋਬਾਈਲ-ਫਸਟ AI ਲਈ ਇੱਕ ਵਿਆਪਕ ਪਹੁੰਚ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਭਵਿੱਖ ਦੀ ਖੋਜ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾਉਣ, ਡਿਵਾਈਸਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨਾਲ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਦਾ ਵਿਸਤਾਰ ਕਰਨ ਅਤੇ ਵਧੀ ਹੋਈ ਅਸਲੀਅਤ, ਰੋਬੋਟਿਕਸ ​​ਅਤੇ IoT ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ ਨਵੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਖੋਜ ਕਰਨ ‘ਤੇ ਕੇਂਦਰਿਤ ਹੋਵੇਗੀ।