ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਵਿੱਚ ਨਵੀਨਤਾ ਦੀ ਨਿਰੰਤਰ ਗਤੀ ਤਕਨੀਕੀ ਦ੍ਰਿਸ਼ ਨੂੰ ਮੁੜ ਆਕਾਰ ਦੇ ਰਹੀ ਹੈ, ਖਾਸ ਕਰਕੇ ਸਮਾਰਟਫੋਨ ਸਮਰੱਥਾਵਾਂ ਦੇ ਤੀਬਰ ਮੁਕਾਬਲੇ ਵਾਲੇ ਖੇਤਰ ਵਿੱਚ। ਇਸ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹੋਏ ਇੱਕ ਕਦਮ ਵਿੱਚ, Google ਨੇ ਆਪਣੇ AI ਸਹਾਇਕ, Gemini ਨੂੰ, ਕੁਝ Android ਡਿਵਾਈਸਾਂ ‘ਤੇ ਉੱਨਤ ਵਿਜ਼ੂਅਲ ਵਿਆਖਿਆ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨਾਲ ਲੈਸ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਵਿਕਾਸ Apple ਵੱਲੋਂ ‘Apple Intelligence’ ਨਾਮਕ ਆਪਣੇ ਖਾਹਿਸ਼ੀ AI ਸੂਟ ਦਾ ਪਰਦਾਫਾਸ਼ ਕਰਨ ਤੋਂ ਥੋੜ੍ਹੀ ਦੇਰ ਬਾਅਦ ਆਇਆ ਹੈ, ਜਿਸਦੇ ਕੁਝ ਹਿੱਸਿਆਂ ਨੂੰ ਲਾਂਚ ਵਿੱਚ ਦੇਰੀ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈ ਰਿਹਾ ਹੈ, ਜਿਸ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ Google ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ, ਸੰਦਰਭ-ਜਾਗਰੂਕ AI ਨੂੰ ਸਿੱਧੇ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਹੱਥਾਂ ਵਿੱਚ ਪਹੁੰਚਾਉਣ ਵਿੱਚ ਸ਼ੁਰੂਆਤੀ ਬੜ੍ਹਤ ਹਾਸਲ ਕਰ ਸਕਦਾ ਹੈ।
Gemini ਦੇਖਣਾ ਅਤੇ ਸਾਂਝਾ ਕਰਨਾ ਸਿੱਖਦਾ ਹੈ: ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ‘ਤੇ ਇੱਕ ਡੂੰਘੀ ਨਜ਼ਰ
Google ਨੇ Gemini ਦੀਆਂ ਵਧੀਆਂ ਹੋਈਆਂ ਕਾਰਜਕੁਸ਼ਲਤਾਵਾਂ ਦੇ ਰੋਲਆਊਟ ਦੀ ਸ਼ੁਰੂਆਤ ਦੀ ਪੁਸ਼ਟੀ ਕੀਤੀ, ਖਾਸ ਤੌਰ ‘ਤੇ ਕੈਮਰਾ ਇਨਪੁਟ ਅਤੇ ਸਕ੍ਰੀਨ-ਸ਼ੇਅਰਿੰਗ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਦੇ ਹੋਏ। ਇਹ ਉੱਨਤ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸ਼ੁਰੂ ਵਿੱਚ Gemini Advanced ਅਤੇ Google One AI Premium ਪਲਾਨ ਦੇ ਗਾਹਕਾਂ ਲਈ ਪਹੁੰਚਯੋਗ ਹਨ, ਉਹਨਾਂ ਨੂੰ Google ਦੇ ਈਕੋਸਿਸਟਮ ਦੇ ਅੰਦਰ ਪ੍ਰੀਮੀਅਮ ਪੇਸ਼ਕਸ਼ਾਂ ਵਜੋਂ ਸਥਾਪਿਤ ਕਰਦੀਆਂ ਹਨ। ਮੁੱਖ ਨਵੀਨਤਾ Gemini ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਜਾਣਕਾਰੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਸਮਝਣ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਵਿੱਚ ਹੈ, ਭਾਵੇਂ ਡਿਵਾਈਸ ਦੀ ਸਕ੍ਰੀਨ ਤੋਂ ਜਾਂ ਇਸਦੇ ਕੈਮਰਾ ਲੈਂਸ ਰਾਹੀਂ।
ਕਲਪਨਾ ਕਰੋ ਕਿ ਤੁਸੀਂ ਆਪਣੇ ਫ਼ੋਨ ਦਾ ਕੈਮਰਾ ਅਸਲ ਦੁਨੀਆਂ ਵਿੱਚ ਕਿਸੇ ਵਸਤੂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰ ਰਹੇ ਹੋ - ਸ਼ਾਇਦ ਅਣਜਾਣ ਹਾਰਡਵੇਅਰ ਦਾ ਇੱਕ ਟੁਕੜਾ, ਇੱਕ ਪੌਦਾ ਜਿਸਦੀ ਤੁਸੀਂ ਪਛਾਣ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਜਾਂ ਕਿਸੇ ਇਮਾਰਤ ‘ਤੇ ਆਰਕੀਟੈਕਚਰਲ ਵੇਰਵੇ। ਨਵੇਂ ਅਪਡੇਟ ਦੇ ਨਾਲ, Gemini ਦਾ ਉਦੇਸ਼ ਸਧਾਰਨ ਪਛਾਣ ਤੋਂ ਪਰੇ ਜਾਣਾ ਹੈ, ਇੱਕ ਕੰਮ ਜੋ ਪਹਿਲਾਂ ਹੀ Google Lens ਵਰਗੇ ਟੂਲਸ ਦੁਆਰਾ ਸਮਰੱਥ ਤਰੀਕੇ ਨਾਲ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ। ਟੀਚਾ AI ਜੋ ‘ਦੇਖਦਾ’ ਹੈ ਉਸ ‘ਤੇ ਅਧਾਰਤ ਇੱਕ ਗੱਲਬਾਤ ਵਾਲੀ ਪਰਸਪਰ ਕ੍ਰਿਆ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣਾ ਹੈ। Google ਦੀਆਂ ਆਪਣੀਆਂ ਪ੍ਰਚਾਰ ਸਮੱਗਰੀਆਂ ਇਸ ਸੰਭਾਵਨਾ ਨੂੰ ਇੱਕ ਦ੍ਰਿਸ਼ ਨਾਲ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਜਿੱਥੇ ਇੱਕ ਉਪਭੋਗਤਾ ਬਾਥਰੂਮ ਟਾਈਲਾਂ ਦੀ ਖਰੀਦਦਾਰੀ ਕਰ ਰਿਹਾ ਹੈ। Gemini, ਲਾਈਵ ਕੈਮਰਾ ਫੀਡ ਤੱਕ ਪਹੁੰਚ ਕਰਦੇ ਹੋਏ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਰੰਗ ਪੈਲੇਟਸ ‘ਤੇ ਚਰਚਾ ਕਰ ਸਕਦਾ ਹੈ, ਪੂਰਕ ਸ਼ੈਲੀਆਂ ਦਾ ਸੁਝਾਅ ਦੇ ਸਕਦਾ ਹੈ, ਜਾਂ ਪੈਟਰਨਾਂ ਦੀ ਤੁਲਨਾ ਵੀ ਕਰ ਸਕਦਾ ਹੈ, ਵਿਜ਼ੂਅਲ ਸੰਦਰਭ ਵਿੱਚ ਅਧਾਰਤ ਇੰਟਰਐਕਟਿਵ ਮਾਰਗਦਰਸ਼ਨ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਪਰਸਪਰ ਕ੍ਰਿਆ ਮਾਡਲ ਸਥਿਰ ਚਿੱਤਰ ਵਿਸ਼ਲੇਸ਼ਣ ਤੋਂ ਇੱਕ ਵਧੇਰੇ ਗਤੀਸ਼ੀਲ, ਸਹਾਇਕ-ਵਰਗੀ ਭੂਮਿਕਾ ਵੱਲ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਅੱਗੇ ਵਧਦਾ ਹੈ।
ਇਸੇ ਤਰ੍ਹਾਂ, ਸਕ੍ਰੀਨ-ਸ਼ੇਅਰਿੰਗ ਵਿਸ਼ੇਸ਼ਤਾ ਪ੍ਰਸੰਗਿਕ ਸਹਾਇਤਾ ਦੀ ਇੱਕ ਨਵੀਂ ਪਰਤ ਦਾ ਵਾਅਦਾ ਕਰਦੀ ਹੈ। ਉਪਭੋਗਤਾ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ Gemini ਨੂੰ ‘ਦਿਖਾ’ ਸਕਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦੇ ਫ਼ੋਨ ਸਕ੍ਰੀਨ ‘ਤੇ ਵਰਤਮਾਨ ਵਿੱਚ ਕੀ ਪ੍ਰਦਰਸ਼ਿਤ ਹੋ ਰਿਹਾ ਹੈ। ਇਸ ਵਿੱਚ ਇੱਕ ਗੁੰਝਲਦਾਰ ਐਪ ਇੰਟਰਫੇਸ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਮੰਗਣਾ, ਸਕ੍ਰੀਨ ‘ਤੇ ਦਿਖਾਈ ਦੇਣ ਵਾਲੀ ਇੱਕ ਈਮੇਲ ਦਾ ਖਰੜਾ ਤਿਆਰ ਕਰਨ ਬਾਰੇ ਸਲਾਹ ਲੈਣਾ, ਜਾਂ Gemini ਨੂੰ ਸਥਿਤੀ ਦਾ ਦ੍ਰਿਸ਼ਟੀਗਤ ਮੁਲਾਂਕਣ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦੇ ਕੇ ਤਕਨੀਕੀ ਸਮੱਸਿਆ ਦਾ ਨਿਪਟਾਰਾ ਕਰਨਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ। ਸਿਰਫ਼ ਜ਼ੁਬਾਨੀ ਵਰਣਨ ‘ਤੇ ਭਰੋਸਾ ਕਰਨ ਦੀ ਬਜਾਏ, ਉਪਭੋਗਤਾ ਸਿੱਧਾ ਵਿਜ਼ੂਅਲ ਇਨਪੁਟ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦੇ ਹਨ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ AI ਤੋਂ ਵਧੇਰੇ ਸਹੀ ਅਤੇ ਕੁਸ਼ਲ ਸਹਾਇਤਾ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ AI ਨੂੰ ਟੈਕਸਟ ਜਾਂ ਵੌਇਸ ਕਮਾਂਡਾਂ ਦੇ ਇੱਕ ਪੈਸਿਵ ਪ੍ਰਾਪਤਕਰਤਾ ਤੋਂ ਉਪਭੋਗਤਾ ਦੇ ਡਿਜੀਟਲ ਵਾਤਾਵਰਣ ਦੇ ਇੱਕ ਸਰਗਰਮ ਨਿਰੀਖਕ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ।
ਇਹ ਸਮਰੱਥਾਵਾਂ ਮਲਟੀਮੋਡਲ AI ਦੀ ਸ਼ਕਤੀ ਦਾ ਲਾਭ ਉਠਾਉਂਦੀਆਂ ਹਨ, ਜੋ ਇੱਕੋ ਸਮੇਂ ਕਈ ਇਨਪੁਟ ਕਿਸਮਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਸਮਝਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ - ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਟੈਕਸਟ, ਵੌਇਸ, ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਦ੍ਰਿਸ਼ਟੀ। ਇਸ ਗੁੰਝਲਦਾਰ ਤਕਨਾਲੋਜੀ ਨੂੰ ਸਿੱਧੇ ਸਮਾਰਟਫੋਨ ਅਨੁਭਵ ਵਿੱਚ ਲਿਆਉਣਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ AI ਸਹਾਇਤਾ ਨੂੰ ਵਧੇਰੇ ਅਨੁਭਵੀ ਅਤੇ ਰੋਜ਼ਾਨਾ ਦੇ ਕੰਮਾਂ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰਨਾ ਹੈ। ਸੰਭਾਵੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿਸ਼ਾਲ ਹਨ, ਸ਼ਾਇਦ ਸਿਰਫ AI ਦੀ ਵਿਕਸਤ ਸਮਝ ਅਤੇ ਉਪਭੋਗਤਾ ਦੀ ਕਲਪਨਾ ਦੁਆਰਾ ਸੀਮਿਤ ਹਨ। ਵਿਦਿਅਕ ਸਹਾਇਤਾ ਤੋਂ, ਜਿੱਥੇ Gemini ਸਕ੍ਰੀਨ ‘ਤੇ ਇੱਕ ਡਾਇਗ੍ਰਾਮ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ, ਪਹੁੰਚਯੋਗਤਾ ਸੁਧਾਰਾਂ ਤੱਕ, ਇੱਕ AI ਦੀ ‘ਦੇਖਣ’ ਅਤੇ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰਨ ਦੀ ਯੋਗਤਾ ਬਹੁਤ ਸਾਰੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦੀ ਹੈ।
ਹੌਲੀ-ਹੌਲੀ ਪਰਦਾਫਾਸ਼ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨਾ: ਕਿਸਨੂੰ ਅਤੇ ਕਦੋਂ ਪਹੁੰਚ ਮਿਲਦੀ ਹੈ?
Google ਵੱਲੋਂ ਅਧਿਕਾਰਤ ਪੁਸ਼ਟੀ ਦੇ ਬਾਵਜੂਦ ਕਿ ਰੋਲਆਊਟ ਜਾਰੀ ਹੈ, ਇਹਨਾਂ ਅਤਿ-ਆਧੁਨਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰਨਾ ਅਜੇ ਤੱਕ ਇੱਕ ਸਰਵ ਵਿਆਪਕ ਅਨੁਭਵ ਨਹੀਂ ਹੈ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਯੋਗ ਪ੍ਰੀਮੀਅਮ ਗਾਹਕਾਂ ਲਈ ਵੀ। ਉਹਨਾਂ ਉਪਭੋਗਤਾਵਾਂ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਜਿਨ੍ਹਾਂ ਨੇ ਸਫਲਤਾਪੂਰਵਕ ਕੈਮਰਾ ਅਤੇ ਸਕ੍ਰੀਨ-ਸ਼ੇਅਰਿੰਗ ਫੰਕਸ਼ਨਾਂ ਨੂੰ ਐਕਟੀਵੇਟ ਕੀਤਾ ਹੈ, ਛਿਟਪੁਟ ਰਹਿੰਦੀਆਂ ਹਨ, ਇੱਕ ਵਿਆਪਕ-ਪੈਮਾਨੇ, ਇੱਕੋ ਸਮੇਂ ਲਾਂਚ ਦੀ ਬਜਾਏ ਇੱਕ ਧਿਆਨ ਨਾਲ ਪ੍ਰਬੰਧਿਤ, ਪੜਾਅਵਾਰ ਤੈਨਾਤੀ ਦੀ ਤਸਵੀਰ ਪੇਸ਼ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਮਾਪਿਆ ਗਿਆ ਪਹੁੰਚ ਤਕਨੀਕੀ ਉਦਯੋਗ ਵਿੱਚ ਆਮ ਹੈ, ਖਾਸ ਕਰਕੇ ਗੁੰਝਲਦਾਰ AI ਮਾਡਲਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੇ ਮਹੱਤਵਪੂਰਨ ਵਿਸ਼ੇਸ਼ਤਾ ਅਪਡੇਟਾਂ ਲਈ।
ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਸਰਗਰਮ ਹੋਣ ਦੀਆਂ ਕੁਝ ਸਭ ਤੋਂ ਪੁਰਾਣੀਆਂ ਪੁਸ਼ਟੀਆਂ ਸਿਰਫ਼ Google ਦੇ ਆਪਣੇ Pixel ਡਿਵਾਈਸਾਂ ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਤੋਂ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਹੋਰ ਨਿਰਮਾਤਾਵਾਂ, ਜਿਵੇਂ ਕਿ Xiaomi ਤੋਂ ਹਾਰਡਵੇਅਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੇ ਵਿਅਕਤੀਆਂ ਤੋਂ ਵੀ ਆਈਆਂ ਹਨ। ਇਸ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਰੋਲਆਊਟ ਸ਼ੁਰੂ ਵਿੱਚ ਡਿਵਾਈਸ ਬ੍ਰਾਂਡ ਦੁਆਰਾ ਸਖਤੀ ਨਾਲ ਸੀਮਿਤ ਨਹੀਂ ਹੈ, ਹਾਲਾਂਕਿ ਲੰਬੇ ਸਮੇਂ ਦੀ ਉਪਲਬਧਤਾ ਅਤੇ ਅਨੁਕੂਲਤਾ Android ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀ ਹੈ। ਇਹ ਤੱਥ ਕਿ ਉਹ ਲੋਕ ਵੀ ਜੋ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਪ੍ਰੀਮੀਅਮ AI ਟੀਅਰਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰ ਰਹੇ ਹਨ, ਵੱਖ-ਵੱਖ ਪਹੁੰਚ ਸਮੇਂ ਦਾ ਅਨੁਭਵ ਕਰ ਰਹੇ ਹਨ, ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਵਿਭਿੰਨ ਹਾਰਡਵੇਅਰ ਅਤੇ ਸੌਫਟਵੇਅਰ ਸੰਰਚਨਾਵਾਂ ਵਿੱਚ ਅਜਿਹੇ ਅਪਡੇਟਾਂ ਨੂੰ ਵੰਡਣ ਵਿੱਚ ਸ਼ਾਮਲ ਗੁੰਝਲਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ।
ਕਈ ਕਾਰਕ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਇਸ ਹੌਲੀ-ਹੌਲੀ ਰਿਲੀਜ਼ ਰਣਨੀਤੀ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦੇ ਹਨ। ਪਹਿਲਾਂ, ਇਹ Google ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਸਰਵਰ ਲੋਡ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਪ੍ਰਭਾਵਾਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਉੱਨਤ AI ਮਾਡਲਾਂ ਰਾਹੀਂ ਲਾਈਵ ਵੀਡੀਓ ਫੀਡਸ ਅਤੇ ਸਕ੍ਰੀਨ ਸਮੱਗਰੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨਾ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਤੀਬਰ ਹੁੰਦਾ ਹੈ ਅਤੇ ਇਸ ਲਈ ਮਹੱਤਵਪੂਰਨ ਬੈਕਐਂਡ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਪੜਾਅਵਾਰ ਰੋਲਆਊਟ ਸਿਸਟਮ ਓਵਰਲੋਡ ਨੂੰ ਰੋਕਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਅਪਣਾਉਣ ਵਾਲਿਆਂ ਲਈ ਇੱਕ ਸੁਚਾਰੂ ਅਨੁਭਵ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ। ਦੂਜਾ, ਇਹ Google ਨੂੰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ ਕਰਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਛੋਟੇ, ਨਿਯੰਤਰਿਤ ਸਮੂਹ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਅਸਲ-ਸੰਸਾਰ ਵਰਤੋਂ ਡੇਟਾ ਅਤੇ ਉਪਭੋਗਤਾ ਫੀਡਬੈਕ ਇਕੱਠਾ ਕਰਨ ਦਾ ਮੌਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਫੀਡਬੈਕ ਲੂਪ ਬੱਗਾਂ ਦੀ ਪਛਾਣ ਕਰਨ, ਉਪਭੋਗਤਾ ਇੰਟਰਫੇਸ ਨੂੰ ਸੁਧਾਰਨ, ਅਤੇ ਅਸਲ ਪਰਸਪਰ ਕ੍ਰਿਆ ਪੈਟਰਨਾਂ ਦੇ ਅਧਾਰ ‘ਤੇ AI ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਅਨਮੋਲ ਹੈ। ਅੰਤ ਵਿੱਚ, ਖੇਤਰੀ ਉਪਲਬਧਤਾ, ਭਾਸ਼ਾ ਸਹਾਇਤਾ, ਅਤੇ ਰੈਗੂਲੇਟਰੀ ਵਿਚਾਰ ਵੀ ਵੱਖ-ਵੱਖ ਬਾਜ਼ਾਰਾਂ ਵਿੱਚ ਰੋਲਆਊਟ ਸ਼ਡਿਊਲ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੇ ਹਨ।
ਹਾਲਾਂਕਿ ਪਹੁੰਚ ਦੀ ਸ਼ੁਰੂਆਤੀ ਧੀਮੀ ਗਤੀ ਉਤਸੁਕ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਹੌਲੀ ਮਹਿਸੂਸ ਹੋ ਸਕਦੀ ਹੈ, ਇਹ ਸ਼ਕਤੀਸ਼ਾਲੀ ਨਵੀਂ ਤਕਨਾਲੋਜੀ ਨੂੰ ਤੈਨਾਤ ਕਰਨ ਲਈ ਇੱਕ ਵਿਹਾਰਕ ਪਹੁੰਚ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਸੰਭਾਵੀ ਉਪਭੋਗਤਾਵਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ Pixel ਜਾਂ ਉੱਚ-ਅੰਤ ਵਾਲੇ Samsung Galaxy ਡਿਵਾਈਸਾਂ ਵਾਲੇ, ਨੂੰ ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਅਪਡੇਟਾਂ ਲਈ ਆਪਣੇ Gemini ਐਪ ‘ਤੇ ਨਜ਼ਰ ਰੱਖਣ ਦੀ ਸਲਾਹ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਇਹ ਸਮਝਦੇ ਹੋਏ ਕਿ ਉਹਨਾਂ ਦੇ ਖਾਸ ਡਿਵਾਈਸ ‘ਤੇ ਵਿਜ਼ੂਅਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਸਰਗਰਮ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਧੀਰਜ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ। ਸਹੀ ਸਮਾਂ-ਸੀਮਾ ਅਤੇ ਸ਼ੁਰੂ ਵਿੱਚ ਸਮਰਥਿਤ ਡਿਵਾਈਸਾਂ ਦੀ ਪੂਰੀ ਸੂਚੀ Google ਦੁਆਰਾ ਅਨਿਸ਼ਚਿਤ ਰਹਿੰਦੀ ਹੈ, ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਉਮੀਦ ਦਾ ਇੱਕ ਤੱਤ ਜੋੜਦੀ ਹੈ।
Apple ਦਾ ਦ੍ਰਿਸ਼ਟੀਕੋਣ: ਵਿਜ਼ੂਅਲ ਇੰਟੈਲੀਜੈਂਸ ਅਤੇ ਇੱਕ ਪੜਾਅਵਾਰ ਸਮਾਂ-ਸੀਮਾ
ਜਿਸ ਪਿਛੋਕੜ ਦੇ ਵਿਰੁੱਧ Google Gemini ਦੇ ਵਿਜ਼ੂਅਲ ਸੁਧਾਰਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰ ਰਿਹਾ ਹੈ, ਉਹ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ, ਕੰਪਨੀ ਦੀ ਵਰਲਡਵਾਈਡ ਡਿਵੈਲਪਰਜ਼ ਕਾਨਫਰੰਸ (WWDC) ਵਿੱਚ Apple Intelligence ਦਾ ਹਾਲੀਆ ਪਰਦਾਫਾਸ਼ ਹੈ। Apple ਦਾ AI ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਵਿਆਪਕ ਸੂਟ iOS, iPadOS, ਅਤੇ macOS ਵਿੱਚ ਡੂੰਘੇ ਏਕੀਕਰਣ ਦਾ ਵਾਅਦਾ ਕਰਦਾ ਹੈ, ਗੋਪਨੀਯਤਾ ਅਤੇ ਗਤੀ ਲਈ ਆਨ-ਡਿਵਾਈਸ ਪ੍ਰੋਸੈਸਿੰਗ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ, ‘Private Cloud Compute’ ਰਾਹੀਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਲਈ ਸਹਿਜ ਕਲਾਉਡ ਆਫਲੋਡਿੰਗ ਦੇ ਨਾਲ। ਇਸ ਸੂਟ ਦਾ ਇੱਕ ਮੁੱਖ ਹਿੱਸਾ ‘Visual Intelligence’ ਹੈ, ਜੋ ਫੋਟੋਆਂ ਅਤੇ ਵੀਡੀਓਜ਼ ਦੇ ਅੰਦਰ ਸਮੱਗਰੀ ਨੂੰ ਸਮਝਣ ਅਤੇ ਉਸ ‘ਤੇ ਕਾਰਵਾਈ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।
ਹਾਲਾਂਕਿ, Apple ਦੀ ਪਹੁੰਚ Google ਦੇ ਮੌਜੂਦਾ Gemini ਲਾਗੂਕਰਨ ਤੋਂ ਵੱਖਰੀ ਜਾਪਦੀ ਹੈ, ਸਮਰੱਥਾ ਅਤੇ ਰੋਲਆਊਟ ਰਣਨੀਤੀ ਦੋਵਾਂ ਵਿੱਚ। ਜਦੋਂ ਕਿ Visual Intelligence ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਚਿੱਤਰਾਂ ਦੇ ਅੰਦਰ ਵਸਤੂਆਂ ਅਤੇ ਟੈਕਸਟ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਉਸ ਜਾਣਕਾਰੀ ਦੇ ਅਧਾਰ ‘ਤੇ ਕਾਰਵਾਈਆਂ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇਵੇਗਾ (ਜਿਵੇਂ ਕਿ ਫੋਟੋ ਵਿੱਚ ਕੈਪਚਰ ਕੀਤੇ ਫ਼ੋਨ ਨੰਬਰ ‘ਤੇ ਕਾਲ ਕਰਨਾ), ਸ਼ੁਰੂਆਤੀ ਵਰਣਨ ਇੱਕ ਅਜਿਹੀ ਪ੍ਰਣਾਲੀ ਦਾ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਜੋ ਲਾਈਵ ਕੈਮਰਾ ਫੀਡਸ ਜਾਂ ਸਕ੍ਰੀਨ ਸਮੱਗਰੀ ‘ਤੇ ਅਧਾਰਤ ਰੀਅਲ-ਟਾਈਮ, ਗੱਲਬਾਤ ਵਾਲੀ ਪਰਸਪਰ ਕ੍ਰਿਆ ‘ਤੇ ਘੱਟ ਕੇਂਦ੍ਰਿਤ ਹੈ, ਜਿਵੇਂ ਕਿ Gemini ਹੁਣ ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ। Apple ਦਾ ਫੋਕਸ ਉਪਭੋਗਤਾ ਦੀ ਮੌਜੂਦਾ ਫੋਟੋ ਲਾਇਬ੍ਰੇਰੀ ਅਤੇ ਆਨ-ਡਿਵਾਈਸ ਸਮੱਗਰੀ ਦਾ ਲਾਭ ਉਠਾਉਣ ‘ਤੇ ਵਧੇਰੇ ਕੇਂਦ੍ਰਿਤ ਜਾਪਦਾ ਹੈ, ਬਜਾਏ ਬਾਹਰੀ ਦੁਨੀਆਂ ਜਾਂ ਮੌਜੂਦਾ ਸਕ੍ਰੀਨ ਸੰਦਰਭ ਲਈ ਉਸੇ ਇੰਟਰਐਕਟਿਵ ਤਰੀਕੇ ਨਾਲ ਲਾਈਵ ਵਿਜ਼ੂਅਲ ਸਹਾਇਕ ਵਜੋਂ ਕੰਮ ਕਰਨ ਦੇ।
ਇਸ ਤੋਂ ਇਲਾਵਾ, Apple ਨੇ ਖੁਦ ਸਵੀਕਾਰ ਕੀਤਾ ਕਿ ਸਾਰੀਆਂ ਘੋਸ਼ਿਤ Apple Intelligence ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਇਸ ਪਤਝੜ ਵਿੱਚ ਸ਼ੁਰੂਆਤੀ ਲਾਂਚ ‘ਤੇ ਉਪਲਬਧ ਨਹੀਂ ਹੋਣਗੀਆਂ। ਕੁਝ ਵਧੇਰੇ ਖਾਹਿਸ਼ੀ ਸਮਰੱਥਾਵਾਂ ਬਾਅਦ ਵਿੱਚ ਰਿਲੀਜ਼ ਲਈ ਨਿਰਧਾਰਤ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ 2025 ਤੱਕ ਵਧ ਸਕਦੀਆਂ ਹਨ। ਹਾਲਾਂਕਿ ਇਸ ਬਾਰੇ ਖਾਸ ਵੇਰਵੇ ਕਿ ਕਿਹੜੇ ਵਿਜ਼ੂਅਲ ਤੱਤਾਂ ਵਿੱਚ ਦੇਰੀ ਹੋ ਸਕਦੀ ਹੈ, ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹਨ, ਇਹ ਪੜਾਅਵਾਰ ਰੋਲਆਊਟ Google ਵੱਲੋਂ ਹੁਣ ਆਪਣੀਆਂ ਉੱਨਤ ਵਿਜ਼ੂਅਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਦੇ ਉਲਟ ਹੈ, ਭਾਵੇਂ ਇੱਕ ਚੁਣੇ ਹੋਏ ਸਮੂਹ ਲਈ। ਸਮੇਂ ਵਿੱਚ ਇਹ ਅੰਤਰ ਦੋ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੀ ਅਨੁਸਾਰੀ ਤਿਆਰੀ ਅਤੇ ਰਣਨੀਤਕ ਤਰਜੀਹਾਂ ਬਾਰੇ ਅਟਕਲਾਂ ਨੂੰ ਹਵਾ ਦਿੰਦਾ ਹੈ। Apple ਦੇ Siri ਅਤੇ AI ਡਿਵੀਜ਼ਨਾਂ ਦੇ ਅੰਦਰ ਕਾਰਜਕਾਰੀ ਫੇਰਬਦਲ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਸੰਭਾਵੀ ਅੰਦਰੂਨੀ ਸਮਾਯੋਜਨਾਂ ਦੇ ਬਿਰਤਾਂਤ ਵਿੱਚ ਹੋਰ ਵਾਧਾ ਕਰਦੀਆਂ ਹਨ ਕਿਉਂਕਿ ਕੰਪਨੀ ਆਪਣੇ AI ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਤੈਨਾਤ ਕਰਨ ਦੀਆਂ ਗੁੰਝਲਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਦੀ ਹੈ।
Apple ਦੀ ਰਵਾਇਤੀ ਤੌਰ ‘ਤੇ ਸਾਵਧਾਨ ਪਹੁੰਚ, ਉਪਭੋਗਤਾ ਦੀ ਗੋਪਨੀਯਤਾ ਅਤੇ ਤੰਗ ਈਕੋਸਿਸਟਮ ਏਕੀਕਰਣ ‘ਤੇ ਭਾਰੀ ਜ਼ੋਰ ਦਿੰਦੀ ਹੈ, ਅਕਸਰ ਉਹਨਾਂ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਲੰਬੇ ਵਿਕਾਸ ਚੱਕਰਾਂ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਦੀ ਹੈ ਜੋ ਤੇਜ਼ੀ ਨਾਲ ਦੁਹਰਾਓ ਅਤੇ ਕਲਾਉਡ-ਅਧਾਰਤ ਹੱਲਾਂ ਨੂੰ ਤਰਜੀਹ ਦੇ ਸਕਦੇ ਹਨ। ਕਈ Apple Intelligence ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ ਆਨ-ਡਿਵਾਈਸ ਪ੍ਰੋਸੈਸਿੰਗ ‘ਤੇ ਨਿਰਭਰਤਾ ਵੀ ਮਹੱਤਵਪੂਰਨ ਇੰਜੀਨੀਅਰਿੰਗ ਚੁਣੌਤੀਆਂ ਪੇਸ਼ ਕਰਦੀ ਹੈ, ਜਿਸ ਲਈ ਉੱਚ ਅਨੁਕੂਲਿਤ ਮਾਡਲਾਂ ਅਤੇ ਸਮਰੱਥ ਹਾਰਡਵੇਅਰ (ਸ਼ੁਰੂ ਵਿੱਚ A17 Pro ਚਿੱਪ ਅਤੇ M-ਸੀਰੀਜ਼ ਚਿਪਸ ਵਾਲੇ ਡਿਵਾਈਸਾਂ ਤੱਕ ਸੀਮਿਤ) ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਹਾਲਾਂਕਿ ਇਹ ਰਣਨੀਤੀ ਮਜਬੂਰ ਕਰਨ ਵਾਲੇ ਗੋਪਨੀਯਤਾ ਲਾਭਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀ ਹੈ, ਇਹ Gemini Advanced ਦੇ ਨਾਲ Google ਦੀ ਵਧੇਰੇ ਕਲਾਉਡ-ਕੇਂਦ੍ਰਿਤ ਪਹੁੰਚ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਸਭ ਤੋਂ ਅਤਿ-ਆਧੁਨਿਕ, ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਮੰਗ ਵਾਲੀਆਂ AI ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਹੌਲੀ ਸ਼ੁਰੂਆਤ ਵੱਲ ਅੰਦਰੂਨੀ ਤੌਰ ‘ਤੇ ਅਗਵਾਈ ਕਰ ਸਕਦੀ ਹੈ। ਦੌੜ ਸਿਰਫ਼ ਸਮਰੱਥਾ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਤੈਨਾਤੀ ਲਈ ਚੁਣੇ ਗਏ ਮਾਰਗ ਅਤੇ ਡੇਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਉਪਭੋਗਤਾ ਗੋਪਨੀਯਤਾ ਸੰਬੰਧੀ ਅੰਤਰੀਵ ਦਾਰਸ਼ਨਿਕ ਮਤਭੇਦਾਂ ਬਾਰੇ ਵੀ ਹੈ।
ਲੈਬ ਪ੍ਰਦਰਸ਼ਨਾਂ ਤੋਂ ਜੇਬ ਦੀ ਹਕੀਕਤ ਤੱਕ: ਵਿਜ਼ੂਅਲ AI ਦੀ ਯਾਤਰਾ
Gemini ਵਰਗੇ ਮੁੱਖ ਧਾਰਾ ਦੇ AI ਸਹਾਇਕਾਂ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਸਮਝ ਦੀ ਸ਼ੁਰੂਆਤ ਕੋਈ ਰਾਤੋ-ਰਾਤ ਵਾਪਰੀ ਘਟਨਾ ਨਹੀਂ ਹੈ। ਇਹ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਅਤੇ ਮਲਟੀਮੋਡਲ AI ਵਿੱਚ ਸਾਲਾਂ ਦੀ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਦੀ ਸਿਖਰ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। Google ਲਈ, ਇਹਨਾਂ ਸਮਰੱਥਾਵਾਂ ਦੇ ਬੀਜ ਪਹਿਲਾਂ ਦੇ ਪ੍ਰੋਜੈਕਟਾਂ ਅਤੇ ਤਕਨਾਲੋਜੀ ਪ੍ਰਦਰਸ਼ਨਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦੇ ਸਨ। ਖਾਸ ਤੌਰ ‘ਤੇ, ‘Project Astra’, ਜਿਸਨੂੰ ਪਿਛਲੀ Google I/O ਡਿਵੈਲਪਰ ਕਾਨਫਰੰਸ ਦੌਰਾਨ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ, ਨੇ ਇੰਟਰਐਕਟਿਵ AI ਦੇ ਭਵਿੱਖ ਦੀ ਇੱਕ ਮਜਬੂਰ ਕਰਨ ਵਾਲੀ ਝਲਕ ਪ੍ਰਦਾਨ ਕੀਤੀ।
Project Astra ਨੇ ਇੱਕ AI ਸਹਾਇਕ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਜੋ ਇੱਕ ਕੈਮਰੇ ਰਾਹੀਂ ਆਪਣੇ ਆਲੇ ਦੁਆਲੇ ਨੂੰ ਸਮਝਣ, ਵਸਤੂਆਂ ਦੀ ਸਥਿਤੀ ਨੂੰ ਯਾਦ ਰੱਖਣ, ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਵਾਤਾਵਰਣ ਬਾਰੇ ਬੋਲਚਾਲ ਦੀ ਗੱਲਬਾਤ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਣ ਦੇ ਸਮਰੱਥ ਸੀ। ਹਾਲਾਂਕਿ ਇੱਕ ਅਗਾਂਹਵਧੂ ਸੰਕਲਪ ਵਜੋਂ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਹੈ, ਮੁੱਖ ਤਕਨਾਲੋਜੀਆਂ - ਲਾਈਵ ਵੀਡੀਓ ਫੀਡਸ ਨੂੰ ਸਮਝਣਾ, ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਵਸਤੂਆਂ ਦੀ ਪਛਾਣ ਕਰਨਾ, ਅਤੇ ਉਸ ਵਿਜ਼ੂਅਲ ਡੇਟਾ ਨੂੰ ਇੱਕ ਗੱਲਬਾਤ ਵਾਲੇ AI ਫਰੇਮਵਰਕ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨਾ - ਬਿਲਕੁਲ ਉਹੀ ਹਨ ਜੋ Gemini ਵਿੱਚ ਰੋਲ ਆਊਟ ਹੋ ਰਹੀਆਂ ਨਵੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਅਧਾਰ ਹਨ। ਲੇਖਕ ਦੀ Astra ਨੂੰ ਦੇਖਣ ਦੀ ਯਾਦ ਇਸ ਗੱਲ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ ਕਿ ਹਾਲਾਂਕਿ ਡੈਮੋ ਖੁਦ ਉਸ ਸਮੇਂ ਤੁਰੰਤ ਕ੍ਰਾਂਤੀਕਾਰੀ ਨਹੀਂ ਜਾਪਦਾ ਸੀ, Google ਦੀ ਉਸ ਗੁੰਝਲਦਾਰ ਤਕਨਾਲੋਜੀ ਨੂੰ ਮੁਕਾਬਲਤਨ ਥੋੜ੍ਹੇ ਸਮੇਂ ਦੇ ਅੰਦਰ ਇੱਕ ਉਪਭੋਗਤਾ-ਸਾਹਮਣਾ ਵਾਲੀ ਵਿਸ਼ੇਸ਼ਤਾ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਨ ਦੀ ਯੋਗਤਾ ਕਮਾਲ ਦੀ ਹੈ।
ਇੱਕ ਨਿਯੰਤਰਿਤ ਤਕਨੀਕੀ ਡੈਮੋ ਤੋਂ ਇੱਕ ਵਿਸ਼ੇਸ਼ਤਾ ਤੱਕ ਦੀ ਇਹ ਯਾਤਰਾ ਜੋ ਉਪਭੋਗਤਾ ਸਮਾਰਟਫ਼ੋਨਾਂ ‘ਤੇ (ਭਾਵੇਂ ਹੌਲੀ-ਹੌਲੀ) ਤੈਨਾਤ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ, ਮਲਟੀਮੋਡਲ AI ਮਾਡਲਾਂ ਦੀ ਤੇਜ਼ੀ ਨਾਲ ਪਰਿਪੱਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। AI ਵਿਕਸਤ ਕਰਨ ਲਈ ਜੋ ਵਿਜ਼ੂਅਲ ਇਨਪੁਟ ਨੂੰ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਨਾਲ ਸਹਿਜੇ ਹੀ ਮਿਲਾ ਸਕਦਾ ਹੈ, ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। AI ਨੂੰ ਨਾ ਸਿਰਫ਼ ਵਸਤੂਆਂ ਦੀ ਸਹੀ ਪਛਾਣ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ, ਸਗੋਂ ਉਹਨਾਂ ਦੇ ਸਬੰਧਾਂ, ਸੰਦਰਭ, ਅਤੇ ਉਪਭੋਗਤਾ ਦੀ ਪੁੱਛਗਿੱਛ ਜਾਂ ਚੱਲ ਰਹੀ ਗੱਲਬਾਤ ਨਾਲ ਸੰਬੰਧਤਤਾ ਨੂੰ ਵੀ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਸ ਜਾਣਕਾਰੀ ਨੂੰ ਲਗਭਗ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਪ੍ਰੋਸੈਸ ਕਰਨਾ, ਖਾਸ ਕਰਕੇ ਲਾਈਵ ਵੀਡੀਓ ਸਟ੍ਰੀਮ ਤੋਂ, ਕਾਫ਼ੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸ਼ਕਤੀ ਅਤੇ ਉੱਚ ਅਨੁਕੂਲਿਤ ਐਲਗੋਰਿਦਮ ਦੀ ਮੰਗ ਕਰਦਾ ਹੈ।
Google ਦਾ AI ਖੋਜ ਵਿੱਚ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਨਿਵੇਸ਼, ਜੋ Google Search, Google Photos (ਇਸਦੀ ਵਸਤੂ ਪਛਾਣ ਦੇ ਨਾਲ), ਅਤੇ Google Lens ਵਰਗੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਸਪੱਸ਼ਟ ਹੈ, ਨੇ ਇੱਕ ਮਜ਼ਬੂਤ ਨੀਂਹ ਪ੍ਰਦਾਨ ਕੀਤੀ। Gemini ਇਹਨਾਂ ਵੱਖਰੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੇ ਏਕੀਕਰਣ ਅਤੇ ਵਿਕਾਸ ਨੂੰ ਇੱਕ ਵਧੇਰੇ ਏਕੀਕ੍ਰਿਤ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਗੱਲਬਾਤ ਵਾਲੇ AI ਵਿੱਚ ਦਰਸਾਉਂਦਾ ਹੈ। ‘ਦੇਖਣ’ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਸਿੱਧੇ ਮੁੱਖ Gemini ਇੰਟਰਫੇਸ ਵਿੱਚ ਲਿਆਉਣਾ, ਇਸਨੂੰ Lens ਵਰਗੀ ਵੱਖਰੀ ਐਪ ਤੱਕ ਸੀਮਤ ਰੱਖਣ ਦੀ ਬਜਾਏ, Google ਦੇ ਇਰਾਦੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਵਿਜ਼ੂਅਲ ਸਮਝ ਨੂੰ ਇਸਦੇ AI ਸਹਾਇਕ ਦੀ ਪਛਾਣ ਦਾ ਮੁੱਖ ਹਿੱਸਾ ਬਣਾਇਆ ਜਾਵੇ। ਇਹ ਇੱਕ ਰਣਨੀਤਕ ਸ਼ਰਤ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਉਪਭੋਗਤਾ ਵੱਧ ਤੋਂ ਵੱਧ ਉਮੀਦ ਕਰਨਗੇ ਕਿ ਉਹਨਾਂ ਦੇ AI ਸਾਥੀ ਦੁਨੀਆਂ ਨੂੰ ਉਸੇ ਤਰ੍ਹਾਂ ਸਮਝਣ ਅਤੇ ਉਸ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਜਿਵੇਂ ਮਨੁੱਖ ਕਰਦੇ ਹਨ - ਕਈ ਇੰਦਰੀਆਂ ਰਾਹੀਂ। Project Astra ਦੇ ਸੰਕਲਪਿਕ ਵਾਅਦੇ ਤੋਂ Gemini ਦੀਆਂ ਠੋਸ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਤੱਕ ਦਾ ਪਰਿਵਰਤਨ ਇਸ ਵਿਕਾਸ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੀਲ ਪੱਥਰ ਹੈ।
ਮਹੱਤਵਪੂਰਨ ਪ੍ਰੀਖਿਆ: ਅਸਲ-ਸੰਸਾਰ ਉਪਯੋਗਤਾ ਅਤੇ ਪ੍ਰੀਮੀਅਮ AI ਪ੍ਰਸਤਾਵ
ਅੰਤ ਵਿੱਚ, Gemini ਦੀਆਂ ਨਵੀਆਂ ਵਿਜ਼ੂਅਲ ਸਮਰੱਥਾਵਾਂ ਦੀ ਸਫਲਤਾ - ਅਤੇ ਅਸਲ ਵਿੱਚ, ਕਿਸੇ ਵੀ ਉੱਨਤ AI ਵਿਸ਼ੇਸ਼ਤਾ ਦੀ - ਇੱਕ ਸਧਾਰਨ ਪਰ ਨਾਜ਼ੁਕ ਕਾਰਕ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ: ਅਸਲ-ਸੰਸਾਰ ਉਪਯੋਗਤਾ। ਕੀ ਉਪਭੋਗਤਾ ਇਹਨਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸੱਚਮੁੱਚ ਮਦਦਗਾਰ, ਦਿਲਚਸਪ, ਜਾਂ ਮਨੋਰੰਜਕ ਪਾਉਣਗੇ ਕਿ ਉਹਨਾਂ ਨੂੰ ਆਪਣੀ ਰੋਜ਼ਾਨਾ ਦੀ ਰੁਟੀਨ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰ ਸਕਣ? ਇੱਕ AI ਜੋ ‘ਦੇਖ’ ਸਕਦਾ ਹੈ, ਦੀ ਨਵੀਨਤਾ ਸ਼ੁਰੂ ਵਿੱਚ ਧਿਆਨ ਖਿੱਚ ਸਕਦੀ ਹੈ, ਪਰ ਨਿਰੰਤਰ ਵਰਤੋਂ ਇਸ ਗੱਲ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਇਹ ਅਸਲ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਦਾ ਹੈ ਜਾਂ ਮੌਜੂਦਾ ਤਰੀਕਿਆਂ ਨਾਲੋਂ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਠੋਸ ਲਾਭ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
Google ਦਾ ਇਹਨਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਇਸਦੇ ਪ੍ਰੀਮੀਅਮ ਗਾਹਕੀ ਟੀਅਰਾਂ (Gemini Advanced / Google One AI Premium) ਦੇ ਅੰਦਰ ਬੰਡਲ ਕਰਨ ਦਾ ਫੈਸਲਾ ਅਪਣਾਉਣ ਦੀ ਚੁਣੌਤੀ ਵਿੱਚ ਇੱਕ ਹੋਰ ਪਰਤ ਜੋੜਦਾ ਹੈ। ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਹਨਾਂ ਉੱਨਤ ਵਿਜ਼ੂਅਲ ਅਤੇ ਹੋਰ ਪ੍ਰੀਮੀਅਮ AI ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚ ਆਵਰਤੀ ਲਾਗਤ ਨੂੰ ਜਾਇਜ਼ ਠਹਿਰਾਉਣ ਲਈ ਕਾਫ਼ੀ ਮੁੱਲ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਉਲਟ ਹੈ ਜੋ ਆਖਰਕਾਰ ਮਿਆਰੀ ਬਣ ਸਕਦੀਆਂ ਹਨ ਜਾਂ ਬੇਸ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਅਨੁਭਵ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਪੇਸ਼ ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਕਿ ਅਕਸਰ Apple ਦਾ ਮਾਡਲ ਹੁੰਦਾ ਹੈ। ਗਾਹਕੀ ਰੁਕਾਵਟ ਦਾ ਮਤਲਬ ਹੈ ਕਿ Gemini ਦੀ ਵਿਜ਼ੂਅਲ ਸ਼ਕਤੀ ਨੂੰ ਮੁਫਤ ਵਿਕਲਪਾਂ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਤੌਰ ‘ਤੇ ਪਛਾੜਨਾ ਚਾਹੀਦਾ ਹੈ ਜਾਂ ਕਿਤੇ ਹੋਰ ਉਪਲਬਧ ਨਾ ਹੋਣ ਵਾਲੀਆਂ ਵਿਲੱਖਣ ਕਾਰਜਕੁਸ਼ਲਤਾਵਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਕੀ Gemini ਦੀ ਟਾਈਲ-ਖਰੀਦਦਾਰੀ ਸਲਾਹ ਸੱਚਮੁੱਚ ਇੱਕ ਜਾਣਕਾਰ ਸਟੋਰ ਕਰਮਚਾਰੀ ਜਾਂ ਇੱਕ ਤੇਜ਼ ਚਿੱਤਰ ਖੋਜ ਨਾਲੋਂ ਵਧੇਰੇ ਮਦਦਗਾਰ ਹੋ ਸਕਦੀ ਹੈ? ਕੀ ਸਕ੍ਰੀਨ ਸ਼ੇਅਰ ਰਾਹੀਂ ਸਮੱਸਿਆ-ਨਿਪਟਾਰਾ ਮੌਜੂਦਾ ਰਿਮੋਟ ਸਹਾਇਤਾ ਸਾਧਨਾਂ ਜਾਂ ਸਿਰਫ਼ ਸਮੱਸਿਆ ਦਾ ਵਰਣਨ ਕਰਨ ਨਾਲੋਂ