ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਵਿੱਚ ਨਵੀਨਤਾ ਦੀ ਲਗਾਤਾਰ ਰਫ਼ਤਾਰ ਘੱਟ ਹੋਣ ਦੇ ਕੋਈ ਸੰਕੇਤ ਨਹੀਂ ਦਿਖਾ ਰਹੀ ਹੈ, ਅਤੇ Google ਨੇ ਇਸ ਉੱਚ-ਦਾਅ ਵਾਲੀ ਤਕਨੀਕੀ ਦੌੜ ਵਿੱਚ ਆਪਣਾ ਨਵੀਨਤਮ ਹਮਲਾ ਕੀਤਾ ਹੈ। ਕੰਪਨੀ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ Gemini 2.5 ਤੋਂ ਪਰਦਾ ਹਟਾਇਆ ਹੈ, ਜੋ ਕਿ ਇਸਦੇ AI ਮਾਡਲ ਦੀ ਇੱਕ ਨਵੀਂ ਪੀੜ੍ਹੀ ਹੈ ਜੋ ਗੁੰਝਲਦਾਰ ਬੋਧਾਤਮਕ ਕਾਰਜਾਂ ਨਾਲ ਨਜਿੱਠਣ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ, ਜਿਸ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਤਰਕ ਅਤੇ ਗੁੰਝਲਦਾਰ ਕੋਡਿੰਗ ਚੁਣੌਤੀਆਂ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਪਰਦਾਫਾਸ਼ ਸਿਰਫ਼ ਇੱਕ ਹੋਰ ਵਾਧਾਤਮਕ ਅੱਪਡੇਟ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਅੱਗੇ ਵਧਾਉਂਦਾ ਹੈ, Google ਨੂੰ AI ਵਿਕਾਸ ਵਿੱਚ ਮਜ਼ਬੂਤੀ ਨਾਲ ਮੋਹਰੀ ਸਥਾਨ ‘ਤੇ ਰੱਖਦਾ ਹੈ ਅਤੇ ਸਥਾਪਿਤ ਵਿਰੋਧੀਆਂ ਨੂੰ ਸਿੱਧੀ ਚੁਣੌਤੀ ਦਿੰਦਾ ਹੈ। ਇਸ ਲਾਂਚ ਦਾ ਕੇਂਦਰ Gemini 2.5 Pro Experimental ਵੇਰੀਐਂਟ ਹੈ, ਜਿਸ ਨੇ ਪਹਿਲਾਂ ਹੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ LMArena ਲੀਡਰਬੋਰਡ ‘ਤੇ ਚੋਟੀ ਦਾ ਸਥਾਨ ਹਾਸਲ ਕਰਕੇ ਲਹਿਰਾਂ ਪੈਦਾ ਕੀਤੀਆਂ ਹਨ, ਜੋ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਸਤਿਕਾਰਤ ਬੈਂਚਮਾਰਕ ਹੈ।
ਨਵੇਂ ਬੈਂਚਮਾਰਕ ਸਥਾਪਤ ਕਰਨਾ: ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਤਰਕ ਦੀ ਸਮਰੱਥਾ
Gemini 2.5 Pro Experimental ਦਾ ਤੁਰੰਤ ਪ੍ਰਭਾਵ ਇਸਦੇ ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਸਪੱਸ਼ਟ ਹੈ। LMArena ਲੀਡਰਬੋਰਡ ‘ਤੇ ਪੋਲ ਪੋਜ਼ੀਸ਼ਨ ਹਾਸਲ ਕਰਨਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਾਰਨਾਮਾ ਹੈ, ਜੋ ਦੂਜੇ ਪ੍ਰਮੁੱਖ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਇਸਦੀਆਂ ਉੱਤਮ ਸਮਰੱਥਾਵਾਂ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਪਰ ਇਸਦਾ ਦਬਦਬਾ ਇਸ ਸਿੰਗਲ ਰੈਂਕਿੰਗ ਤੋਂ ਪਰੇ ਹੈ। Google ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਉੱਨਤ ਮਾਡਲ ਕਈ ਮਹੱਤਵਪੂਰਨ ਖੇਤਰਾਂ ਵਿੱਚ ਵੀ ਅੱਗੇ ਹੈ, ਜਿਸ ਵਿੱਚ ਆਮ ਕੋਡਿੰਗ, ਗਣਿਤ, ਅਤੇ ਵਿਗਿਆਨ ਬੈਂਚਮਾਰਕ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਖੇਤਰ ਇੱਕ AI ਦੀ ਗੁੰਝਲਦਾਰ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਸਮਝਣ, ਅਮੂਰਤ ਸੰਕਲਪਾਂ ਨੂੰ ਹੇਰਫੇਰ ਕਰਨ, ਅਤੇ ਸਹੀ, ਕਾਰਜਸ਼ੀਲ ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰਨ ਦੀ ਯੋਗਤਾ ਲਈ ਮਹੱਤਵਪੂਰਨ ਟੈਸਟਿੰਗ ਆਧਾਰ ਹਨ। ਇੱਥੇ ਉੱਤਮਤਾ ਪ੍ਰਾਪਤ ਕਰਨਾ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਡੂੰਘਾਈ ਅਤੇ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੇ ਹੁਨਰ ਦੇ ਪੱਧਰ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਜੋ ਮੌਜੂਦਾ AI ਸਮਰੱਥਾਵਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਂਦਾ ਹੈ।
Google ਦੇ ਆਪਣੇ ਤਕਨੀਕੀ ਮਾਹਿਰਾਂ ਦੇ ਅਨੁਸਾਰ, ਜੋ ਚੀਜ਼ Gemini 2.5 ਨੂੰ ਸੱਚਮੁੱਚ ਵੱਖਰਾ ਕਰਦੀ ਹੈ, ਉਹ ਇਸਦਾ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਇੱਕ ‘ਸੋਚਣ ਵਾਲੇ ਮਾਡਲ’ ਵਜੋਂ ਹੈ। Google DeepMind ਦੇ ਮੁੱਖ ਤਕਨਾਲੋਜੀ ਅਧਿਕਾਰੀ, Koray Kavukcuoglu ਨੇ ਇਸ ਸੰਕਲਪ ‘ਤੇ ਵਿਸਥਾਰ ਨਾਲ ਦੱਸਿਆ: “Gemini 2.5 ਮਾਡਲ ਸੋਚਣ ਵਾਲੇ ਮਾਡਲ ਹਨ, ਜੋ ਜਵਾਬ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ ਆਪਣੇ ਵਿਚਾਰਾਂ ਰਾਹੀਂ ਤਰਕ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹਨ, ਜਿਸਦੇ ਨਤੀਜੇ ਵਜੋਂ ਵਧੀ ਹੋਈ ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਸੁਧਰੀ ਸ਼ੁੱਧਤਾ ਹੁੰਦੀ ਹੈ।” ਇਹ ਵਰਣਨ ਉਹਨਾਂ ਮਾਡਲਾਂ ਤੋਂ ਇੱਕ ਵਿਦਾਇਗੀ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਜੋ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਪੈਟਰਨ ਪਛਾਣ ਜਾਂ ਸਿੱਧੀ ਪ੍ਰਾਪਤੀ ‘ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦੇ ਹਨ। ਇਸ ਦੀ ਬਜਾਏ, Gemini 2.5 ਨੂੰ ਇਸਦੇ ਜਵਾਬ ਨੂੰ ਤਿਆਰ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਇੱਕ ਵਧੇਰੇ ਵਿਚਾਰ-ਵਟਾਂਦਰੇ ਵਾਲੀ ਅੰਦਰੂਨੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਣ ਦਾ ਸੁਝਾਅ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਢਾਂਚਾਗਤ ਵਿਚਾਰ ਦੇ ਸਮਾਨ ਹੈ। ਇਹ ਅੰਦਰੂਨੀ ਤਰਕ ਕਦਮ ਇਸਨੂੰ ਸਧਾਰਨ ਵਰਗੀਕਰਨ ਜਾਂ ਭਵਿੱਖਬਾਣੀ ਕਾਰਜਾਂ ਤੋਂ ਪਰੇ ਜਾਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। Google ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਜਾਣਕਾਰੀ ਦਾ ਡੂੰਘਾਈ ਨਾਲ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦਾ ਹੈ, ਤਰਕਪੂਰਨ ਸਿੱਟੇ ਕੱਢ ਸਕਦਾ ਹੈ, ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਇਸਦੇ ਆਉਟਪੁੱਟ ਵਿੱਚ ਸੰਦਰਭ ਅਤੇ ਸੂਖਮਤਾ ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਸਕਦਾ ਹੈ। ਕਿਸੇ ਸਮੱਸਿਆ ਦੇ ਵੱਖ-ਵੱਖ ਪਹਿਲੂਆਂ ਨੂੰ ਤੋਲਣ ਅਤੇ ਸੂਖਮ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਇਹ ਯੋਗਤਾ ਅਸਲ-ਸੰਸਾਰ ਦੀਆਂ ਜਟਿਲਤਾਵਾਂ ਨਾਲ ਨਜਿੱਠਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਸਧਾਰਨ ਜਵਾਬਾਂ ਨੂੰ ਨਕਾਰਦੀਆਂ ਹਨ।
ਇਸ ‘ਸੋਚ’ ਪਹੁੰਚ ਦੇ ਵਿਹਾਰਕ ਪ੍ਰਭਾਵ ਤੁਲਨਾਤਮਕ ਪ੍ਰਦਰਸ਼ਨ ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਸਾਬਤ ਹੁੰਦੇ ਹਨ। Google ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ Gemini 2.5 ਵੱਖ-ਵੱਖ ਮੰਗ ਵਾਲੇ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ OpenAI ਦੇ o3 mini ਅਤੇ GPT-4.5, DeepSeek-R1, Grok 3, ਅਤੇ Anthropic ਦੇ Claude 3.7 Sonnet ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੇ ਮੁਕਾਬਲੇ ਉੱਤਮ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਕਈ ਟੈਸਟ ਸੂਟਾਂ ਵਿੱਚ ਇਹ ਵਿਆਪਕ ਉੱਤਮਤਾ ਇਸ ਨਵੀਨਤਮ ਦੁਹਰਾਓ ਵਿੱਚ ਲਾਗੂ ਕੀਤੇ ਗਏ ਆਰਕੀਟੈਕਚਰਲ ਅਤੇ ਸਿਖਲਾਈ ਸੁਧਾਰਾਂ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।
ਸ਼ਾਇਦ ਇਸਦੇ ਉੱਨਤ ਤਰਕ ਦੇ ਸਭ ਤੋਂ ਦਿਲਚਸਪ ਪ੍ਰਦਰਸ਼ਨਾਂ ਵਿੱਚੋਂ ਇੱਕ Humanity’s Last Exam ਵਜੋਂ ਜਾਣੇ ਜਾਂਦੇ ਇੱਕ ਵਿਲੱਖਣ ਬੈਂਚਮਾਰਕ ‘ਤੇ ਇਸਦਾ ਪ੍ਰਦਰਸ਼ਨ ਹੈ। ਇਹ ਡੇਟਾਸੈਟ, ਸੈਂਕੜੇ ਵਿਸ਼ਾ ਵਸਤੂ ਮਾਹਿਰਾਂ ਦੁਆਰਾ ਸਾਵਧਾਨੀ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਅਤੇ ਨਕਲੀ ਗਿਆਨ ਅਤੇ ਤਰਕ ਦੋਵਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਚੁਣੌਤੀਆਂ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਲਈ ਡੂੰਘੀ ਸਮਝ, ਆਲੋਚਨਾਤਮਕ ਸੋਚ, ਅਤੇ ਵਿਭਿੰਨ ਖੇਤਰਾਂ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਸੰਸ਼ਲੇਸ਼ਣ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਚੁਣੌਤੀਪੂਰਨ ਟੈਸਟ ‘ਤੇ, Gemini 2.5 ਨੇ ਬਾਹਰੀ ਟੂਲ ਦੀ ਵਰਤੋਂ ਤੋਂ ਬਿਨਾਂ ਕੰਮ ਕਰਨ ਵਾਲੇ ਮਾਡਲਾਂ ਵਿੱਚ 18.8% ਦਾ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ, ਇੱਕ ਨਤੀਜਾ ਜਿਸਨੂੰ Google ਅਤਿ-ਆਧੁਨਿਕ ਦੱਸਦਾ ਹੈ। ਹਾਲਾਂਕਿ ਪ੍ਰਤੀਸ਼ਤ ਪੂਰਨ ਰੂਪ ਵਿੱਚ ਮਾਮੂਲੀ ਲੱਗ ਸਕਦਾ ਹੈ, ਇਸਦੀ ਮਹੱਤਤਾ ਬੈਂਚਮਾਰਕ ਦੀ ਮੁਸ਼ਕਲ ਵਿੱਚ ਹੈ, ਜੋ ਇਸਦੇ ਸਾਥੀਆਂ ਦੇ ਮੁਕਾਬਲੇ ਗੁੰਝਲਦਾਰ, ਬਿਨਾਂ ਸਹਾਇਤਾ ਵਾਲੇ ਤਰਕ ਲਈ ਮਾਡਲ ਦੀ ਉੱਨਤ ਸਮਰੱਥਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ।
ਪਰਦੇ ਪਿੱਛੇ: ਵਧਿਆ ਹੋਇਆ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ
Gemini 2.5 ਦੁਆਰਾ ਦਰਸਾਈ ਗਈ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਛਾਲ ਦੁਰਘਟਨਾਤਮਕ ਨਹੀਂ ਹੈ; ਇਹ Google DeepMind ਦੇ ਅੰਦਰ ਨਿਰੰਤਰ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਯਤਨਾਂ ਦਾ ਸਿਖਰ ਹੈ। ਕੰਪਨੀ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਇਸ ਤਰੱਕੀ ਨੂੰ AI ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਵਧੇਰੇ ਬੁੱਧੀਮਾਨ ਅਤੇ ਗੁੰਝਲਦਾਰ ਤਰਕ ਦੇ ਸਮਰੱਥ ਬਣਾਉਣ ਦੇ ਉਦੇਸ਼ ਨਾਲ ਲੰਬੇ ਸਮੇਂ ਦੀਆਂ ਖੋਜਾਂ ਨਾਲ ਜੋੜਦੀ ਹੈ। Google ਨੇ ਆਪਣੀ ਘੋਸ਼ਣਾ ਵਿੱਚ ਕਿਹਾ, “ਲੰਬੇ ਸਮੇਂ ਤੋਂ, ਅਸੀਂ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਅਤੇ ਚੇਨ-ਆਫ-ਥੌਟ ਪ੍ਰੋਂਪਟਿੰਗ ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਰਾਹੀਂ AI ਨੂੰ ਚੁਸਤ ਅਤੇ ਤਰਕ ਕਰਨ ਦੇ ਵਧੇਰੇ ਸਮਰੱਥ ਬਣਾਉਣ ਦੇ ਤਰੀਕਿਆਂ ਦੀ ਖੋਜ ਕੀਤੀ ਹੈ।” ਇਹ ਤਕਨੀਕਾਂ, ਭਾਵੇਂ ਕੀਮਤੀ ਹਨ, ਨਵੀਨਤਮ ਮਾਡਲ ਵਿੱਚ ਮਹਿਸੂਸ ਕੀਤੀ ਗਈ ਵਧੇਰੇ ਏਕੀਕ੍ਰਿਤ ਪਹੁੰਚ ਵੱਲ ਵਧਣ ਵਾਲੇ ਕਦਮ ਜਾਪਦੇ ਹਨ।
Google Gemini 2.5 ਦੇ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਸਿਹਰਾ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸੁਮੇਲ ਨੂੰ ਦਿੰਦਾ ਹੈ: ਇੱਕ “ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਵਧਿਆ ਹੋਇਆ ਬੇਸ ਮਾਡਲ” “ਸੁਧਰੀ ਹੋਈ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ” ਤਕਨੀਕਾਂ ਨਾਲ ਜੋੜਿਆ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਇਹਨਾਂ ਸੁਧਾਰਾਂ ਦੇ ਖਾਸ ਵੇਰਵੇ ਮਲਕੀਅਤ ਵਾਲੇ ਰਹਿੰਦੇ ਹਨ, ਭਾਵ ਸਪੱਸ਼ਟ ਹੈ। ਮਾਡਲ ਦਾ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਖੁਦ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰਾਂ ਵਿੱਚੋਂ ਲੰਘਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਪੈਮਾਨਾ, ਕੁਸ਼ਲਤਾ, ਜਾਂ ਨਾਵਲ ਢਾਂਚਾਗਤ ਡਿਜ਼ਾਈਨ ਸ਼ਾਮਲ ਹਨ। ਸ਼ੁਰੂਆਤੀ ਵੱਡੇ ਪੈਮਾਨੇ ਦੀ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ ਹੋਣ ਵਾਲੀ ਸੁਧਾਈ ਪ੍ਰਕਿਰਿਆ ਵੀ ਬਰਾਬਰ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇਸ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਵਿੱਚ ਅਕਸਰ ਖਾਸ ਕਾਰਜਾਂ ‘ਤੇ ਮਾਡਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨਾ, ਇਸਨੂੰ ਲੋੜੀਂਦੇ ਵਿਵਹਾਰਾਂ (ਜਿਵੇਂ ਕਿ ਮਦਦਗਾਰਤਾ ਅਤੇ ਸੁਰੱਖਿਆ) ਨਾਲ ਇਕਸਾਰ ਕਰਨਾ, ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਫੀਡਬੈਕ (RLHF) ਤੋਂ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਜਾਂ, ਸ਼ਾਇਦ, Kavukcuoglu ਦੁਆਰਾ ਸੰਕੇਤ ਕੀਤੇ ਗਏ ਉੱਨਤ ਤਰਕ ਵਿਧੀਆਂ। ਇਹ ਦੋਹਰਾ ਫੋਕਸ—ਕੋਰ ਇੰਜਣ ਅਤੇ ਬਾਅਦ ਦੇ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਦੋਵਾਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨਾ—Gemini 2.5 ਨੂੰ ਉਹ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜਿਸਨੂੰ Google “ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਇੱਕ ਨਵਾਂ ਪੱਧਰ” ਦੱਸਦਾ ਹੈ। ਇਹਨਾਂ “ਸੋਚਣ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ” ਦਾ ਏਕੀਕਰਨ ਇੱਕ ਵਾਰ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਵਜੋਂ ਨਹੀਂ ਬਲਕਿ Google ਦੇ AI ਪੋਰਟਫੋਲੀਓ ਵਿੱਚ ਭਵਿੱਖ ਦੇ ਵਿਕਾਸ ਲਈ ਇੱਕ ਮੁੱਖ ਦਿਸ਼ਾ ਵਜੋਂ ਹੈ। ਕੰਪਨੀ ਨੇ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਆਪਣਾ ਇਰਾਦਾ ਦੱਸਿਆ: “ਅੱਗੇ ਵਧਦੇ ਹੋਏ, ਅਸੀਂ ਇਹਨਾਂ ਸੋਚਣ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਸਾਡੇ ਸਾਰੇ ਮਾਡਲਾਂ ਵਿੱਚ ਬਣਾ ਰਹੇ ਹਾਂ, ਤਾਂ ਜੋ ਉਹ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਸੰਭਾਲ ਸਕਣ ਅਤੇ ਹੋਰ ਵੀ ਸਮਰੱਥ, ਸੰਦਰਭ-ਜਾਣੂ ਏਜੰਟਾਂ ਦਾ ਸਮਰਥਨ ਕਰ ਸਕਣ।”
ਵਧ ਰਿਹਾ ਸੰਦਰਭ ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਮਝ
ਸ਼ੁੱਧ ਤਰਕ ਤੋਂ ਪਰੇ, ਆਧੁਨਿਕ AI ਦਾ ਇੱਕ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਪਹਿਲੂ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਸਮਝਣ ਦੀ ਇਸਦੀ ਯੋਗਤਾ ਹੈ, ਜੋ ਅਕਸਰ ਵਿਭਿੰਨ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। Gemini 2.5 ਇਸ ਖੇਤਰ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਕਰਦਾ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਇਸਦੇ ਸੰਦਰਭ ਵਿੰਡੋ ਦੇ ਸਬੰਧ ਵਿੱਚ—ਜਾਣਕਾਰੀ ਦੀ ਮਾਤਰਾ ਜਿਸ ‘ਤੇ ਮਾਡਲ ਜਵਾਬ ਤਿਆਰ ਕਰਦੇ ਸਮੇਂ ਇੱਕੋ ਸਮੇਂ ਵਿਚਾਰ ਕਰ ਸਕਦਾ ਹੈ। ਨਵਾਂ ਜਾਰੀ ਕੀਤਾ ਗਿਆ Gemini 2.5 Pro ਇੱਕ ਪ੍ਰਭਾਵਸ਼ਾਲੀ 1 ਮਿਲੀਅਨ ਟੋਕਨ ਸੰਦਰਭ ਵਿੰਡੋ ਦੇ ਨਾਲ ਆਉਂਦਾ ਹੈ। ਇਸ ਨੂੰ ਪਰਿਪੇਖ ਵਿੱਚ ਰੱਖਣ ਲਈ, ਇੱਕ ਮਿਲੀਅਨ ਟੋਕਨ ਸੈਂਕੜੇ ਹਜ਼ਾਰਾਂ ਸ਼ਬਦਾਂ ਨੂੰ ਦਰਸਾ ਸਕਦੇ ਹਨ, ਜੋ ਕਈ ਲੰਬੇ ਨਾਵਲਾਂ ਜਾਂ ਵਿਆਪਕ ਤਕਨੀਕੀ ਦਸਤਾਵੇਜ਼ਾਂ ਦੇ ਬਰਾਬਰ ਹਨ। ਇਹ ਸਮਰੱਥ ਵਿੰਡੋ ਮਾਡਲ ਨੂੰ ਬਹੁਤ ਲੰਬੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ‘ਤੇ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ, ਪੂਰੇ ਕੋਡਬੇਸ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ, ਜਾਂ ਪਹਿਲਾਂ ਦੇ ਵੇਰਵਿਆਂ ਨੂੰ ਗੁਆਏ ਬਿਨਾਂ ਵੱਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।
Google ਉੱਥੇ ਨਹੀਂ ਰੁਕ ਰਿਹਾ; ਇੱਕ ਹੋਰ ਵੀ ਵੱਡੀ 2 ਮਿਲੀਅਨ ਟੋਕਨ ਸੰਦਰਭ ਵਿੰਡੋ ਭਵਿੱਖ ਵਿੱਚ ਰਿਲੀਜ਼ ਲਈ ਤਹਿ ਕੀਤੀ ਗਈ ਹੈ, ਜੋ ਡੂੰਘੀ ਪ੍ਰਸੰਗਿਕ ਸਮਝ ਲਈ ਮਾਡਲ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਹੋਰ ਵਧਾਉਂਦੀ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, Google ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਵਿਸਤ੍ਰਿਤ ਸੰਦਰਭ ਵਿੰਡੋ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਗਿਰਾਵਟ ਦੀ ਕੀਮਤ ‘ਤੇ ਨਹੀਂ ਆਉਂਦੀ ਹੈ। ਇਸ ਦੀ ਬਜਾਏ, ਉਹ “ਮਜ਼ਬੂਤ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਦਾਅਵਾ ਕਰਦੇ ਹਨ ਜੋ ਪਿਛਲੀਆਂ ਪੀੜ੍ਹੀਆਂ ਨਾਲੋਂ ਬਿਹਤਰ ਹੁੰਦਾ ਹੈ,” ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਬਿਨਾਂ ਕਿਸੇ ਰੁਕਾਵਟ ਜਾਂ ਫੋਕਸ ਗੁਆਏ ਵਿਸਤ੍ਰਿਤ ਸੰਦਰਭ ਦੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
ਵਿਆਪਕ ਸੰਦਰਭ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਇਹ ਯੋਗਤਾ ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ ਨਾਲ ਸ਼ਕਤੀਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਜੁੜੀ ਹੋਈ ਹੈ। Gemini 2.5 ਸਿਰਫ਼ ਟੈਕਸਟ ਤੱਕ ਹੀ ਸੀਮਿਤ ਨਹੀਂ ਹੈ; ਇਹ ਟੈਕਸਟ, ਆਡੀਓ, ਚਿੱਤਰ, ਵੀਡੀਓ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਪੂਰੇ ਕੋਡ ਰਿਪੋਜ਼ਟਰੀਆਂ ਵਜੋਂ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਜਾਣਕਾਰੀ ਨੂੰ ਸਮਝਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਬਹੁਪੱਖੀਤਾ ਅਮੀਰ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਅਤੇ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। ਕਲਪਨਾ ਕਰੋ ਕਿ ਮਾਡਲ ਨੂੰ ਇੱਕ ਵੀਡੀਓ ਟਿਊਟੋਰਿਅਲ, ਇੱਕ ਤਕਨੀਕੀ ਚਿੱਤਰ, ਅਤੇ ਇੱਕ ਕੋਡ ਸਨਿੱਪਟ ਫੀਡ ਕਰਨਾ, ਅਤੇ ਇਸਨੂੰ ਦਸਤਾਵੇਜ਼ ਤਿਆਰ ਕਰਨ ਜਾਂ ਤਿੰਨੋਂ ਇਨਪੁਟਸ ਦੇ ਅਧਾਰ ਤੇ ਸੰਭਾਵੀ ਮੁੱਦਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਕਹਿਣਾ। ਵੱਖ-ਵੱਖ ਡਾਟਾ ਕਿਸਮਾਂ ਵਿੱਚ ਇਹ ਏਕੀਕ੍ਰਿਤ ਸਮਝ ਸੱਚਮੁੱਚ ਬੁੱਧੀਮਾਨ ਐਪਲੀਕੇਸ਼ਨਾਂ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਸੰਸਾਰ ਨਾਲ ਵਧੇਰੇ ਮਨੁੱਖੀ-ਵਰਗੇ ਤਰੀਕੇ ਨਾਲ ਗੱਲਬਾਤ ਕਰ ਸਕਦੀਆਂ ਹਨ। “ਪੂਰੇ ਕੋਡ ਰਿਪੋਜ਼ਟਰੀਆਂ” ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਾਫਟਵੇਅਰ ਵਿਕਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਖਾਸ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿਵੇਂ ਕਿ ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ ਰੀਫੈਕਟਰਿੰਗ, ਗੁੰਝਲਦਾਰ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਬੱਗ ਖੋਜ, ਜਾਂ ਇੱਕ ਸਾਫਟਵੇਅਰ ਸਿਸਟਮ ਦੇ ਅੰਦਰ ਗੁੰਝਲਦਾਰ ਨਿਰਭਰਤਾਵਾਂ ਨੂੰ ਸਮਝਣਾ।
ਡਿਵੈਲਪਰ ਫੋਕਸ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸੰਭਾਵਨਾ
Google ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਉੱਦਮਾਂ ਨੂੰ Gemini 2.5 Pro ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਪੜਚੋਲ ਕਰਨ ਲਈ ਸਰਗਰਮੀ ਨਾਲ ਉਤਸ਼ਾਹਿਤ ਕਰ ਰਿਹਾ ਹੈ, ਇਸਨੂੰ Google AI Studio ਦੁਆਰਾ ਤੁਰੰਤ ਪਹੁੰਚਯੋਗ ਬਣਾ ਰਿਹਾ ਹੈ। Google ਦੇ ਪ੍ਰਬੰਧਿਤ AI ਪਲੇਟਫਾਰਮ, Vertex AI ਦੁਆਰਾ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਗਾਹਕਾਂ ਲਈ ਉਪਲਬਧਤਾ ਜਲਦੀ ਹੀ ਉਮੀਦ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਰੋਲਆਊਟ ਰਣਨੀਤੀ ਮਾਡਲ ਨੂੰ ਬਿਲਡਰਾਂ ਦੇ ਹੱਥਾਂ ਵਿੱਚ ਪਹੁੰਚਾਉਣ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੀ ਹੈ ਜੋ ਨਾਵਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਵਰਕਫਲੋ ਬਣਾਉਣਾ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹਨ।
ਕੰਪਨੀ ਖਾਸ ਤੌਰ ‘ਤੇ ਕੁਝ ਕਿਸਮਾਂ ਦੇ ਵਿਕਾਸ ਕਾਰਜਾਂ ਲਈ ਮਾਡਲ ਦੀ ਯੋਗਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ। Google ਨੇ ਨੋਟ ਕੀਤਾ, “2.5 Pro ਦ੍ਰਿਸ਼ਟੀਗਤ ਤੌਰ ‘ਤੇ ਆਕਰਸ਼ਕ ਵੈੱਬ ਐਪਸ ਅਤੇ ਏਜੰਟਿਕ ਕੋਡ ਐਪਲੀਕੇਸ਼ਨਾਂ ਬਣਾਉਣ ਦੇ ਨਾਲ-ਨਾਲ ਕੋਡ ਪਰਿਵਰਤਨ ਅਤੇ ਸੰਪਾਦਨ ਵਿੱਚ ਉੱਤਮ ਹੈ।” “ਏਜੰਟਿਕ ਕੋਡ ਐਪਲੀਕੇਸ਼ਨਾਂ” ਦਾ ਜ਼ਿਕਰ ਖਾਸ ਤੌਰ ‘ਤੇ ਦਿਲਚਸਪ ਹੈ। ਇਹ AI ਪ੍ਰਣਾਲੀਆਂ ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ ਜੋ ਵਧੇਰੇ ਖੁਦਮੁਖਤਿਆਰੀ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਸ਼ਾਇਦ ਗੁੰਝਲਦਾਰ ਕੋਡਿੰਗ ਕਾਰਜਾਂ ਨੂੰ ਛੋਟੇ ਕਦਮਾਂ ਵਿੱਚ ਵੰਡਣਾ, ਕੋਡ ਲਿਖਣਾ, ਇਸਦੀ ਜਾਂਚ ਕਰਨਾ, ਅਤੇ ਘੱਟ ਮਨੁੱਖੀ ਦਖਲ ਨਾਲ ਇਸਨੂੰ ਡੀਬੱਗ ਕਰਨਾ। SWE-Bench Verified ਬੈਂਚਮਾਰਕ ‘ਤੇ ਪ੍ਰਦਰਸ਼ਨ, ਜਿੱਥੇ Gemini 2.5 Pro ਇੱਕ ਕਸਟਮ ਏਜੰਟ ਸੈੱਟਅੱਪ ਦੀ ਵਰਤੋਂ ਕਰਕੇ 63.8% ਸਕੋਰ ਕਰਦਾ ਹੈ, ਇਹਨਾਂ ਦਾਅਵਿਆਂ ਨੂੰ ਭਰੋਸਾ ਦਿੰਦਾ ਹੈ। SWE-Bench (Software Engineering Benchmark) ਖਾਸ ਤੌਰ ‘ਤੇ ਅਸਲ-ਸੰਸਾਰ GitHub ਮੁੱਦਿਆਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਮਾਡਲਾਂ ਦੀ ਯੋਗਤਾ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ, ਇੱਕ ਉੱਚ ਸਕੋਰ ਨੂੰ ਵਿਹਾਰਕ ਕੋਡਿੰਗ ਸਹਾਇਤਾ ਸਮਰੱਥਾਵਾਂ ਦਾ ਸੂਚਕ ਬਣਾਉਂਦਾ ਹੈ।
ਇਹਨਾਂ ਉੱਨਤ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣ ਲਈ ਉਤਸੁਕ ਡਿਵੈਲਪਰਾਂ ਲਈ, ਮਾਡਲ Google AI Studio ਵਿੱਚ ਪ੍ਰਯੋਗ ਲਈ ਤਿਆਰ ਹੈ। ਅੱਗੇ ਦੇਖਦੇ ਹੋਏ, Google ਉਤਪਾਦਨ ਵਾਤਾਵਰਨ ਲਈ ਢੁਕਵੀਂ ਉੱਚ ਦਰ ਸੀਮਾਵਾਂ ਦੀ ਲੋੜ ਵਾਲੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਇੱਕ ਕੀਮਤ ਢਾਂਚਾ ਪੇਸ਼ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾ ਰਿਹਾ ਹੈ। ਇਹ ਪੱਧਰੀ ਪਹੁੰਚ ਸ਼ੁਰੂ ਵਿੱਚ ਵਿਆਪਕ ਪ੍ਰਯੋਗ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜਿਸ ਤੋਂ ਬਾਅਦ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਸਕੇਲੇਬਲ ਤੈਨਾਤੀ ਵਿਕਲਪ ਹੁੰਦੇ ਹਨ। ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ‘ਤੇ ਜ਼ੋਰ ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Google Gemini 2.5 ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਖੋਜ ਮੀਲ ਪੱਥਰ ਵਜੋਂ ਨਹੀਂ ਬਲਕਿ AI-ਸੰਚਾਲਿਤ ਟੂਲਸ ਅਤੇ ਸੇਵਾਵਾਂ ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਇੰਜਣ ਵਜੋਂ ਦੇਖਦਾ ਹੈ।
Google ਦੇ AI ਈਕੋਸਿਸਟਮ ਵਿੱਚ Gemini 2.5 ਨੂੰ ਸਥਾਪਿਤ ਕਰਨਾ
Gemini 2.5 ਦੀ ਸ਼ੁਰੂਆਤ ਅਲੱਗ-ਥਲੱਗ ਨਹੀਂ ਹੁੰਦੀ; ਇਹ Google ‘ਤੇ ਪ੍ਰਗਟ ਹੋ ਰਹੀ ਇੱਕ ਵਿਆਪਕ, ਬਹੁ-ਪੱਖੀ AI ਰਣਨੀਤੀ ਦਾ ਹਿੱਸਾ ਹੈ। ਇਹ Google Gemma 3 ਦੀ ਰਿਲੀਜ਼ ਦੇ ਨੇੜੇ ਹੈ, ਕੰਪਨੀ ਦੇ ਓਪਨ-ਵੇਟ ਮਾਡਲਾਂ ਦੇ ਪਰਿਵਾਰ ਵਿੱਚ ਨਵੀਨਤਮ ਦੁਹਰਾਓ। ਜਦੋਂ ਕਿ Gemini ਮਾਡਲ Google ਦੀਆਂ ਅਤਿ-ਆਧੁਨਿਕ, ਬੰਦ-ਸਰੋਤ ਪੇਸ਼ਕਸ਼ਾਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, Gemma ਪਰਿਵਾਰ ਓਪਨ-ਸੋਰਸ ਕਮਿਊਨਿਟੀ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਵਧੇਰੇ ਪਹੁੰਚਯੋਗ ਮਾਡਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਵਿਆਪਕ ਨਵੀਨਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ। ਉੱਚ-ਅੰਤ ਦੇ ਮਲਕੀਅਤ ਵਾਲੇ ਮਾਡਲਾਂ ਅਤੇ ਓਪਨ-ਵੇਟ ਵਿਕਲਪਾਂ ਦੋਵਾਂ ਦਾ ਸਮਾਨਾਂਤਰ ਵਿਕਾਸ AI ਲੈਂਡਸਕੇਪ ਲਈ Google ਦੀ ਵਿਆਪਕ ਪਹੁੰਚ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
ਇਸ ਤੋਂ ਇਲਾਵਾ, Google ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਨੇਟਿਵ ਚਿੱਤਰ ਉਤਪਤੀ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਪੇਸ਼ ਕਰਕੇ ਆਪਣੇ Gemini 2.0 Flash ਮਾਡਲ ਨੂੰ ਵਧਾਇਆ ਹੈ। ਇਹ ਵਿਸ਼ੇਸ਼ਤਾ ਮਲਟੀਮੋਡਲ ਇਨਪੁਟ ਸਮਝ (ਜਿਵੇਂ ਕਿ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ) ਨੂੰ ਉੱਨਤ ਤਰਕ ਅਤੇ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰਦੀ ਹੈ ਤਾਂ ਜੋ ਸਿੱਧੇ AI ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੇ ਅੰਦਰ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਵਿਜ਼ੂਅਲ ਤਿਆਰ ਕੀਤੇ ਜਾ ਸਕਣ। ਇਹ ਕਦਮ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੇ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਅਤੇ ਏਕੀਕ੍ਰਿਤ ਮਲਟੀਮੋਡੈਲਿਟੀ ਦੇ ਵਧ ਰਹੇ ਮਹੱਤਵ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦਾ ਹੈ, ਜਿੱਥੇ AI ਇੱਕ ਸਿੰਗਲ ਗੱਲਬਾਤ ਸੰਦਰਭ ਦੇ ਅੰਦਰ ਟੈਕਸਟ, ਚਿੱਤਰ, ਕੋਡ ਅਤੇ ਹੋਰ ਡਾਟਾ ਕਿਸਮਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਤਿਆਰ ਕਰਨ ਦੇ ਵਿਚਕਾਰ ਸਹਿਜੇ ਹੀ ਤਬਦੀਲ ਹੋ ਸਕਦਾ ਹੈ। Gemini 2.5, ਇਸਦੀ ਅੰਦਰੂਨੀ ਮਲਟੀਮੋਡਲ ਸਮਝ ਦੇ ਨਾਲ, ਇਸ ਨੀਂਹ ‘ਤੇ ਬਣਦਾ ਹੈ, ਉਹਨਾਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇੱਕ ਹੋਰ ਵੀ ਸ਼ਕਤੀਸ਼ਾਲੀ ਪਲੇਟਫਾਰਮ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੀ ਜਾਣਕਾਰੀ ਨੂੰ ਮਿਲਾਉਂਦੀਆਂ ਹਨ।
ਮੁਕਾਬਲੇ ਦੀ ਸ਼ਤਰੰਜ: ਵਿਰੋਧੀ ਜਵਾਬ ਦਿੰਦੇ ਹਨ
Gemini 2.5 ਦੇ ਨਾਲ Google ਦੀਆਂ ਤਰੱਕੀਆਂ ਇੱਕ ਤੀਬਰ ਮੁਕਾਬਲੇ ਵਾਲੇ ਮਾਹੌਲ ਵਿੱਚ ਹੋ ਰਹੀਆਂ ਹਨ ਜਿੱਥੇ ਪ੍ਰਮੁੱਖ ਖਿਡਾਰੀ ਲਗਾਤਾਰ ਲੀਡਰਸ਼ਿਪ ਲਈ ਮੁਕਾਬਲਾ ਕਰ ਰਹੇ ਹਨ। Google ਦੁਆਰਾ ਦੱਸੇ ਗਏ ਬੈਂਚਮਾਰਕ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ Gemini 2.5 ਨੂੰ OpenAI, Anthropic, ਅਤੇ ਹੋਰਾਂ ਦੇ ਮਾਡਲਾਂ ਦੇ ਵਿਰੁੱਧ ਸਥਿਤੀ ਦਿੰਦੇ ਹਨ, ਇਸ ਮੁਕਾਬਲੇ ਦੀ ਸਿੱਧੀ ਪ੍ਰਕਿਰਤੀ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਨ।
OpenAI, ਇੱਕ ਪ੍ਰਮੁੱਖ ਵਿਰੋਧੀ, ਵੀ ਸਰਗਰਮ ਰਿਹਾ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਆਪਣਾ GPT-4o ਮਾਡਲ ਲਾਂਚ ਕਰ ਰਿਹਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਖੁਦ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ ਹਨ, ਜਿਸ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਰੀਅਲ-ਟਾਈਮ ਵੌਇਸ ਅਤੇ ਵਿਜ਼ਨ ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਾਮਲ ਹਨ, Gemini Flash ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤੇ ਗਏ ਸੰਕਲਪ ਦੇ ਸਮਾਨ ਏਕੀਕ੍ਰਿਤ ਚਿੱਤਰ ਉਤਪਤੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਨਾਲ। ਦੌੜ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ AI ਬਣਾਉਣ ‘ਤੇ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਟੈਕਸਟ-ਅਧਾਰਿਤ ਤਰਕ ਵਿੱਚ ਬੁੱਧੀਮਾਨ ਹੈ ਬਲਕਿ ਕਈ ਤਰੀਕਿਆਂ ਨਾਲ ਸਮਝਦਾਰ ਅਤੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵੀ ਵੀ ਹੈ।
ਇਸ ਦੌਰਾਨ, ਇੱਕ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਖਿਡਾਰੀ, DeepSeek, ਨੇ Google ਦੀ ਘੋਸ਼ਣਾ ਦੇ ਨਾਲ ਹੀ ਸੁਰਖੀਆਂ ਬਟੋਰੀਆਂ। Google ਦੇ ਖੁਲਾਸੇ ਤੋਂ ਪਹਿਲਾਂ ਸੋਮਵਾਰ ਨੂੰ, DeepSeek ਨੇ ਆਪਣੇ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ AI ਮਾਡਲ, ਜਿਸਨੂੰ DeepSeek-V3 ਨਾਮ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਦੇ ਅਪਡੇਟ ਦੀ ਘੋਸ਼ਣਾ ਕੀਤੀ। ਅੱਪਡੇਟ ਕੀਤੇ ਸੰਸਕਰਣ, ‘DeepSeek V3-0324’, ਨੇ ਇੱਕ ਕਮਾਲ ਦਾ ਅੰਤਰ ਪ੍ਰਾਪਤ ਕੀਤਾ: ਇਹ ਕੁਝ ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ ਸਾਰੇ “ਗੈਰ-ਤਰਕ” ਮਾਡਲਾਂ ਵਿੱਚੋਂ ਸਭ ਤੋਂ ਉੱਚੇ ਸਥਾਨ ‘ਤੇ ਹੈ। Artificial Analysis, AI ਮਾਡਲ ਬੈਂਚਮਾਰਕਿੰਗ ਵਿੱਚ ਮੁਹਾਰਤ ਰੱਖਣ ਵਾਲਾ ਇੱਕ ਪਲੇਟਫਾਰਮ, ਨੇ ਇਸ ਪ੍ਰਾਪਤੀ ਦੀ ਮਹੱਤਤਾ ‘ਤੇ ਟਿੱਪਣੀ ਕੀਤੀ: “ਇਹ ਪਹਿਲੀ ਵਾਰ ਹੈ ਜਦੋਂ ਇੱਕ ਓਪਨ ਵੇਟਸ ਮਾਡਲ ਪ੍ਰਮੁੱਖ ਗੈਰ-ਤਰਕ ਮਾਡਲ ਹੈ, ਜੋ ਓਪਨ ਸੋਰਸ ਲਈ ਇੱਕ ਮੀਲ ਪੱਥਰ ਦੀ ਨਿਸ਼ਾਨਦੇਹੀ ਕਰਦਾ ਹੈ।” DeepSeek V3 ਨੇ ਇਸ ਸ਼੍ਰੇਣੀ ਦੇ ਅੰਦਰ ਪਲੇਟਫਾਰਮ ਦੇ ‘Intelligence Index’ ‘ਤੇ ਚੋਟੀ ਦੇ ਅੰਕ ਪ੍ਰਾਪਤ ਕੀਤੇ, ਓਪਨ-ਵੇਟ ਮਾਡਲਾਂ ਦੀ ਵਧ ਰਹੀ ਸ਼ਕਤੀ ਅਤੇ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, ਭਾਵੇਂ ਉਹ Gemini 2.5 ਵਰਗੇ ਮਾਡਲਾਂ ਦੁਆਰਾ ਨਿਸ਼ਾਨਾ ਬਣਾਏ ਗਏ ਗੁੰਝਲਦਾਰ, ਬਹੁ-ਪੜਾਵੀ ਤਰਕ ਲਈ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਅਨੁਕੂਲਿਤ ਨਾ ਹੋਣ।
ਇਸ ਸਾਜ਼ਿਸ਼ ਨੂੰ ਜੋੜਦੇ ਹੋਏ, ਰਿਪੋਰਟਾਂ ਸਾਹਮਣੇ ਆਈਆਂ, ਖਾਸ ਤੌਰ ‘ਤੇ Reuters ਤੋਂ, ਇਹ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਕਿ DeepSeek ਆਪਣੀਆਂ ਯੋਜਨਾਵਾਂ ਨੂੰ ਤੇਜ਼ ਕਰ ਰਿਹਾ ਹੈ। ਕੰਪਨੀ ਆਪਣਾ ਅਗਲਾ ਪ੍ਰਮੁੱਖ ਮਾਡਲ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ R2 ਨਾਮਕ, “ਜਿੰਨੀ ਜਲਦੀ ਹੋ ਸਕੇ” ਜਾਰੀ ਕਰਨ ਦਾ ਇਰਾਦਾ ਰੱਖਦੀ ਹੈ। ਸ਼ੁਰੂ ਵਿੱਚ ਮਈ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਯੋਜਨਾ ਬਣਾਈ ਗਈ ਸੀ, ਸਮਾਂ-ਸੀਮਾ ਹੁਣ ਹੋਰ ਵੀ ਜਲਦੀ ਹੋ ਸਕਦੀ ਹੈ, ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ DeepSeek Google ਅਤੇ OpenAI ਦੁਆਰਾ ਕੀਤੀਆਂ ਗਈਆਂ ਚਾਲਾਂ ਦਾ ਮੁਕਾਬਲਾ ਕਰਨ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਆਪਣੀਆਂ ਉੱਨਤ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਪੇਸ਼ ਕਰਨ ਲਈ ਉਤਸੁਕ ਹੈ।
Google, OpenAI, ਅਤੇ DeepSeek ਦੀਆਂ ਇਹਨਾਂ ਗਤੀਵਿਧੀਆਂ ਦੀ ਭੀੜ AI ਖੇਤਰ ਦੀ ਗਤੀਸ਼ੀਲ ਅਤੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਤ ਹੋ ਰਹੀ ਪ੍ਰਕਿਰਤੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਹਰੇਕ