ਕੀ GPT-4.5 ਅਸਫਲ ਰਿਹਾ?

GPT-4.5 ਦਾ ਪੈਮਾਨਾ ਅਤੇ ਦਾਇਰਾ

GPT-4.5, OpenAI ਦਾ ਹੁਣ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਵੱਡਾ ਉੱਦਮ ਹੈ, ਜਿਸਦਾ ਆਕਾਰ ਬਹੁਤ ਵੱਡਾ ਹੈ। ਭਾਵੇਂ ਇਸਦੇ ਢਾਂਚੇ ਅਤੇ ਸਿਖਲਾਈ ਡੇਟਾ ਬਾਰੇ ਸਹੀ ਵੇਰਵੇ ਘੱਟ ਹਨ, ਪਰ ਇਹ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ ਕਿ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਇੰਨੀ ਜ਼ਿਆਦਾ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਸੀ ਕਿ ਇਸਨੂੰ ਕਈ ਡੇਟਾ ਸੈਂਟਰਾਂ ਵਿੱਚ ਵੰਡਣ ਦੀ ਲੋੜ ਪਈ। ਇਹ ਇਕੱਲਾ ਹੀ ਇਸਦੇ ਵਿਕਾਸ ਵਿੱਚ ਲਗਾਏ ਗਏ ਵੱਡੇ ਸਰੋਤਾਂ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।

ਮਾਡਲ ਦੀ ਕੀਮਤ ਬਣਤਰ ਇਸਦੀ ਪ੍ਰੀਮੀਅਮ ਪੇਸ਼ਕਸ਼ ਵਜੋਂ ਸਥਿਤੀ ਨੂੰ ਹੋਰ ਮਜ਼ਬੂਤ ਕਰਦੀ ਹੈ। ਲਾਗਤਾਂ ਇਸਦੇ ਪੂਰਵਜਾਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਹਨ, GPT-4o ਤੋਂ 15-30 ਗੁਣਾ, o1 ਤੋਂ 3-5 ਗੁਣਾ, ਅਤੇ Claude 3.7 Sonnet ਤੋਂ 10-25 ਗੁਣਾ ਵੱਧ। ਐਕਸੈਸ ਵਰਤਮਾਨ ਵਿੱਚ ChatGPT Pro ਗਾਹਕਾਂ (ਪ੍ਰਤੀ ਮਹੀਨਾ $200 ਦੀ ਵੱਡੀ ਰਕਮ ‘ਤੇ) ਅਤੇ API ਕਲਾਇੰਟਸ ਤੱਕ ਸੀਮਿਤ ਹੈ ਜੋ ਪ੍ਰਤੀ-ਟੋਕਨ ਆਧਾਰ ‘ਤੇ ਭੁਗਤਾਨ ਕਰਨ ਲਈ ਤਿਆਰ ਹਨ।

ਹਾਲਾਂਕਿ, ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਵਾਧਾ, ਘੱਟੋ-ਘੱਟ ਕੁਝ ਖੇਤਰਾਂ ਵਿੱਚ, ਕੀਮਤ ਦੇ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ। ਸ਼ੁਰੂਆਤੀ ਬੈਂਚਮਾਰਕਾਂ ਨੇ GPT-4o ਦੇ ਮੁਕਾਬਲੇ ਸਿਰਫ ਮਾਮੂਲੀ ਸੁਧਾਰ ਦਿਖਾਏ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ GPT-4.5 ਨੂੰ o1 ਅਤੇ o3-mini ਵਰਗੇ ਮਾਡਲਾਂ ਤੋਂ ਤਰਕ ਦੇ ਕੰਮਾਂ ਵਿੱਚ ਪਿੱਛੇ ਰਹਿ ਗਿਆ ਦਿਖਾਇਆ।

GPT-4.5 ਦੇ ਇਰਾਦੇ ਵਾਲੇ ਉਦੇਸ਼ ਨੂੰ ਸਮਝਣਾ

ਇਹ ਸਵੀਕਾਰ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ OpenAI ਨੇ ਕਦੇ ਵੀ GPT-4.5 ਨੂੰ ਆਪਣੇ ਫਲੈਗਸ਼ਿਪ, ਸਰਵ-ਉਦੇਸ਼ੀ ਮਾਡਲ ਵਜੋਂ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਮਾਰਕੀਟ ਨਹੀਂ ਕੀਤਾ। ਦਰਅਸਲ, ਉਹਨਾਂ ਦੇ ਬਲੌਗ ਪੋਸਟ ਦੇ ਸ਼ੁਰੂਆਤੀ ਸੰਸਕਰਣਾਂ ਨੇ ਸਪੱਸ਼ਟ ਕੀਤਾ ਕਿ ਇਹ ਸਮਰੱਥਾ ਦੀਆਂ ਪੂਰਨ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਾਲਾ “ਫਰੰਟੀਅਰ ਮਾਡਲ” ਨਹੀਂ ਬਣਨਾ ਸੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਇੱਕ ਤਰਕ ਮਾਡਲ ਵਜੋਂ ਤਿਆਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਿਸ ਨਾਲ ਉਸ ਉਦੇਸ਼ ਲਈ ਅਨੁਕੂਲਿਤ ਮਾਡਲਾਂ (ਜਿਵੇਂ ਕਿ o3 ਅਤੇ DeepSeek-R1) ਨਾਲ ਸਿੱਧੀ ਤੁਲਨਾ ਕੁਝ ਹੱਦ ਤੱਕ ਗੁੰਮਰਾਹਕੁੰਨ ਹੈ।

OpenAI ਨੇ ਸੰਕੇਤ ਦਿੱਤਾ ਹੈ ਕਿ GPT-4.5 ਉਹਨਾਂ ਦਾ ਅੰਤਮ ਗੈਰ-ਚੇਨ-ਆਫ-ਥਾਟ ਮਾਡਲ ਹੋਵੇਗਾ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਸਦੀ ਸਿਖਲਾਈ ਨੇ ਗੁੰਝਲਦਾਰ ਤਰਕ ਯੋਗਤਾਵਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਦੀ ਬਜਾਏ, ਵਿਸ਼ਵ ਗਿਆਨ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਅਤੇ ਉਪਭੋਗਤਾ ਦੀਆਂ ਤਰਜੀਹਾਂ ਨਾਲ ਮੇਲ ਕਰਨ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਧਿਆਨ ਦਿੱਤਾ।

ਜਿੱਥੇ GPT-4.5 ਚਮਕ ਸਕਦਾ ਹੈ: ਗਿਆਨ ਅਤੇ ਸੂਖਮਤਾ

ਵੱਡੇ ਮਾਡਲਾਂ ਦਾ ਮੁੱਖ ਫਾਇਦਾ ਅਕਸਰ ਗਿਆਨ ਪ੍ਰਾਪਤੀ ਲਈ ਉਹਨਾਂ ਦੀ ਵਿਸਤ੍ਰਿਤ ਸਮਰੱਥਾ ਵਿੱਚ ਹੁੰਦਾ ਹੈ। GPT-4.5, ਇਸ ਸਿਧਾਂਤ ਦੇ ਅਨੁਸਾਰ, ਆਪਣੇ ਛੋਟੇ ਹਮਰੁਤਬਾ ਦੇ ਮੁਕਾਬਲੇ ਭਰਮ ਪੈਦਾ ਕਰਨ ਦੀ ਘੱਟ ਪ੍ਰਵਿਰਤੀ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਇਸਨੂੰ ਉਹਨਾਂ ਸਥਿਤੀਆਂ ਵਿੱਚ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕੀਮਤੀ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਤੱਥਾਂ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਜਾਣਕਾਰੀ ਦੀ ਸਖਤੀ ਨਾਲ ਪਾਲਣਾ ਕਰਨਾ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, GPT-4.5 ਉਪਭੋਗਤਾ ਨਿਰਦੇਸ਼ਾਂ ਅਤੇ ਤਰਜੀਹਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦੀ ਇੱਕ ਵਧੀ ਹੋਈ ਯੋਗਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਸਨੂੰ OpenAI ਦੁਆਰਾ ਵੱਖ-ਵੱਖ ਪ੍ਰਦਰਸ਼ਨਾਂ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਔਨਲਾਈਨ ਸਾਂਝੇ ਕੀਤੇ ਉਪਭੋਗਤਾ ਅਨੁਭਵਾਂ ਦੁਆਰਾ ਪੁਸ਼ਟੀ ਕੀਤੀ ਗਈ ਹੈ। ਮਾਡਲ ਉਪਭੋਗਤਾ ਦੇ ਇਰਾਦੇ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਨੂੰ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਮਝਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਧੇਰੇ ਅਨੁਕੂਲਿਤ ਅਤੇ ਢੁਕਵੇਂ ਆਉਟਪੁੱਟ ਹੁੰਦੇ ਹਨ।

ਵਾਰਤਕ ਗੁਣਵੱਤਾ ‘ਤੇ ਬਹਿਸ: ਵਿਅਕਤੀਗਤਤਾ ਅਤੇ ਸੰਭਾਵਨਾ

GPT-4.5 ਦੀ ਉੱਤਮ ਵਾਰਤਕ ਪੈਦਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਇੱਕ ਜੀਵੰਤ ਚਰਚਾ ਸ਼ੁਰੂ ਹੋਈ ਹੈ। ਕੁਝ OpenAI ਅਧਿਕਾਰੀਆਂ ਨੇ ਮਾਡਲ ਦੀ ਆਉਟਪੁੱਟ ਗੁਣਵੱਤਾ ਦੀ ਸ਼ਲਾਘਾ ਕੀਤੀ ਹੈ, CEO ਸੈਮ ਆਲਟਮੈਨ ਨੇ ਇੱਥੋਂ ਤੱਕ ਸੁਝਾਅ ਦਿੱਤਾ ਹੈ ਕਿ ਇਸ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਨਾਲ ਕੁਝ ਸਮਝਦਾਰ ਟੈਸਟਰਾਂ ਲਈ “AGI” (ਆਰਟੀਫੀਸ਼ੀਅਲ ਜਨਰਲ ਇੰਟੈਲੀਜੈਂਸ) ਦੀ ਇੱਕ ਝਲਕ ਮਿਲੀ।

ਹਾਲਾਂਕਿ, ਵਿਆਪਕ ਪ੍ਰਤੀਕ੍ਰਿਆ ਨਿਰਣਾਇਕ ਤੌਰ ‘ਤੇ ਮਿਸ਼ਰਤ ਰਹੀ ਹੈ। OpenAI ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ ਆਂਡਰੇਜ ਕਾਰਪੈਥੀ ਨੇ ਸ਼ੁੱਧ ਤਰਕ ‘ਤੇ ਘੱਟ ਨਿਰਭਰ ਕੰਮਾਂ ਵਿੱਚ ਸੁਧਾਰ ਦੀ ਉਮੀਦ ਕੀਤੀ, “EQ” (ਭਾਵਨਾਤਮਕ ਬੁੱਧੀ), ਰਚਨਾਤਮਕਤਾ, ਸਮਾਨਤਾ-ਨਿਰਮਾਣ, ਅਤੇ ਹਾਸੇ-ਮਜ਼ਾਕ ਵਰਗੇ ਖੇਤਰਾਂ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ - ਉਹ ਪਹਿਲੂ ਜੋ ਅਕਸਰ ਵਿਸ਼ਵ ਗਿਆਨ ਅਤੇ ਆਮ ਸਮਝ ਦੁਆਰਾ ਰੁਕਾਵਟ ਬਣਦੇ ਹਨ।

ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, ਕਾਰਪੈਥੀ ਦੁਆਰਾ ਕਰਵਾਏ ਗਏ ਇੱਕ ਬਾਅਦ ਦੇ ਸਰਵੇਖਣ ਨੇ ਲਿਖਣ ਦੀ ਗੁਣਵੱਤਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ GPT-4.5 ਦੇ ਜਵਾਬਾਂ ਨਾਲੋਂ GPT-4o ਦੇ ਜਵਾਬਾਂ ਲਈ ਇੱਕ ਆਮ ਉਪਭੋਗਤਾ ਤਰਜੀਹ ਦਾ ਖੁਲਾਸਾ ਕੀਤਾ। ਇਹ ਵਾਰਤਕ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਵਿੱਚ ਅੰਦਰੂਨੀ ਵਿਅਕਤੀਗਤਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ ਅਤੇ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਹੁਨਰਮੰਦ ਪ੍ਰੋਂਪਟ ਇੰਜੀਨੀਅਰਿੰਗ ਛੋਟੇ, ਵਧੇਰੇ ਕੁਸ਼ਲ ਮਾਡਲਾਂ ਤੋਂ ਤੁਲਨਾਤਮਕ ਗੁਣਵੱਤਾ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੀ ਹੈ।

ਕਾਰਪੈਥੀ ਨੇ ਖੁਦ ਨਤੀਜਿਆਂ ਦੀ ਅਸਪਸ਼ਟਤਾ ਨੂੰ ਸਵੀਕਾਰ ਕੀਤਾ, ਵੱਖ-ਵੱਖ ਸੰਭਾਵਿਤ ਵਿਆਖਿਆਵਾਂ ਦਾ ਸੁਝਾਅ ਦਿੱਤਾ: “ਉੱਚ-ਸੁਆਦ” ਵਾਲੇ ਟੈਸਟਰ ਸੂਖਮ ਢਾਂਚਾਗਤ ਸੁਧਾਰਾਂ ਨੂੰ ਸਮਝ ਸਕਦੇ ਹਨ ਜੋ ਦੂਜਿਆਂ ਦੁਆਰਾ ਖੁੰਝ ਗਏ ਹਨ, ਟੈਸਟ ਕੀਤੇ ਗਏ ਉਦਾਹਰਣ ਆਦਰਸ਼ ਨਹੀਂ ਹੋ ਸਕਦੇ ਹਨ, ਜਾਂ ਅੰਤਰ ਇੱਕ ਛੋਟੇ ਨਮੂਨੇ ਦੇ ਆਕਾਰ ਵਿੱਚ ਸਮਝਣ ਲਈ ਬਹੁਤ ਸੂਖਮ ਹੋ ਸਕਦੇ ਹਨ।

ਸਕੇਲਿੰਗ ਦੀਆਂ ਸੀਮਾਵਾਂ ਅਤੇ LLMs ਦਾ ਭਵਿੱਖ

GPT-4.5 ਦੀ ਰਿਲੀਜ਼, ਕੁਝ ਪਹਿਲੂਆਂ ਵਿੱਚ, ਵੱਡੇ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲਾਂ ਨੂੰ ਸਿਰਫ਼ ਸਕੇਲ ਕਰਨ ਦੀਆਂ ਸੰਭਾਵੀ ਸੀਮਾਵਾਂ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦੀ ਹੈ। ਇਲਿਆ ਸੁਤਸਕੇਵਰ, ਇੱਕ ਹੋਰ OpenAI ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ ਸਾਬਕਾ ਮੁੱਖ ਵਿਗਿਆਨੀ, ਨੇ NeurIPS 2024 ਵਿੱਚ ਮਸ਼ਹੂਰ ਤੌਰ ‘ਤੇ ਕਿਹਾ ਕਿ “ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਜਾਣਦੇਹਾਂ ਕਿ ਇਹ ਬਿਨਾਂ ਸ਼ੱਕ ਖਤਮ ਹੋ ਜਾਵੇਗੀ… ਅਸੀਂ ਸਿਖਰਲੇ ਡੇਟਾ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰ ਲਿਆ ਹੈ ਅਤੇ ਹੋਰ ਕੋਈ ਨਹੀਂ ਹੋਵੇਗਾ। ਸਾਨੂੰ ਉਸ ਡੇਟਾ ਨਾਲ ਨਜਿੱਠਣਾ ਪਵੇਗਾ ਜੋ ਸਾਡੇ ਕੋਲ ਹੈ। ਇੱਥੇ ਸਿਰਫ਼ ਇੱਕ ਇੰਟਰਨੈਟ ਹੈ।”

GPT-4.5 ਦੇ ਨਾਲ ਦੇਖੇ ਗਏ ਘੱਟਦੇ ਰਿਟਰਨ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ ਮਾਡਲਾਂ ਨੂੰ ਸਕੇਲ ਕਰਨ ਦੀਆਂ ਚੁਣੌਤੀਆਂ ਦੇ ਪ੍ਰਮਾਣ ਵਜੋਂ ਕੰਮ ਕਰਦੇ ਹਨ ਜੋ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਇੰਟਰਨੈਟ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੁੰਦੇ ਹਨ ਅਤੇ ਮਨੁੱਖੀ ਫੀਡਬੈਕ (RLHF) ਤੋਂ ਮਜ਼ਬੂਤੀ ਸਿੱਖਣ ਦੁਆਰਾ ਅਲਾਈਨਮੈਂਟ ਲਈ ਵਧੀਆ-ਟਿਊਨ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।

ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਅਗਲਾ ਮੋਰਚਾ ਟੈਸਟ-ਟਾਈਮ ਸਕੇਲਿੰਗ (ਜਾਂ ਇਨਫਰੈਂਸ-ਟਾਈਮ ਸਕੇਲਿੰਗ) ਜਾਪਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਚੇਨ-ਆਫ-ਥਾਟ (CoT) ਟੋਕਨ ਤਿਆਰ ਕਰਕੇ ਲੰਬੇ ਸਮੇਂ ਲਈ “ਸੋਚਣ” ਲਈ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ ਸ਼ਾਮਲ ਹੈ। ਟੈਸਟ-ਟਾਈਮ ਸਕੇਲਿੰਗ ਇੱਕ ਮਾਡਲ ਦੀ ਗੁੰਝਲਦਾਰ ਤਰਕ ਸਮੱਸਿਆਵਾਂ ਨਾਲ ਨਜਿੱਠਣ ਦੀ ਯੋਗਤਾ ਨੂੰ ਵਧਾਉਂਦੀ ਹੈ ਅਤੇ o1 ਅਤੇ R1 ਵਰਗੇ ਮਾਡਲਾਂ ਦੀ ਸਫਲਤਾ ਵਿੱਚ ਇੱਕ ਮੁੱਖ ਕਾਰਕ ਰਹੀ ਹੈ।

ਅਸਫਲਤਾ ਨਹੀਂ, ਪਰ ਇੱਕ ਬੁਨਿਆਦ

ਹਾਲਾਂਕਿ GPT-4.5 ਹਰ ਕੰਮ ਲਈ ਅਨੁਕੂਲ ਵਿਕਲਪ ਨਹੀਂ ਹੋ ਸਕਦਾ, ਭਵਿੱਖ ਦੀਆਂ ਤਰੱਕੀਆਂ ਲਈ ਇੱਕ ਬੁਨਿਆਦੀ ਤੱਤ ਵਜੋਂ ਇਸਦੀ ਸੰਭਾਵੀ ਭੂਮਿਕਾ ਨੂੰ ਪਛਾਣਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਤਰਕ ਮਾਡਲਾਂ ਦੇ ਵਿਕਾਸ ਲਈ ਇੱਕ ਮਜ਼ਬੂਤ ਗਿਆਨ ਅਧਾਰ ਜ਼ਰੂਰੀ ਹੈ।

ਭਾਵੇਂ GPT-4.5 ਖੁਦ ਜ਼ਿਆਦਾਤਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਜਾਣ-ਪਛਾਣ ਵਾਲਾ ਮਾਡਲ ਨਹੀਂ ਬਣਦਾ, ਇਹ ਬਾਅਦ ਦੇ ਤਰਕ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਬਿਲਡਿੰਗ ਬਲਾਕ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਵੀ ਸੰਭਵ ਹੈ ਕਿ ਇਹ ਪਹਿਲਾਂ ਹੀ o3 ਵਰਗੇ ਮਾਡਲਾਂ ਦੇ ਅੰਦਰ ਵਰਤਿਆ ਜਾ ਰਿਹਾ ਹੈ।

ਜਿਵੇਂ ਕਿ ਮਾਰਕ ਚੇਨ, OpenAI ਦੇ ਮੁੱਖ ਖੋਜ ਅਧਿਕਾਰੀ, ਨੇ ਸਮਝਾਇਆ, “ਤੁਹਾਨੂੰ ਇਸਦੇ ਉੱਪਰ ਤਰਕ ਬਣਾਉਣ ਲਈ ਗਿਆਨ ਦੀ ਲੋੜ ਹੈ। ਇੱਕ ਮਾਡਲ ਅੰਨ੍ਹੇਵਾਹ ਨਹੀਂ ਜਾ ਸਕਦਾ ਅਤੇ ਸਿਰਫ਼ ਸ਼ੁਰੂ ਤੋਂ ਹੀ ਤਰਕ ਸਿੱਖ ਸਕਦਾ ਹੈ। ਇਸ ਲਈ ਅਸੀਂ ਇਹਨਾਂ ਦੋਵਾਂ ਪੈਰਾਡਾਈਮਾਂ ਨੂੰ ਕਾਫ਼ੀ ਪੂਰਕ ਪਾਉਂਦੇ ਹਾਂ, ਅਤੇ ਅਸੀਂ ਸੋਚਦੇ ਹਾਂ ਕਿ ਉਹਨਾਂ ਦਾ ਇੱਕ ਦੂਜੇ ‘ਤੇ ਫੀਡਬੈਕ ਲੂਪ ਹੈ।”

ਇਸ ਲਈ, GPT-4.5 ਦਾ ਵਿਕਾਸ, ਇੱਕ ਅੰਤਮ ਸਿਰੇ ਦੀ ਨੁਮਾਇੰਦਗੀ ਨਹੀਂ ਕਰਦਾ, ਬਲਕਿ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਚੱਲ ਰਹੇ ਵਿਕਾਸ ਵਿੱਚ ਇੱਕ ਰਣਨੀਤਕ ਕਦਮ ਹੈ। ਇਹ AI ਖੋਜ ਦੇ ਦੁਹਰਾਓ ਵਾਲੇ ਸੁਭਾਅ ਦਾ ਪ੍ਰਮਾਣ ਹੈ, ਜਿੱਥੇ ਹਰੇਕ ਕਦਮ, ਭਾਵੇਂ ਇਕੱਲੇ ਤੌਰ ‘ਤੇ ਮਾਮੂਲੀ ਜਾਪਦਾ ਹੋਵੇ, ਵਧੇਰੇ ਸਮਰੱਥ ਅਤੇ ਬਹੁਮੁਖੀ AI ਪ੍ਰਣਾਲੀਆਂ ਵੱਲ ਵਿਆਪਕ ਤਰੱਕੀ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ। ਧਿਆਨ ਹੁਣ ਇਸ ਮਜ਼ਬੂਤ ਗਿਆਨ ਅਧਾਰ ਦਾ ਲਾਭ ਉਠਾਉਣ ਵੱਲ ਤਬਦੀਲ ਹੋ ਰਿਹਾ ਹੈ ਤਾਂ ਜੋ ਅਜਿਹੇ ਮਾਡਲ ਬਣਾਏ ਜਾ ਸਕਣ ਜੋ ਨਾ ਸਿਰਫ਼ ਜਾਣਕਾਰੀ ਨੂੰ ਯਾਦ ਕਰ ਸਕਣ ਬਲਕਿ ਬੇਮਿਸਾਲ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਨਾਲ ਤਰਕ ਅਤੇ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰ ਸਕਣ। ਸੱਚਮੁੱਚ ਬੁੱਧੀਮਾਨ AI ਵੱਲ ਯਾਤਰਾ ਜਾਰੀ ਹੈ, ਅਤੇ GPT-4.5, ਇਸਦੇ ਮਿਸ਼ਰਤ ਸਵਾਗਤ ਦੇ ਬਾਵਜੂਦ, ਉਸ ਯਾਤਰਾ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਉਂਦਾ ਹੈ।
ਹੁਣ ਧਿਆਨ ਸਿਰਫ਼ ਇਸ ਗੱਲ ‘ਤੇ ਨਹੀਂ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਕਿੰਨਾ ਜਾਣਦਾ ਹੈ, ਸਗੋਂ ਇਹ ਵੀ ਹੈ ਕਿ ਇਹ ਉਸ ਗਿਆਨ ਦੀ ਵਰਤੋਂ ਕਿੰਨੀ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਉਹ ਮੁੱਖ ਚੁਣੌਤੀ ਹੈ ਜਿਸ ਨਾਲ AI ਭਾਈਚਾਰਾ ਜੂਝ ਰਿਹਾ ਹੈ, ਅਤੇ GPT-4.5, ਹਾਲਾਂਕਿ ਇੱਕ ਸੰਪੂਰਨ ਹੱਲ ਨਹੀਂ ਹੈ, ਭਵਿੱਖ ਦੀਆਂ ਸਫਲਤਾਵਾਂ ਲਈ ਕੀਮਤੀ ਸੂਝ ਅਤੇ ਇੱਕ ਮਜ਼ਬੂਤ ਬੁਨਿਆਦ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਅੱਗੇ ਦੇ ਰਾਹ ਵਿੱਚ ਪਹੁੰਚਾਂ ਦਾ ਸੁਮੇਲ ਸ਼ਾਮਲ ਹੈ: ਮੌਜੂਦਾ ਤਕਨੀਕਾਂ ਨੂੰ ਸੁਧਾਰਨਾ, ਨਵੇਂ ਆਰਕੀਟੈਕਚਰ ਦੀ ਪੜਚੋਲ ਕਰਨਾ, ਅਤੇ ਸਿਖਲਾਈ ਅਤੇ ਮੁਲਾਂਕਣ ਲਈ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਤਰੀਕਿਆਂ ਦਾ ਵਿਕਾਸ ਕਰਨਾ। ਅੰਤਮ ਟੀਚਾ ਉਹੀ ਰਹਿੰਦਾ ਹੈ: ਅਜਿਹੇ AI ਸਿਸਟਮ ਬਣਾਉਣਾ ਜੋ ਨਾ ਸਿਰਫ਼ ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਨੂੰ ਸਮਝ ਸਕਣ ਅਤੇ ਤਿਆਰ ਕਰ ਸਕਣ, ਸਗੋਂ ਤਰਕ, ਸਿੱਖਣ ਅਤੇ ਅਨੁਕੂਲ ਹੋਣ ਦੇ ਤਰੀਕਿਆਂ ਨਾਲ ਵੀ ਕੰਮ ਕਰ ਸਕਣ ਜੋ ਕਦੇ ਮਨੁੱਖੀ ਬੁੱਧੀ ਦਾ ਵਿਸ਼ੇਸ਼ ਅਧਿਕਾਰ ਮੰਨਿਆ ਜਾਂਦਾ ਸੀ।