GPT-4o ਦੀ ਏਕੀਕ੍ਰਿਤ ਕਲਾ: OpenAI ਨੇ ਚਿੱਤਰ ਬਣਾਉਣ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤਾ

ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਦਾ ਖੇਤਰ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਾਸ ਕਰ ਰਿਹਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਹਾਲ ਹੀ ਵਿੱਚ OpenAI ਵੱਲੋਂ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਚੁੱਕਿਆ ਗਿਆ ਹੈ। ਇਹ ਸੰਸਥਾ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ GPT ਸੀਰੀਜ਼ ਦੇ AI ਮਾਡਲਾਂ ਦੇ ਵਿਕਾਸ ਲਈ ਮਸ਼ਹੂਰ ਹੈ, ਨੇ ਹੁਣ ਆਪਣੇ ਨਵੀਨਤਮ ਸੰਸਕਰਣ, GPT-4o ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕੀਤਾ ਹੈ। ਮੰਗਲਵਾਰ ਨੂੰ ਐਲਾਨਿਆ ਗਿਆ ਇਹ ਵਿਕਾਸ, ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਬਦੀਲੀ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਬਾਹਰੀ ਵਿਸ਼ੇਸ਼ ਸਾਧਨਾਂ ‘ਤੇ ਨਿਰਭਰ ਕੀਤੇ ਬਿਨਾਂ ਵਿਭਿੰਨ ਕਿਸਮ ਦੀ ਵਿਜ਼ੂਅਲ ਸਮੱਗਰੀ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ। ਉਪਭੋਗਤਾ ਹੁਣ AI ਨਾਲ ਗੱਲਬਾਤ ਕਰਕੇ ਵਿਸਤ੍ਰਿਤ ਇਨਫੋਗ੍ਰਾਫਿਕਸ ਅਤੇ ਕ੍ਰਮਵਾਰ ਕਾਮਿਕ ਸਟ੍ਰਿਪਸ ਤੋਂ ਲੈ ਕੇ ਬੇਸਪੋਕ ਸਾਈਨਬੋਰਡ, ਡਾਇਨਾਮਿਕ ਗ੍ਰਾਫਿਕਸ, ਪੇਸ਼ੇਵਰ ਦਿੱਖ ਵਾਲੇ ਮੀਨੂ, ਸਮਕਾਲੀ ਮੀਮਜ਼, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਯਥਾਰਥਵਾਦੀ ਸਟ੍ਰੀਟ ਸਾਈਨ ਤੱਕ ਸਭ ਕੁਝ ਬਣਾ ਸਕਦੇ ਹਨ। ਇਹ ਅੰਦਰੂਨੀ ਵਿਜ਼ੂਅਲ ਸਮਰੱਥਾ ਵਧੇਰੇ ਬਹੁਮੁਖੀ ਅਤੇ ਸਹਿਜੇ ਹੀ ਏਕੀਕ੍ਰਿਤ AI ਸਹਾਇਕਾਂ ਦੀ ਖੋਜ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਛਾਲ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।

ਮੂਲ ਵਿਜ਼ੂਅਲ ਰਚਨਾ ਦੀ ਸ਼ੁਰੂਆਤ

ਇਸ ਤਰੱਕੀ ਨੂੰ ਜੋ ਚੀਜ਼ ਵੱਖਰਾ ਕਰਦੀ ਹੈ ਉਹ ਹੈ ਇਸਦਾ ਮੂਲ ਲਾਗੂਕਰਨ (native implementation)। ਪਿਛਲੇ ਵਰਕਫਲੋਜ਼ ਦੇ ਉਲਟ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਬੇਨਤੀਆਂ ਨੂੰ ਵੱਖਰੇ ਚਿੱਤਰ ਬਣਾਉਣ ਵਾਲੇ ਮਾਡਲਾਂ, ਜਿਵੇਂ ਕਿ OpenAI ਦੇ ਆਪਣੇ DALL-E, ਨੂੰ ਭੇਜਣਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਸੀ, GPT-4o ਹੁਣ ਟੈਕਸਟ ਵਰਣਨ ਨੂੰ ਪਿਕਸਲ ਵਿੱਚ ਬਦਲਣ ਦੀ ਅੰਦਰੂਨੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। ਇਹ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਚਿੱਤਰ ਬਣਾਉਣ ਲਈ ਆਪਣੇ ਵਿਸ਼ਾਲ ਅੰਦਰੂਨੀ ਗਿਆਨ ਅਧਾਰ ਅਤੇ ਆਰਕੀਟੈਕਚਰਲ ਡਿਜ਼ਾਈਨ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਇਹ DALL-E ਨੂੰ ਬੇਕਾਰ ਨਹੀਂ ਬਣਾਉਂਦਾ; OpenAI ਨੇ ਸਪੱਸ਼ਟ ਕੀਤਾ ਹੈ ਕਿ ਜੋ ਉਪਭੋਗਤਾ ਸਮਰਪਿਤ DALL-E ਇੰਟਰਫੇਸ ਜਾਂ ਇਸਦੀਆਂ ਖਾਸ ਕਾਰਜਕੁਸ਼ਲਤਾਵਾਂ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ, ਉਹ ਇਸਨੂੰ ਪਹਿਲਾਂ ਵਾਂਗ ਵਰਤਣਾ ਜਾਰੀ ਰੱਖ ਸਕਦੇ ਹਨ। ਹਾਲਾਂਕਿ, GPT-4o ਦੇ ਅੰਦਰ ਏਕੀਕਰਣ ਵਿਜ਼ੂਅਲ ਰਚਨਾ ਲਈ ਇੱਕ ਸੁਚਾਰੂ, ਗੱਲਬਾਤ ਵਾਲਾ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਇਹ ਪ੍ਰਕਿਰਿਆ ਸਹਿਜ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ। ਜਿਵੇਂ ਕਿ OpenAI ਨੇ ਦੱਸਿਆ, ‘ਚਿੱਤਰ ਬਣਾਉਣਾ ਅਤੇ ਅਨੁਕੂਲਿਤ ਕਰਨਾ GPT‑4o ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਗੱਲਬਾਤ ਕਰਨ ਜਿੰਨਾ ਸੌਖਾ ਹੈ।’ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸਿਰਫ਼ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਬਿਆਨ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਵਿੱਚ ਲੋੜੀਂਦੇ ਤੱਤ, ਰਚਨਾਤਮਕ ਵੇਰਵੇ, ਸ਼ੈਲੀਗਤ ਸੂਖਮਤਾਵਾਂ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤਕਨੀਕੀ ਮਾਪਦੰਡਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਮਾਡਲ ਆਸਪੈਕਟ ਰੇਸ਼ੋ (aspect ratios) ਸੰਬੰਧੀ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਲਾਗੂ ਕਰਨ ਲਈ ਲੈਸ ਹੈ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਚਿੱਤਰ ਖਾਸ ਆਯਾਮੀ ਲੋੜਾਂ ਦੇ ਅਨੁਕੂਲ ਹੋਣ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਹੈਕਸਾਡੈਸੀਮਲ ਕੋਡ (hexadecimal codes) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਹੀ ਰੰਗ ਪੈਲੇਟ (color palettes) ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਸਕਦਾ ਹੈ, ਜੋ ਬ੍ਰਾਂਡਿੰਗ ਜਾਂ ਕਲਾਤਮਕ ਉਦੇਸ਼ਾਂ ਲਈ ਬਾਰੀਕ ਨਿਯੰਤਰਣ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਇੱਕ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਵਿਸ਼ੇਸ਼ਤਾ ਪਾਰਦਰਸ਼ੀ ਬੈਕਗ੍ਰਾਉਂਡ (transparent backgrounds) ਵਾਲੇ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀ ਯੋਗਤਾ ਹੈ, ਜੋ ਡਿਜ਼ਾਈਨ ਪ੍ਰੋਜੈਕਟਾਂ ਜਾਂ ਪੇਸ਼ਕਾਰੀਆਂ ਵਿੱਚ ਗ੍ਰਾਫਿਕਸ ਨੂੰ ਲੇਅਰ ਕਰਨ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਲੋੜ ਹੈ।

ਸ਼ੁਰੂਆਤੀ ਪੀੜ੍ਹੀ ਤੋਂ ਪਰੇ, ਗੱਲਬਾਤ ਦੀ ਪ੍ਰਕਿਰਤੀ ਸੁਧਾਰ ਤੱਕ ਫੈਲੀ ਹੋਈ ਹੈ। ਉਪਭੋਗਤਾ ਸਿਰਫ਼ ਇੱਕ ਆਉਟਪੁੱਟ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਹਨ। ਉਹ ਤਿਆਰ ਕੀਤੇ ਚਿੱਤਰ ‘ਤੇ ਦੁਹਰਾਉਣ ਲਈ GPT-4o ਨਾਲ ਫਾਲੋ-ਅੱਪ ਗੱਲਬਾਤ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ। ਇਸ ਵਿੱਚ ਖਾਸ ਤੱਤਾਂ ਵਿੱਚ ਸੋਧਾਂ ਦੀ ਬੇਨਤੀ ਕਰਨਾ, ਰੰਗ ਸਕੀਮ ਨੂੰ ਵਿਵਸਥਿਤ ਕਰਨਾ, ਸ਼ੈਲੀ ਨੂੰ ਬਦਲਣਾ, ਜਾਂ ਵੇਰਵੇ ਸ਼ਾਮਲ ਕਰਨਾ ਜਾਂ ਹਟਾਉਣਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਦੁਹਰਾਓ ਵਾਲਾ ਲੂਪ ਇੱਕ ਕੁਦਰਤੀ ਰਚਨਾਤਮਕ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਪ੍ਰਗਤੀਸ਼ੀਲ ਸੁਧਾਰ ਦੀ ਆਗਿਆ ਮਿਲਦੀ ਹੈ ਜਦੋਂ ਤੱਕ ਵਿਜ਼ੂਅਲ ਆਉਟਪੁੱਟ ਉਪਭੋਗਤਾ ਦੇ ਇਰਾਦੇ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ। ਇਹ ਸਮਰੱਥਾ ਚਿੱਤਰ ਬਣਾਉਣ ਨੂੰ ਇੱਕ ਸੰਭਾਵੀ ਹਿੱਟ-ਜਾਂ-ਮਿਸ ਕਮਾਂਡ ਤੋਂ ਮਨੁੱਖ ਅਤੇ ਮਸ਼ੀਨ ਵਿਚਕਾਰ ਇੱਕ ਸਹਿਯੋਗੀ ਵਟਾਂਦਰੇ ਵਿੱਚ ਬਦਲ ਦਿੰਦੀ ਹੈ।

ਬੇਮਿਸਾਲ ਬਹੁਪੱਖਤਾ ਦਾ ਇੱਕ ਕੈਨਵਸ

GPT-4o ਦੁਆਰਾ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੇ ਜਾ ਸਕਣ ਵਾਲੇ ਵਿਜ਼ੂਅਲ ਆਉਟਪੁੱਟ ਦੀ ਰੇਂਜ ਕਮਾਲ ਦੀ ਵਿਸ਼ਾਲ ਹੈ, ਜੋ ਕਈ ਖੇਤਰਾਂ ਵਿੱਚ ਇਸਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਹੇਠ ਲਿਖੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ:

  • ਡੇਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ: ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਜਾਂ ਸੰਕਲਪਾਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਤੁਰੰਤ ਇਨਫੋਗ੍ਰਾਫਿਕਸ (infographics) ਤਿਆਰ ਕਰਨਾ, ਗੁੰਝਲਦਾਰ ਜਾਣਕਾਰੀ ਦੇ ਸੰਚਾਰ ਨੂੰ ਸਰਲ ਬਣਾਉਣਾ।
  • ਕਹਾਣੀ ਸੁਣਾਉਣਾ ਅਤੇ ਮਨੋਰੰਜਨ: ਇੱਕ ਬਿਰਤਾਂਤਕ ਪ੍ਰੋਂਪਟ ਤੋਂ ਮਲਟੀ-ਪੈਨਲ ਕਾਮਿਕ ਸਟ੍ਰਿਪਸ (comic strips) ਬਣਾਉਣਾ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕਲਾਕਾਰਾਂ ਅਤੇ ਲੇਖਕਾਂ ਲਈ ਸਮੱਗਰੀ ਬਣਾਉਣ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆਉਣਾ।
  • ਡਿਜ਼ਾਈਨ ਅਤੇ ਬ੍ਰਾਂਡਿੰਗ: ਖਾਸ ਟੈਕਸਟ, ਲੋਗੋ (ਸੰਕਲਪਿਕ ਤੌਰ ‘ਤੇ, ਕਿਉਂਕਿ ਸਿੱਧੇ ਲੋਗੋ ਦੀ ਨਕਲ ਦੇ ਕਾਪੀਰਾਈਟ ਪ੍ਰਭਾਵ ਹੁੰਦੇ ਹਨ), ਅਤੇ ਸ਼ੈਲੀਆਂ ਨਾਲ ਸਾਈਨਬੋਰਡ (signboards), ਗ੍ਰਾਫਿਕਸ (graphics), ਅਤੇ ਮੀਨੂ (menus) ਤਿਆਰ ਕਰਨਾ, ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਤੇਜ਼ ਪ੍ਰੋਟੋਟਾਈਪਿੰਗ ਅਤੇ ਮਾਰਕੀਟਿੰਗ ਸਮੱਗਰੀ ਬਣਾਉਣ ਵਿੱਚ ਸਹਾਇਤਾ ਕਰਨਾ।
  • ਡਿਜੀਟਲ ਕਲਚਰ: ਮੌਜੂਦਾ ਰੁਝਾਨਾਂ ਜਾਂ ਖਾਸ ਸਥਿਤੀਆਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਮੀਮਜ਼ (memes) ਬਣਾਉਣਾ, ਇੰਟਰਨੈਟ ਸੱਭਿਆਚਾਰ ਦੀ ਸਮਝ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ।
  • ਸਿਮੂਲੇਸ਼ਨ ਅਤੇ ਮੌਕਅੱਪ: ਵਰਚੁਅਲ ਵਾਤਾਵਰਣ ਜਾਂ ਯੋਜਨਾਬੰਦੀ ਦੇ ਉਦੇਸ਼ਾਂ ਲਈ ਯਥਾਰਥਵਾਦੀ ਸਟ੍ਰੀਟ ਸਾਈਨ (street signs) ਜਾਂ ਹੋਰ ਵਾਤਾਵਰਣਕ ਤੱਤ ਤਿਆਰ ਕਰਨਾ।
  • ਯੂਜ਼ਰ ਇੰਟਰਫੇਸ ਡਿਜ਼ਾਈਨ: ਸ਼ਾਇਦ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਜੋ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤੀ ਗਈ ਹੈ, ਉਹ ਹੈ ਸਿਰਫ਼ ਟੈਕਸਟ ਵਰਣਨ ਦੇ ਅਧਾਰ ‘ਤੇ ਯੂਜ਼ਰ ਇੰਟਰਫੇਸ (UIs) ਤਿਆਰ ਕਰਨਾ, ਬਿਨਾਂ ਕਿਸੇ ਸੰਦਰਭ ਚਿੱਤਰ ਦੀ ਲੋੜ ਤੋਂ। ਇਹ ਐਪ ਅਤੇ ਵੈੱਬ ਡਿਵੈਲਪਰਾਂ ਲਈ ਪ੍ਰੋਟੋਟਾਈਪਿੰਗ ਪੜਾਅ ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਤੇਜ਼ ਕਰ ਸਕਦਾ ਹੈ।

ਇਹ ਬਹੁਪੱਖਤਾ ਮਾਡਲ ਦੀ ਭਾਸ਼ਾ ਦੀ ਡੂੰਘੀ ਸਮਝ ਅਤੇ ਉਸ ਸਮਝ ਨੂੰ ਇਕਸਾਰ ਵਿਜ਼ੂਅਲ ਢਾਂਚਿਆਂ ਵਿੱਚ ਬਦਲਣ ਦੀ ਇਸਦੀ ਨਵੀਂ ਯੋਗਤਾ ਤੋਂ ਪੈਦਾ ਹੁੰਦੀ ਹੈ। ਇਹ ਸਿਰਫ਼ ਪੈਟਰਨ ਮੈਚਿੰਗ ਨਹੀਂ ਹੈ; ਇਸ ਵਿੱਚ ਟੈਕਸਟ ਵਿੱਚ ਵਰਣਿਤ ਸੰਦਰਭ, ਸ਼ੈਲੀ ਦੀਆਂ ਬੇਨਤੀਆਂ, ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਲੋੜਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ।

ਚਿੱਤਰਾਂ ਦੇ ਅੰਦਰ ਟੈਕਸਟ ਬਣਾਉਣ (text generation within images) ਦੀ ਸ਼ਕਤੀ ਨੇ ਵੀ ਮਹੱਤਵਪੂਰਨ ਧਿਆਨ ਖਿੱਚਿਆ ਹੈ। ਇਤਿਹਾਸਕ ਤੌਰ ‘ਤੇ, AI ਚਿੱਤਰ ਜਨਰੇਟਰ ਅਕਸਰ ਟੈਕਸਟ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰਨ ਲਈ ਸੰਘਰਸ਼ ਕਰਦੇ ਸਨ, ਅਕਸਰ ਗੜਬੜ ਵਾਲੇ ਜਾਂ ਬੇਤੁਕੇ ਅੱਖਰ ਪੈਦਾ ਕਰਦੇ ਸਨ। GPT-4o ਦੇ ਸ਼ੁਰੂਆਤੀ ਉਦਾਹਰਣ ਇਸ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਦਾ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ, ਅਜਿਹੇ ਚਿੱਤਰ ਤਿਆਰ ਕਰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਪੜ੍ਹਨਯੋਗ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਸਹੀ ਟੈਕਸਟ ਹੁੰਦਾ ਹੈ, ਬਿਨਾਂ ਉਨ੍ਹਾਂ ਵਿਗਾੜਾਂ ਦੇ ਜੋ AI ਚਿੱਤਰ ਸਾਧਨਾਂ ਦੀਆਂ ਪਿਛਲੀਆਂ ਪੀੜ੍ਹੀਆਂ ਨੂੰ ਪਰੇਸ਼ਾਨ ਕਰਦੇ ਸਨ। ਇਹ ਇਸ਼ਤਿਹਾਰਾਂ, ਪੋਸਟਰਾਂ, ਜਾਂ ਡਾਇਗ੍ਰਾਮ ਬਣਾਉਣ ਵਰਗੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਿੱਥੇ ਏਕੀਕ੍ਰਿਤ ਟੈਕਸਟ ਜ਼ਰੂਰੀ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮੌਜੂਦਾ ਫੋਟੋਆਂ ‘ਤੇ ਸ਼ੈਲੀ ਪਰਿਵਰਤਨ (style transformations) ਕਰਨ ਦੀ ਯੋਗਤਾ ਰਚਨਾਤਮਕ ਸੰਭਾਵਨਾ ਦੀ ਇੱਕ ਹੋਰ ਪਰਤ ਜੋੜਦੀ ਹੈ। ਉਪਭੋਗਤਾ ਇੱਕ ਫੋਟੋ ਅਪਲੋਡ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ GPT-4o ਨੂੰ ਇਸਨੂੰ ਇੱਕ ਵੱਖਰੀ ਕਲਾਤਮਕ ਸ਼ੈਲੀ ਵਿੱਚ ਮੁੜ ਵਿਆਖਿਆ ਕਰਨ ਲਈ ਬੇਨਤੀ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਸਮਰੱਥਾ ਉਦੋਂ ਸਪਸ਼ਟ ਤੌਰ ‘ਤੇ ਪ੍ਰਦਰਸ਼ਿਤ ਹੋਈ ਜਦੋਂ ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਆਮ ਸਨੈਪਸ਼ਾਟ ਨੂੰ Studio Ghibli ਐਨੀਮੇਸ਼ਨਾਂ ਦੀ ਵਿਲੱਖਣ ਸੁਹਜ ਦੀ ਯਾਦ ਦਿਵਾਉਣ ਵਾਲੇ ਚਿੱਤਰਾਂ ਵਿੱਚ ਬਦਲਣਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ। ਇਹ ਨਾ ਸਿਰਫ਼ ਵੱਖ-ਵੱਖ ਕਲਾਤਮਕ ਸੰਮੇਲਨਾਂ ਦੀ ਮਾਡਲ ਦੀ ਸਮਝ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਬਲਕਿ ਵਿਲੱਖਣ ਵਿਜ਼ੂਅਲ ਪ੍ਰਭਾਵਾਂ ਦੀ ਭਾਲ ਕਰਨ ਵਾਲੇ ਕਲਾਕਾਰਾਂ ਅਤੇ ਸ਼ੌਕੀਨਾਂ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਾਧਨ ਵੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਉਪਭੋਗਤਾ ਭਾਈਚਾਰੇ ਤੋਂ ਹੈਰਾਨੀ ਦੀਆਂ ਗੂੰਜਾਂ

ਇਹਨਾਂ ਮੂਲ ਚਿੱਤਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਸ਼ੁਰੂਆਤ ਦਾ AI ਭਾਈਚਾਰੇ ਅਤੇ ਇਸ ਤੋਂ ਬਾਹਰ ਤੁਰੰਤ ਅਤੇ ਵਿਆਪਕ ਉਤਸ਼ਾਹ ਨਾਲ ਸਵਾਗਤ ਕੀਤਾ ਗਿਆ। ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ, ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀਆਂ ਹੱਦਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ ਅਤੇ ਆਪਣੀਆਂ ਖੋਜਾਂ ਨੂੰ ਆਨਲਾਈਨ ਸਾਂਝਾ ਕੀਤਾ। ਭਾਵਨਾ ਅਕਸਰ ਗੁਣਵੱਤਾ, ਇਕਸਾਰਤਾ, ਅਤੇ ਵਰਤੋਂ ਦੀ ਸੌਖ ‘ਤੇ ਪੂਰੀ ਹੈਰਾਨੀ ਵਾਲੀ ਹੁੰਦੀ ਸੀ।

Shopify ਦੇ CEO, Tobias Lutke ਨੇ ਇੱਕ ਦਿਲਚਸਪ ਨਿੱਜੀ ਕਿੱਸਾ ਸਾਂਝਾ ਕੀਤਾ। ਉਸਨੇ ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਬੇਟੇ ਦੀ ਟੀ-ਸ਼ਰਟ ਦੀ ਇੱਕ ਤਸਵੀਰ ਪੇਸ਼ ਕੀਤੀ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਅਣਜਾਣ ਜਾਨਵਰ ਸੀ। GPT-4o ਨੇ ਨਾ ਸਿਰਫ਼ ਜੀਵ ਦੀ ਪਛਾਣ ਕੀਤੀ ਬਲਕਿ ਇਸਦੇ ਸਰੀਰ ਵਿਗਿਆਨ ਦਾ ਸਹੀ ਵਰਣਨ ਵੀ ਕੀਤਾ। Lutke ਦੀ ਪ੍ਰਤੀਕਿਰਿਆ, ਉਸਦੀ ਆਨਲਾਈਨ ਟਿੱਪਣੀ ਵਿੱਚ ਕੈਦ, ‘ਇਹ ਅਸਲ ਕਿਵੇਂ ਹੋ ਸਕਦਾ ਹੈ?’, ਉਸ ਹੈਰਾਨੀ ਦੀ ਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਜੋ ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨੇ ਮਾਡਲ ਦੀਆਂ ਗੁੰਝਲਦਾਰ ਮਲਟੀਮੋਡਲ ਸਮਝ ਅਤੇ ਪੀੜ੍ਹੀ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਨੂੰ ਪਹਿਲੀ ਵਾਰ ਦੇਖਦੇ ਹੋਏ ਮਹਿਸੂਸ ਕੀਤਾ। ਇਸ ਉਦਾਹਰਣ ਨੇ ਸਧਾਰਨ ਚਿੱਤਰ ਬਣਾਉਣ ਤੋਂ ਪਰੇ, ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਨਾਲ ਪੀੜ੍ਹੀ ਲਈ ਮਾਡਲ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ।

ਚਿੱਤਰਾਂ ਦੇ ਅੰਦਰ ਸਾਫ਼, ਸਹੀ ਟੈਕਸਟ ਬਣਾਉਣ ਦੀ ਉਪਰੋਕਤ ਸਮਰੱਥਾ ਨੇ ਜ਼ੋਰਦਾਰ ਗੂੰਜ ਪੈਦਾ ਕੀਤੀ। ਗ੍ਰਾਫਿਕ ਡਿਜ਼ਾਈਨਰਾਂ, ਮਾਰਕਿਟਰਾਂ, ਅਤੇ ਸਮੱਗਰੀ ਸਿਰਜਣਹਾਰਾਂ ਲਈ ਜਿਨ੍ਹਾਂ ਨੇ ਹੋਰ AI ਸਾਧਨਾਂ ਦੀਆਂ ਟੈਕਸਟ ਸੀਮਾਵਾਂ ਨਾਲ ਸੰਘਰਸ਼ ਕੀਤਾ ਹੈ, ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਹਾਰਕ ਸਫਲਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਉਹਨਾਂ ਨੂੰ ਹੁਣ ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਵੱਖਰੇ ਗ੍ਰਾਫਿਕ ਡਿਜ਼ਾਈਨ ਸੌਫਟਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਪਵੇਗੀ ਸਿਰਫ਼ ਇੱਕ AI-ਤਿਆਰ ਬੈਕਗ੍ਰਾਉਂਡ ‘ਤੇ ਸਹੀ ਟੈਕਸਟ ਨੂੰ ਓਵਰਲੇ ਕਰਨ ਲਈ।

ਪ੍ਰੋਂਪਟ ਤੋਂ UI ਜਨਰੇਸ਼ਨ (UI generation) ਦੀ ਸੰਭਾਵਨਾ ਨੇ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਡਿਜ਼ਾਈਨਰਾਂ ਵਿੱਚ ਖਾਸ ਉਤਸ਼ਾਹ ਪੈਦਾ ਕੀਤਾ। ਇੱਕ ਵਰਣਨ ਦੇ ਅਧਾਰ ‘ਤੇ ਇੱਕ ਐਪ ਸਕ੍ਰੀਨ ਜਾਂ ਵੈਬਸਾਈਟ ਲੇਆਉਟ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰਨ ਦੀ ਯੋਗਤਾ - ‘ਇੱਕ ਨੀਲੇ ਬੈਕਗ੍ਰਾਉਂਡ, ਉਪਭੋਗਤਾ ਨਾਮ ਅਤੇ ਪਾਸਵਰਡ ਲਈ ਫੀਲਡ, ਅਤੇ ਇੱਕ ਪ੍ਰਮੁੱਖ ‘ਲੌਗ ਇਨ’ ਬਟਨ ਵਾਲੀ ਮੋਬਾਈਲ ਬੈਂਕਿੰਗ ਐਪ ਲਈ ਇੱਕ ਲੌਗਇਨ ਸਕ੍ਰੀਨ ਬਣਾਓ’ - ਉਤਪਾਦ ਵਿਕਾਸ ਦੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਵਾਂ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਕਰ ਸਕਦੀ ਹੈ, ਤੇਜ਼ ਦੁਹਰਾਓ ਅਤੇ ਟੀਮਾਂ ਦੇ ਅੰਦਰ ਸਪਸ਼ਟ ਸੰਚਾਰ ਦੀ ਸਹੂਲਤ ਦਿੰਦੀ ਹੈ।

ਸਟਾਈਲ ਟ੍ਰਾਂਸਫਰ (style transfer) ਵਿਸ਼ੇਸ਼ਤਾ ਤੇਜ਼ੀ ਨਾਲ ਵਾਇਰਲ ਹੋ ਗਈ। Row Zero ਦੇ ਇੱਕ ਸੰਸਥਾਪਕ ਇੰਜੀਨੀਅਰ, Grant Slatton ਨੇ ਇੱਕ ਖਾਸ ਤੌਰ ‘ਤੇ ਪ੍ਰਸਿੱਧ ਉਦਾਹਰਣ ਸਾਂਝੀ ਕੀਤੀ ਜਿਸ ਵਿੱਚ ਇੱਕ ਸਟੈਂਡਰਡ ਫੋਟੋਗ੍ਰਾਫ ਨੂੰ ਆਈਕੋਨਿਕ ‘Studio Ghibli’ ਐਨੀਮੇ ਸ਼ੈਲੀ ਵਿੱਚ ਬਦਲਿਆ ਗਿਆ। ਉਸਦੀ ਪੋਸਟ ਨੇ ਇੱਕ ਉਤਪ੍ਰੇਰਕ ਵਜੋਂ ਕੰਮ ਕੀਤਾ, ਅਣਗਿਣਤ ਹੋਰਾਂ ਨੂੰ ਸਮਾਨ ਪਰਿਵਰਤਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਪ੍ਰੇਰਿਤ ਕੀਤਾ, ਪ੍ਰਭਾਵਵਾਦ ਅਤੇ ਅਤਿ-ਯਥਾਰਥਵਾਦ ਤੋਂ ਲੈ ਕੇ ਖਾਸ ਕਲਾਕਾਰਾਂ ਦੇ ਸੁਹਜ ਜਾਂ ਸਿਨੇਮੈਟਿਕ ਦਿੱਖ ਤੱਕ ਦੀਆਂ ਸ਼ੈਲੀਆਂ ਨੂੰ ਲਾਗੂ ਕੀਤਾ। ਇਸ ਭਾਈਚਾਰਕ ਪ੍ਰਯੋਗ ਨੇ ਨਾ ਸਿਰਫ਼ ਵਿਸ਼ੇਸ਼ਤਾ ਦੀ ਅਪੀਲ ਦੇ ਪ੍ਰਮਾਣ ਵਜੋਂ ਕੰਮ ਕੀਤਾ ਬਲਕਿ ਇਸਦੀ ਰਚਨਾਤਮਕ ਰੇਂਜ ਅਤੇ ਸੀਮਾਵਾਂ ਦੀ ਭੀੜ-ਸਰੋਤ ਖੋਜ ਵਜੋਂ ਵੀ ਕੰਮ ਕੀਤਾ।

ਇੱਕ ਹੋਰ ਸ਼ਕਤੀਸ਼ਾਲੀ ਵਰਤੋਂ ਦਾ ਮਾਮਲਾ ਇਸ਼ਤਿਹਾਰਬਾਜ਼ੀ ਅਤੇ ਮਾਰਕੀਟਿੰਗ (advertising and marketing) ਦੇ ਖੇਤਰ ਵਿੱਚ ਉਭਰਿਆ। ਇੱਕ ਉਪਭੋਗਤਾ ਨੇ ਆਪਣੀ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਮੌਜੂਦਾ ਇਸ਼ਤਿਹਾਰ ਚਿੱਤਰ ਨੂੰ ਦੁਹਰਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਦੇ ਆਪਣੇ ਅਨੁਭਵ ਦਾ ਦਸਤਾਵੇਜ਼ੀਕਰਨ ਕੀਤਾ। ਉਹਨਾਂ ਨੇ ਅਸਲ ਵਿਗਿਆਪਨ ਨੂੰ ਇੱਕ ਵਿਜ਼ੂਅਲ ਸੰਦਰਭ ਵਜੋਂ ਪ੍ਰਦਾਨ ਕੀਤਾ ਪਰ GPT-4o ਨੂੰ ਨਿਰਦੇਸ਼ ਦਿੱਤਾ ਕਿ ਉਹ ਅਸਲ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਿਤ ਐਪ ਸਕ੍ਰੀਨਸ਼ੌਟ ਨੂੰ ਉਹਨਾਂ ਦੇ ਆਪਣੇ ਉਤਪਾਦ ਦੇ ਸਕ੍ਰੀਨਸ਼ੌਟ ਨਾਲ ਬਦਲ ਦੇਵੇ, ਜਦੋਂ ਕਿ ਸਮੁੱਚੇ ਲੇਆਉਟ, ਸ਼ੈਲੀ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਿਆ ਜਾਵੇ ਅਤੇ ਸੰਬੰਧਿਤ ਕਾਪੀ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਵੇ। ਉਪਭੋਗਤਾ ਨੇ ਹੈਰਾਨੀਜਨਕ ਸਫਲਤਾ ਦੀ ਰਿਪੋਰਟ ਦਿੱਤੀ, ਕਿਹਾ, ‘ਮਿੰਟਾਂ ਦੇ ਅੰਦਰ, ਇਸਨੇ ਲਗਭਗ ਪੂਰੀ ਤਰ੍ਹਾਂ ਇਸਨੂੰ ਦੁਹਰਾ ਦਿੱਤਾ ਸੀ।’ ਇਹ ਤੇਜ਼ ਵਿਗਿਆਪਨ ਪ੍ਰੋਟੋਟਾਈਪਿੰਗ, A/B ਟੈਸਟਿੰਗ ਪਰਿਵਰਤਨ, ਅਤੇ ਬੇਮਿਸਾਲ ਗਤੀ ਨਾਲ ਮਾਰਕੀਟਿੰਗ ਜਮਾਂਦਰੂ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਨ ਵਿੱਚ ਸ਼ਕਤੀਸ਼ਾਲੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ।

ਇਹਨਾਂ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੋਂ ਪਰੇ, ਫੋਟੋਰੀਅਲਿਸਟਿਕ ਚਿੱਤਰ (photorealistic images) ਬਣਾਉਣ ਦੀ ਆਮ ਸਮਰੱਥਾ ਨੇ ਪ੍ਰਭਾਵਿਤ ਕਰਨਾ ਜਾਰੀ ਰੱਖਿਆ। ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਲੈਂਡਸਕੇਪਾਂ, ਪੋਰਟਰੇਟਾਂ, ਅਤੇ ਵਸਤੂ ਰੈਂਡਰਿੰਗਾਂ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਸਾਂਝੀਆਂ ਕੀਤੀਆਂ ਜੋ ਫੋਟੋਗ੍ਰਾਫਿਕ ਗੁਣਵੱਤਾ ਤੱਕ ਪਹੁੰਚੀਆਂ, ਡਿਜੀਟਲ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੀ ਅਤੇ ਕੈਮਰਾ-ਕੈਪਚਰ ਕੀਤੀ ਅਸਲੀਅਤ ਵਿਚਕਾਰ ਰੇਖਾਵਾਂ ਨੂੰ ਹੋਰ ਧੁੰਦਲਾ ਕਰ ਦਿੱਤਾ। ਯਥਾਰਥਵਾਦ ਦਾ ਇਹ ਪੱਧਰ ਵਰਚੁਅਲ ਫੋਟੋਗ੍ਰਾਫੀ, ਸੰਕਲਪ ਕਲਾ ਪੀੜ੍ਹੀ, ਅਤੇ ਸਿਮੂਲੇਸ਼ਨਾਂ ਜਾਂ ਵਰਚੁਅਲ ਦੁਨੀਆ ਲਈ ਯਥਾਰਥਵਾਦੀ ਸੰਪਤੀਆਂ ਬਣਾਉਣ ਲਈ ਦਰਵਾਜ਼ੇ ਖੋਲ੍ਹਦਾ ਹੈ। ਸਮੂਹਿਕ ਉਪਭੋਗਤਾ ਪ੍ਰਤੀਕਿਰਿਆ ਨੇ ਇੱਕ ਅਜਿਹੇ ਸਾਧਨ ਦੀ ਤਸਵੀਰ ਪੇਸ਼ ਕੀਤੀ ਜੋ ਨਾ ਸਿਰਫ਼ ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸੀ, ਬਲਕਿ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੇ ਇੱਕ ਵਿਸ਼ਾਲ ਸਪੈਕਟ੍ਰਮ ਵਿੱਚ ਸੱਚਮੁੱਚ ਉਪਯੋਗੀ ਅਤੇ ਰਚਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਪ੍ਰੇਰਨਾਦਾਇਕ ਸੀ।

ਪੜਾਅਵਾਰ ਰੋਲਆਊਟ ਅਤੇ ਪਹੁੰਚ ਪੱਧਰ

OpenAI ਨੇ ਇਹਨਾਂ ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਲਈ ਇੱਕ ਪੜਾਅਵਾਰ ਪਹੁੰਚ ਅਪਣਾਈ। ਸ਼ੁਰੂ ਵਿੱਚ, GPT-4o ਦੇ ਅੰਦਰ ਮੂਲ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚ Plus, Pro, ਅਤੇ Team ਯੋਜਨਾਵਾਂ ਦੇ ਗਾਹਕਾਂ ਨੂੰ ਦਿੱਤੀ ਗਈ ਸੀ। ਵਿਆਪਕ ਦਿਲਚਸਪੀ ਨੂੰ ਪਛਾਣਦੇ ਹੋਏ, ਕੰਪਨੀ ਨੇ ਮੁਫਤ ਯੋਜਨਾ (Free plan) ਵਾਲੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਵੀ ਉਪਲਬਧਤਾ ਵਧਾ ਦਿੱਤੀ, ਹਾਲਾਂਕਿ ਭੁਗਤਾਨ ਕੀਤੇ ਪੱਧਰਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਰਤੋਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਨਾਲ।

ਸੰਗਠਨਾਤਮਕ ਉਪਭੋਗਤਾਵਾਂ ਲਈ, Enterprise ਅਤੇ Edu ਯੋਜਨਾਵਾਂ ਵਾਲਿਆਂ ਲਈ ਜਲਦੀ ਹੀ ਪਹੁੰਚ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਗਈ ਹੈ, ਜੋ ਕਾਰੋਬਾਰ ਅਤੇ ਵਿਦਿਅਕ ਸੈਟਿੰਗਾਂ ਵਿੱਚ ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ ਤੈਨਾਤੀਆਂ ਲਈ ਅਨੁਕੂਲਿਤ ਏਕੀਕਰਣ ਜਾਂ ਸਹਾਇਤਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦੀ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਡਿਵੈਲਪਰ ਜੋ ਇਹਨਾਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਆਪਣੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਸੇਵਾਵਾਂ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੇ ਚਾਹਵਾਨ ਹਨ, ਉਹਨਾਂ ਨੂੰ API ਦੁਆਰਾ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਹੋਵੇਗੀ। OpenAI ਨੇ ਸੰਕੇਤ ਦਿੱਤਾ ਕਿ API ਪਹੁੰਚ ਸ਼ੁਰੂਆਤੀ ਘੋਸ਼ਣਾ ਤੋਂ ਬਾਅਦ ਅਗਲੇ ਕੁਝ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਹੌਲੀ-ਹੌਲੀ ਸ਼ੁਰੂ ਕੀਤੀ ਜਾਵੇਗੀ। ਇਹ ਪੜਾਅਵਾਰ ਰੋਲਆਊਟ OpenAI ਨੂੰ ਸਰਵਰ ਲੋਡ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨ, ਵੱਖ-ਵੱਖ ਉਪਭੋਗਤਾ ਹਿੱਸਿਆਂ ਤੋਂ ਫੀਡਬੈਕ ਇਕੱਠਾ ਕਰਨ, ਅਤੇ API ਦੁਆਰਾ ਇਸਨੂੰ ਸਰਵ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ ਕਰਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਅਸਲ-ਸੰਸਾਰ ਵਰਤੋਂ ਪੈਟਰਨਾਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਸਿਸਟਮ ਨੂੰ ਸੁਧਾਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।

ਪ੍ਰਤੀਯੋਗੀ AI ਖੇਤਰ ਦੇ ਸੰਦਰਭ ਵਿੱਚ

OpenAI ਦੁਆਰਾ ਮੂਲ ਚਿੱਤਰ ਬਣਾਉਣ ਦੇ ਨਾਲ GPT-4o ਦਾ ਸੁਧਾਰ ਇਕੱਲਤਾ ਵਿੱਚ ਨਹੀਂ ਹੋਇਆ। ਇਹ ਘੋਸ਼ਣਾ Google ਦੁਆਰਾ ਇੱਕ ਸਮਾਨ ਕਦਮ ਦੇ ਨੇੜਿਓਂ ਬਾਅਦ ਹੋਈ, ਜਿਸ ਨੇ ਆਪਣੇ Gemini 2.0 Flash AI ਮਾਡਲ ਵਿੱਚ ਤੁਲਨਾਤਮਕ ਮੂਲ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਪੇਸ਼ ਕੀਤੀਆਂ। Google ਦੀ ਸਮਰੱਥਾ, ਜਿਸਦਾ ਸ਼ੁਰੂ ਵਿੱਚ ਪਿਛਲੇ ਸਾਲ ਦਸੰਬਰ ਵਿੱਚ ਭਰੋਸੇਯੋਗ ਟੈਸਟਰਾਂ ਲਈ ਪੂਰਵਦਰਸ਼ਨ ਕੀਤਾ ਗਿਆ ਸੀ, ਨੂੰ OpenAI ਦੇ ਲਾਂਚ ਦੇ ਲਗਭਗ ਉਸੇ ਸਮੇਂ Google AI Studio ਦੁਆਰਾ ਸਮਰਥਿਤ ਖੇਤਰਾਂ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਪਹੁੰਚਯੋਗ ਬਣਾਇਆ ਗਿਆ ਸੀ।

Google ਨੇ ਕਿਹਾ ਕਿ ਡਿਵੈਲਪਰ ‘Google AI Studio ਵਿੱਚ ਅਤੇ Gemini API ਦੁਆਰਾ Gemini 2.0 Flash (gemini-2.0-flash-exp) ਦੇ ਇੱਕ ਪ੍ਰਯੋਗਾਤਮਕ ਸੰਸਕਰਣ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸ ਨਵੀਂ ਸਮਰੱਥਾ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹਨ।’ ਇਹ ਲਗਭਗ ਇੱਕੋ ਸਮੇਂ ਦੀ ਰਿਲੀਜ਼ ਜਨਰੇਟਿਵ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਤੀਬਰ ਮੁਕਾਬਲੇ ਅਤੇ ਨਵੀਨਤਾ ਦੀ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ। ਦੋਵੇਂ ਤਕਨੀਕੀ ਦਿੱਗਜ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ - ਟੈਕਸਟ ਅਤੇ ਚਿੱਤਰਾਂ ਵਰਗੇ ਵੱਖ-ਵੱਖ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਸਮੱਗਰੀ ਨੂੰ ਸਮਝਣ ਅਤੇ ਬਣਾਉਣ ਦੀ ਯੋਗਤਾ - ਨੂੰ ਸਿੱਧੇ ਆਪਣੇ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲਾਂ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਨੂੰ ਤਰਜੀਹ ਦੇ ਰਹੇ ਹਨ। ਇਹ ਰੁਝਾਨ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਜਿੱਥੇ AI ਸਹਾਇਕ ਤੇਜ਼ੀ ਨਾਲ ਬਹੁਮੁਖੀ ਹੁੰਦੇ ਹਨ, ਇੱਕ ਸਿੰਗਲ, ਯੂਨੀਫਾਈਡ ਇੰਟਰਫੇਸ ਦੁਆਰਾ ਰਚਨਾਤਮਕ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਕਾਰਜਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਸਮਰੱਥ ਹੁੰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਦੁਨੀਆ ਭਰ ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਵਧੇਰੇ ਤਰਲ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣ ਜਾਂਦਾ ਹੈ। ਸਭ ਤੋਂ ਸਹਿਜ, ਸਮਰੱਥ, ਅਤੇ ਏਕੀਕ੍ਰਿਤ AI ਅਨੁਭਵ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਦੌੜ ਜਾਰੀ ਹੈ।