OpenAI ਨੇ ਆਪਣੇ ਪ੍ਰਮੁੱਖ ਗੱਲਬਾਤ ਵਾਲੇ AI, GPT-4o ਦੇ ਦ੍ਰਿਸ਼ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਬਦਲ ਦਿੱਤਾ ਹੈ, ਇਸਦੇ ਮੂਲ ਵਿੱਚ ਇੱਕ ਉੱਨਤ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਸ਼ਾਮਲ ਕਰਕੇ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਐਡ-ਆਨ ਜਾਂ ਕਿਸੇ ਵੱਖਰੀ ਸੇਵਾ ਦਾ ਲਿੰਕ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਪੈਰਾਡਾਈਮ ਸ਼ਿਫਟ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਵਿਜ਼ੂਅਲ ਦੀ ਸਿਰਜਣਾ ਸੰਵਾਦ ਦਾ ਇੱਕ ਅੰਦਰੂਨੀ ਹਿੱਸਾ ਬਣ ਜਾਂਦੀ ਹੈ। ਪਹਿਲਾਂ, ChatGPT ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਵਾਲੇ ਉਪਭੋਗਤਾ ਜੋ ਇੱਕ ਚਿੱਤਰ ਚਾਹੁੰਦੇ ਸਨ, ਉਹਨਾਂ ਨੂੰ DALL·E ਮਾਡਲ ਵੱਲ ਭੇਜਿਆ ਜਾਂਦਾ ਸੀ, ਅਕਸਰ ਪਾਰਦਰਸ਼ੀ ਤੌਰ ‘ਤੇ ਪਰ ਕਈ ਵਾਰ ਵੱਖਰੇ ਕਦਮਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ। ਉਹ ਪ੍ਰਕਿਰਿਆ, ਭਾਵੇਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸੀ, ਮੁੱਖ ਮਾਡਲ ਦੀ ਭਾਸ਼ਾਈ ਸਮਝ ਅਤੇ ਚਿੱਤਰ ਜਨਰੇਟਰ ਦੇ ਵਿਜ਼ੂਅਲ ਸੰਸਲੇਸ਼ਣ ਵਿਚਕਾਰ ਇੱਕ ਵੱਖਰਾਪਣ ਬਣਾਈ ਰੱਖਦੀ ਸੀ। ਹੁਣ, ਉਹ ਕੰਧ ਢਹਿ ਗਈ ਹੈ। GPT-4o ਖੁਦ ਉਪਭੋਗਤਾ ਦੀ ਪਾਠ ਬੇਨਤੀ ਨੂੰ ਸਮਝਣ ਅਤੇ ਇਸਨੂੰ ਪਿਕਸਲ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਨ ਦੀ ਅੰਦਰੂਨੀ ਯੋਗਤਾ ਰੱਖਦਾ ਹੈ, ਸਭ ਕੁਝ ਇੱਕ ਸਿੰਗਲ ਚੈਟ ਸੈਸ਼ਨ ਦੇ ਨਿਰੰਤਰ ਪ੍ਰਵਾਹ ਵਿੱਚ। ਇਹ ਏਕੀਕ੍ਰਿਤ ਕਾਰਜਕੁਸ਼ਲਤਾ ਸਾਰੇ ਸਪੈਕਟ੍ਰਮ ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਰੋਲ ਆਊਟ ਹੋਣੀ ਸ਼ੁਰੂ ਹੋ ਗਈ ਹੈ - ChatGPT ਦੇ ਮੁਫਤ ਟੀਅਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲਿਆਂ ਤੋਂ ਲੈ ਕੇ Plus, Pro, ਅਤੇ Team ਯੋਜਨਾਵਾਂ ਦੇ ਗਾਹਕਾਂ ਤੱਕ, ਨਾਲ ਹੀ Sora ਇੰਟਰਫੇਸ ਦੇ ਅੰਦਰ ਵੀ। ਕੰਪਨੀ ਨੇੜ ਭਵਿੱਖ ਵਿੱਚ ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਆਪਣੇ Enterprise ਗਾਹਕਾਂ, ਵਿਦਿਅਕ ਉਪਭੋਗਤਾਵਾਂ, ਅਤੇ API ਰਾਹੀਂ ਡਿਵੈਲਪਰਾਂ ਤੱਕ ਵਧਾਉਣ ਦੀ ਉਮੀਦ ਰੱਖਦੀ ਹੈ, ਜੋ ਇਸ ਏਕੀਕ੍ਰਿਤ ਪਹੁੰਚ ਪ੍ਰਤੀ ਇੱਕ ਵਿਆਪਕ ਵਚਨਬੱਧਤਾ ਦਾ ਸੰਕੇਤ ਦਿੰਦੀ ਹੈ।
ਟੈਕਸਟ ਅਤੇ ਪਿਕਸਲ ਦਾ ਸਹਿਜ ਮਿਸ਼ਰਣ
ਅਸਲ ਨਵੀਨਤਾ ਏਕੀਕਰਣ ਵਿੱਚ ਹੈ। ਇੱਕ AI ਸਹਾਇਕ ਨਾਲ ਇੱਕ ਸੰਕਲਪ ਬਾਰੇ ਗੱਲਬਾਤ ਕਰਨ ਦੀ ਕਲਪਨਾ ਕਰੋ - ਸ਼ਾਇਦ ਇੱਕ ਨਵੇਂ ਉਤਪਾਦ ਲੋਗੋ ਲਈ ਵਿਚਾਰਾਂ ‘ਤੇ ਵਿਚਾਰ-ਵਟਾਂਦਰਾ ਕਰਨਾ ਜਾਂ ਇੱਕ ਕਹਾਣੀ ਦੇ ਇੱਕ ਦ੍ਰਿਸ਼ ਦੀ ਕਲਪਨਾ ਕਰਨਾ ਜੋ ਤੁਸੀਂ ਲਿਖ ਰਹੇ ਹੋ। ਉਸ ਚਿੱਤਰ ਦਾ ਵਰਣਨ ਕਰਨ ਦੀ ਬਜਾਏ ਜੋ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਅਤੇ ਫਿਰ ਇਸਨੂੰ ਬਣਾਉਣ ਲਈ ਇੱਕ ਵੱਖਰੇ ਟੂਲ ਜਾਂ ਕਮਾਂਡ ਢਾਂਚੇ ‘ਤੇ ਸਵਿਚ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਬਸ ਗੱਲਬਾਤ ਜਾਰੀ ਰੱਖਦੇ ਹੋ। ਤੁਸੀਂ ਸਿੱਧੇ GPT-4o ਨੂੰ ਪੁੱਛ ਸਕਦੇ ਹੋ: ‘ਉਸ ਸੰਕਲਪ ਨੂੰ ਦਰਸਾਓ,’ ਜਾਂ ‘ਮੈਨੂੰ ਦਿਖਾਓ ਕਿ ਉਹ ਦ੍ਰਿਸ਼ ਕਿਹੋ ਜਿਹਾ ਲੱਗ ਸਕਦਾ ਹੈ।’ AI, ਉਸੇ ਪ੍ਰਸੰਗਿਕ ਸਮਝ ਦਾ ਲਾਭ ਉਠਾਉਂਦੇ ਹੋਏ ਜੋ ਇਹ ਟੈਕਸਟ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਤਿਆਰ ਕਰਨ ਲਈ ਵਰਤਦਾ ਹੈ, ਹੁਣ ਉਸ ਸਮਝ ਨੂੰ ਇੱਕ ਚਿੱਤਰ ਬਣਾਉਣ ਲਈ ਲਾਗੂ ਕਰਦਾ ਹੈ।
ਇਹ ਏਕੀਕ੍ਰਿਤ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਪ੍ਰਸੰਗ ਬਦਲਣ ਦੇ ਰਗੜ ਨੂੰ ਖਤਮ ਕਰਦਾ ਹੈ। AI ਨੂੰ ਇੱਕ ਵੱਖਰੇ ਚਿੱਤਰ ਬਣਾਉਣ ਵਾਲੇ ਮੋਡੀਊਲ ਵਿੱਚ ਦੁਬਾਰਾ ਬ੍ਰੀਫ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ; ਇਹ ਕੁਦਰਤੀ ਤੌਰ ‘ਤੇ ਪਿਛਲੀ ਗੱਲਬਾਤ, ਤੁਹਾਡੀਆਂ ਦੱਸੀਆਂ ਤਰਜੀਹਾਂ, ਅਤੇ ਗੱਲਬਾਤ ਵਿੱਚ ਪਹਿਲਾਂ ਚਰਚਾ ਕੀਤੀਆਂ ਗਈਆਂ ਕਿਸੇ ਵੀ ਬਾਰੀਕੀਆਂ ਨੂੰ ਸਮਝਦਾ ਹੈ। ਇਹ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਦੁਹਰਾਓ ਸੁਧਾਰ ਲੂਪ ਵੱਲ ਲੈ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਸੰਭਾਵਨਾਵਾਂ ‘ਤੇ ਗੌਰ ਕਰੋ:
- ਸ਼ੁਰੂਆਤੀ ਉਤਪਤੀ: ਤੁਸੀਂ ‘ਇੱਕ ਧੁੱਪ ਵਾਲੇ ਬੀਚ ‘ਤੇ ਫਰਿਸਬੀ ਫੜਦੇ ਹੋਏ ਇੱਕ ਗੋਲਡਨ ਰੀਟ੍ਰੀਵਰ ਦੀ ਫੋਟੋਰੀਅਲਿਸਟਿਕ ਤਸਵੀਰ’ ਲਈ ਪੁੱਛਦੇ ਹੋ। GPT-4o ਚੈਟ ਦੇ ਅੰਦਰ ਚਿੱਤਰ ਤਿਆਰ ਕਰਦਾ ਹੈ।
- ਸੁਧਾਰ: ਤੁਸੀਂ ਚਿੱਤਰ ਨੂੰ ਦੇਖਦੇ ਹੋ ਅਤੇ ਜਵਾਬ ਦਿੰਦੇ ਹੋ, ‘ਇਹ ਬਹੁਤ ਵਧੀਆ ਹੈ, ਪਰ ਕੀ ਤੁਸੀਂ ਅਸਮਾਨ ਨੂੰ ਦੇਰ ਦੁਪਹਿਰ ਵਰਗਾ ਬਣਾ ਸਕਦੇ ਹੋ ਅਤੇ ਦੂਰੀ ‘ਤੇ ਇੱਕ ਸੇਲਬੋਟ ਜੋੜ ਸਕਦੇ ਹੋ?’
- ਪ੍ਰਸੰਗਿਕ ਸਮਾਯੋਜਨ: ਕਿਉਂਕਿ ਇਹ ਉਹੀ ਮਾਡਲ ਹੈ, GPT-4o ਸਮਝਦਾ ਹੈ ਕਿ ‘ਇਹ ਬਹੁਤ ਵਧੀਆ ਹੈ’ ਉਸ ਚਿੱਤਰ ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ ਜੋ ਇਸਨੇ ਹੁਣੇ ਬਣਾਇਆ ਹੈ। ਇਹ ‘ਅਸਮਾਨ ਨੂੰ ਦੇਰ ਦੁਪਹਿਰ ਵਰਗਾ ਬਣਾਓ’ ਅਤੇ ‘ਇੱਕ ਸੇਲਬੋਟ ਸ਼ਾਮਲ ਕਰੋ’ ਨੂੰ ਮੌਜੂਦਾ ਦ੍ਰਿਸ਼ ਵਿੱਚ ਸੋਧਾਂ ਵਜੋਂ ਸਮਝਦਾ ਹੈ, ਨਾ ਕਿ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਵੀਆਂ ਬੇਨਤੀਆਂ ਵਜੋਂ। ਇਹ ਫਿਰ ਤਬਦੀਲੀਆਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹੋਏ, ਮੁੱਖ ਤੱਤਾਂ (ਕੁੱਤਾ, ਫਰਿਸਬੀ, ਬੀਚ) ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਦੇ ਹੋਏ, ਇੱਕ ਅੱਪਡੇਟ ਕੀਤਾ ਸੰਸਕਰਣ ਤਿਆਰ ਕਰਦਾ ਹੈ।
ਇਹ ਗੱਲਬਾਤ ਵਾਲੀ ਸੁਧਾਰ ਪ੍ਰਕਿਰਿਆ ਸਾਫਟਵੇਅਰ ਚਲਾਉਣ ਵਰਗੀ ਘੱਟ ਅਤੇ ਇੱਕ ਡਿਜ਼ਾਈਨ ਪਾਰਟਨਰ ਨਾਲ ਸਹਿਯੋਗ ਕਰਨ ਵਰਗੀ ਜ਼ਿਆਦਾ ਮਹਿਸੂਸ ਹੁੰਦੀ ਹੈ ਜੋ ਯਾਦ ਰੱਖਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਕੀ ਚਰਚਾ ਕੀਤੀ ਹੈ। ਤੁਹਾਨੂੰ ਗੁੰਝਲਦਾਰ ਸਲਾਈਡਰਾਂ ਨਾਲ ਖੇਡਣ, ਨਕਾਰਾਤਮਕ ਪ੍ਰੋਂਪਟ ਵੱਖਰੇ ਤੌਰ ‘ਤੇ ਇਨਪੁਟ ਕਰਨ, ਜਾਂ ਜੇ ਪਹਿਲੀ ਕੋਸ਼ਿਸ਼ ਬਿਲਕੁਲ ਸਹੀ ਨਹੀਂ ਹੈ ਤਾਂ ਸ਼ੁਰੂ ਤੋਂ ਸ਼ੁਰੂ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਸੀਂ ਬਸ ਗੱਲਬਾਤ ਜਾਰੀ ਰੱਖਦੇ ਹੋ, AI ਨੂੰ ਕੁਦਰਤੀ ਤੌਰ ‘ਤੇ ਲੋੜੀਂਦੇ ਵਿਜ਼ੂਅਲ ਨਤੀਜੇ ਵੱਲ ਸੇਧ ਦਿੰਦੇ ਹੋ। ਇਹ ਤਰਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਵਿਜ਼ੂਅਲ ਸਿਰਜਣਾ ਲਈ ਦਾਖਲੇ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਘੱਟ ਕਰਨ ਅਤੇ ਇਸਨੂੰ ਸੋਚ ਅਤੇ ਸੰਚਾਰ ਦਾ ਵਧੇਰੇ ਅਨੁਭਵੀ ਵਿਸਥਾਰ ਬਣਾਉਣ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। ਮਾਡਲ ਇੱਕ ਵਿਜ਼ੂਅਲ ਸਹਿਯੋਗੀ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਪਿਛਲੀਆਂ ਹਦਾਇਤਾਂ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਦਾ ਹੈ ਅਤੇ ਦੁਹਰਾਓ ਦੌਰਾਨ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਮਨੁੱਖੀ ਡਿਜ਼ਾਈਨਰ ਸਕੈਚ ਕਰੇਗਾ, ਫੀਡਬੈਕ ਪ੍ਰਾਪਤ ਕਰੇਗਾ, ਅਤੇ ਸੋਧ ਕਰੇਗਾ।
ਪਰਦੇ ਪਿੱਛੇ: ਵਿਜ਼ੂਅਲ ਰਵਾਨਗੀ ਲਈ ਸਿਖਲਾਈ
OpenAI ਇਸ ਵਧੀ ਹੋਈ ਸਮਰੱਥਾ ਦਾ ਸਿਹਰਾ ਇੱਕ ਉੱਨਤ ਸਿਖਲਾਈ ਵਿਧੀ ਨੂੰ ਦਿੰਦਾ ਹੈ। ਮਾਡਲ ਨੂੰ ਸਿਰਫ਼ ਟੈਕਸਟ ਜਾਂ ਸਿਰਫ਼ ਚਿੱਤਰਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਨਹੀਂ ਦਿੱਤੀ ਗਈ ਸੀ; ਇਸ ਦੀ ਬਜਾਏ, ਇਸਨੇ ਉਸ ਤੋਂ ਸਿੱਖਿਆ ਜਿਸਨੂੰ ਕੰਪਨੀ ਚਿੱਤਰਾਂ ਅਤੇ ਟੈਕਸਟ ਦੀ ਸਾਂਝੀ ਵੰਡ ਵਜੋਂ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ AI ਨੂੰ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ ਜਿੱਥੇ ਪਾਠ ਵਰਣਨ ਗੁੰਝਲਦਾਰ ਤੌਰ ‘ਤੇ ਸੰਬੰਧਿਤ ਵਿਜ਼ੂਅਲ ਨਾਲ ਜੁੜੇ ਹੋਏ ਸਨ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਦੁਆਰਾ, ਇਸਨੇ ਨਾ ਸਿਰਫ਼ ਭਾਸ਼ਾ ਦੇ ਅੰਕੜਾ ਪੈਟਰਨ ਅਤੇ ਵਸਤੂਆਂ ਦੀਆਂ ਵਿਜ਼ੂਅਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਿੱਖੀਆਂ, ਬਲਕਿ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਇਸਨੇ ਸ਼ਬਦਾਂ ਅਤੇ ਚਿੱਤਰਾਂ ਵਿਚਕਾਰ ਗੁੰਝਲਦਾਰ ਸੰਬੰਧ ਸਿੱਖੇ।
ਸਿਖਲਾਈ ਦੌਰਾਨ ਇਹ ਡੂੰਘਾ ਏਕੀਕਰਣ ਠੋਸ ਲਾਭ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ:
- ਵਧੀ ਹੋਈ ਪ੍ਰੋਂਪਟ ਸਮਝ: ਮਾਡਲ ਆਪਣੇ ਪੂਰਵਜਾਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਗੁੰਝਲਦਾਰ ਪ੍ਰੋਂਪਟਾਂ ਨੂੰ ਪਾਰਸ ਅਤੇ ਵਿਆਖਿਆ ਕਰ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਕਿ ਪਹਿਲਾਂ ਦੇ ਚਿੱਤਰ ਬਣਾਉਣ ਵਾਲੇ ਮਾਡਲ ਕਈ ਵਸਤੂਆਂ ਅਤੇ ਖਾਸ ਸਥਾਨਿਕ ਜਾਂ ਸੰਕਲਪਿਕ ਸਬੰਧਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੀਆਂ ਬੇਨਤੀਆਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨ ਵੇਲੇ ਸੰਘਰਸ਼ ਕਰ ਸਕਦੇ ਹਨ ਜਾਂ ਤੱਤਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਸਕਦੇ ਹਨ, GPT-4o ਕਥਿਤ ਤੌਰ ‘ਤੇ 20 ਵੱਖ-ਵੱਖ ਤੱਤਾਂ ਤੱਕ ਦੇ ਵੇਰਵੇ ਵਾਲੇ ਪ੍ਰੋਂਪਟਾਂ ਨੂੰ ਵਧੇਰੇ ਵਫ਼ਾਦਾਰੀ ਨਾਲ ਸੰਭਾਲਦਾ ਹੈ। ਕਲਪਨਾ ਕਰੋ ਕਿ ‘ਇੱਕ ਰੁੱਝੇ ਹੋਏ ਮੱਧਕਾਲੀ ਬਾਜ਼ਾਰ ਦਾ ਦ੍ਰਿਸ਼ ਜਿਸ ਵਿੱਚ ਇੱਕ ਬੇਕਰ ਰੋਟੀ ਵੇਚ ਰਿਹਾ ਹੈ, ਦੋ ਨਾਈਟ ਇੱਕ ਫੁਹਾਰੇ ਦੇ ਨੇੜੇ ਬਹਿਸ ਕਰ ਰਹੇ ਹਨ, ਇੱਕ ਵਪਾਰੀ ਰੰਗੀਨ ਰੇਸ਼ਮ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰ ਰਿਹਾ ਹੈ, ਬੱਚੇ ਇੱਕ ਕੁੱਤੇ ਦਾ ਪਿੱਛਾ ਕਰ ਰਹੇ ਹਨ, ਅਤੇ ਅੰਸ਼ਕ ਤੌਰ ‘ਤੇ ਬੱਦਲਵਾਈ ਵਾਲੇ ਅਸਮਾਨ ਦੇ ਹੇਠਾਂ ਪਿਛੋਕੜ ਵਿੱਚ ਇੱਕ ਪਹਾੜੀ ‘ਤੇ ਇੱਕ ਕਿਲ੍ਹਾ ਦਿਖਾਈ ਦੇ ਰਿਹਾ ਹੈ’ ਦੀ ਬੇਨਤੀ ਕਰਨਾ। ਸਾਂਝੀ ਵੰਡ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਇੱਕ ਮਾਡਲ ਹਰੇਕ ਨਿਰਦਿਸ਼ਟ ਭਾਗ ਅਤੇ ਉਹਨਾਂ ਦੇ ਅਪ੍ਰਤੱਖ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪੇਸ਼ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਲੈਸ ਹੈ।
- ਸੁਧਰੀ ਹੋਈ ਸੰਕਲਪਿਕ ਪਕੜ: ਸਿਰਫ਼ ਵਸਤੂਆਂ ਨੂੰ ਪਛਾਣਨ ਤੋਂ ਇਲਾਵਾ, ਮਾਡਲ ਪ੍ਰੋਂਪਟ ਦੇ ਅੰਦਰ ਸ਼ਾਮਲ ਅਮੂਰਤ ਸੰਕਲਪਾਂ ਅਤੇ ਸ਼ੈਲੀਗਤ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਬਿਹਤਰ ਪਕੜ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਮੂਡ, ਕਲਾਤਮਕ ਸ਼ੈਲੀ (ਉਦਾਹਰਨ ਲਈ, ‘ਵੈਨ ਗੌਗ ਦੀ ਸ਼ੈਲੀ ਵਿੱਚ,’ ‘ਇੱਕ ਨਿਊਨਤਮ ਲਾਈਨ ਡਰਾਇੰਗ ਵਜੋਂ’), ਅਤੇ ਖਾਸ ਰਚਨਾਤਮਕ ਬੇਨਤੀਆਂ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਦਾ ਬਿਹਤਰ ਅਨੁਵਾਦ ਕਰ ਸਕਦਾ ਹੈ।
- ਟੈਕਸਟ ਰੈਂਡਰਿੰਗ ਸ਼ੁੱਧਤਾ: AI ਚਿੱਤਰ ਜਨਰੇਟਰਾਂ ਲਈ ਇੱਕ ਆਮ ਰੁਕਾਵਟ ਚਿੱਤਰਾਂ ਦੇ ਅੰਦਰ ਟੈਕਸਟ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰਨਾ ਰਿਹਾ ਹੈ। ਭਾਵੇਂ ਇਹ ਕਿਸੇ ਇਮਾਰਤ ‘ਤੇ ਕੋਈ ਚਿੰਨ੍ਹ ਹੋਵੇ, ਟੀ-ਸ਼ਰਟ ‘ਤੇ ਟੈਕਸਟ ਹੋਵੇ, ਜਾਂ ਕਿਸੇ ਚਿੱਤਰ ‘ਤੇ ਲੇਬਲ ਹੋਵੇ, ਮਾਡਲ ਅਕਸਰ ਗੜਬੜ ਵਾਲੇ ਜਾਂ ਬੇਤੁਕੇ ਅੱਖਰ ਪੈਦਾ ਕਰਦੇ ਹਨ। OpenAI ਉਜਾਗਰ ਕਰਦਾ ਹੈ ਕਿ GPT-4o ਇਸ ਖੇਤਰ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਇਸ ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਵਿਜ਼ੂਅਲ ਦੇ ਅੰਦਰ ਪੜ੍ਹਨਯੋਗ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਉਚਿਤ ਟੈਕਸਟ ਤਿਆਰ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹੈ। ਇਹ ਮੌਕਅੱਪ, ਡਾਇਗ੍ਰਾਮ ਅਤੇ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦਾ ਹੈ ਜਿੱਥੇ ਏਮਬੈਡਡ ਟੈਕਸਟ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਹੈ।
ਇਹ ਉੱਨਤ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀ, ਭਾਸ਼ਾਈ ਅਤੇ ਵਿਜ਼ੂਅਲ ਡੇਟਾ ਸਟ੍ਰੀਮਾਂ ਨੂੰ ਜ਼ਮੀਨੀ ਪੱਧਰ ਤੋਂ ਜੋੜਦੀ ਹੋਈ, GPT-4o ਨੂੰ ਪਾਠ ਦੇ ਇਰਾਦੇ ਅਤੇ ਵਿਜ਼ੂਅਲ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਵਿਚਕਾਰ ਪਾੜੇ ਨੂੰ ਉਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ਨਾਲੋਂ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਪੂਰਾ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਜਿੱਥੇ ਇਹਨਾਂ ਰੂਪਾਂ ਨੂੰ ਵੱਖਰੇ ਤੌਰ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਫਿਰ ਇਕੱਠੇ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ। ਨਤੀਜਾ ਇੱਕ AI ਹੈ ਜੋ ਸਿਰਫ਼ ਤਸਵੀਰਾਂ ਹੀ ਨਹੀਂ ਬਣਾਉਂਦਾ, ਸਗੋਂ ਉਹਨਾਂ ਦੇ ਪਿੱਛੇ ਦੀ ਬੇਨਤੀ ਨੂੰ ਵਧੇਰੇ ਬੁਨਿਆਦੀ ਪੱਧਰ ‘ਤੇ ਸਮਝਦਾ ਹੈ।
ਸੁੰਦਰ ਤਸਵੀਰਾਂ ਤੋਂ ਪਰੇ ਵਿਹਾਰਕਤਾ
ਜਦੋਂ ਕਿ ਸਿਰਜਣਾਤਮਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੁਰੰਤ ਸਪੱਸ਼ਟ ਹੁੰਦੀਆਂ ਹਨ - ਕਲਾਕਾਰੀ, ਚਿੱਤਰ, ਅਤੇ ਸੰਕਲਪਿਕ ਵਿਜ਼ੂਅਲ ਤਿਆਰ ਕਰਨਾ - OpenAI GPT-4o ਦੇ ਏਕੀਕ੍ਰਿਤ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀ ਵਿਹਾਰਕ ਉਪਯੋਗਤਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ। ਟੀਚਾ ਸਿਰਫ਼ ਨਵੀਨਤਾ ਜਾਂ ਕਲਾਤਮਕ ਪ੍ਰਗਟਾਵੇ ਤੋਂ ਪਰੇ ਹੈ; ਇਸਦਾ ਉਦੇਸ਼ ਵਿਜ਼ੂਅਲ ਸਿਰਜਣਾ ਨੂੰ ਵੱਖ-ਵੱਖ ਵਰਕਫਲੋਜ਼ ਦੇ ਅੰਦਰ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਸਾਧਨ ਵਜੋਂ ਸ਼ਾਮਲ ਕਰਨਾ ਹੈ।
ਸੰਭਾਵੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਵਿਸ਼ਾਲਤਾ ‘ਤੇ ਗੌਰ ਕਰੋ:
- ਡਾਇਗ੍ਰਾਮ ਅਤੇ ਫਲੋਚਾਰਟ: ਇੱਕ ਗੁੰਝਲਦਾਰ ਪ੍ਰਕਿਰਿਆ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? GPT-4o ਨੂੰ ‘ਪ੍ਰਕਾਸ਼ ਸੰਸ਼ਲੇਸ਼ਣ ਲਈ ਕਦਮਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਇੱਕ ਸਧਾਰਨ ਫਲੋਚਾਰਟ ਬਣਾਓ’ ਜਾਂ ‘ਕੰਪਿਊਟਰ ਮਦਰਬੋਰਡ ਦੇ ਭਾਗਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਇੱਕ ਚਿੱਤਰ ਤਿਆਰ ਕਰੋ’ ਲਈ ਪੁੱਛੋ। ਸੁਧਰੀ ਹੋਈ ਟੈਕਸਟ ਰੈਂਡਰਿੰਗ ਇੱਥੇ ਲੇਬਲਾਂ ਅਤੇ ਐਨੋਟੇਸ਼ਨਾਂ ਲਈ ਖਾਸ ਤੌਰ ‘ਤੇ ਕੀਮਤੀ ਹੋ ਸਕਦੀ ਹੈ।
- ਵਿਦਿਅਕ ਸਹਾਇਤਾ: ਅਧਿਆਪਕ ਅਤੇ ਵਿਦਿਆਰਥੀ ਇਤਿਹਾਸਕ ਘਟਨਾਵਾਂ, ਵਿਗਿਆਨਕ ਸੰਕਲਪਾਂ, ਜਾਂ ਸਾਹਿਤਕ ਦ੍ਰਿਸ਼ਾਂ ਨੂੰ ਤੁਰੰਤ ਦੇਖ ਸਕਦੇ ਹਨ। ‘ਮੈਨੂੰ ਸੁਤੰਤਰਤਾ ਘੋਸ਼ਣਾ ਪੱਤਰ ‘ਤੇ ਦਸਤਖਤ ਕਰਨ ਦਾ ਚਿੱਤਰਣ ਦਿਖਾਓ’ ਜਾਂ ‘ਜਲ ਚੱਕਰ ਨੂੰ ਦਰਸਾਓ।’
- ਵਪਾਰ ਅਤੇ ਮਾਰਕੀਟਿੰਗ: ਵੈੱਬਸਾਈਟ ਲੇਆਉਟ, ਉਤਪਾਦ ਪੈਕੇਜਿੰਗ ਵਿਚਾਰਾਂ, ਜਾਂ ਸੋਸ਼ਲ ਮੀਡੀਆ ਪੋਸਟਾਂ ਲਈ ਤੇਜ਼ ਮੌਕਅੱਪ ਤਿਆਰ ਕਰੋ। ਪੇਸ਼ਕਾਰੀਆਂ ਜਾਂ ਅੰਦਰੂਨੀ ਦਸਤਾਵੇਜ਼ਾਂ ਲਈ ਸਧਾਰਨ ਚਿੱਤਰ ਬਣਾਓ। ਗੁੰਝਲਦár ਚਾਰਟਿੰਗ ਸੌਫਟਵੇਅਰ ਲਈ ਵਚਨਬੱਧ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਡੇਟਾ ਸੰਕਲਪਾਂ ਦੀ ਕਲਪਨਾ ਕਰੋ। ਕਲਪਨਾ ਕਰੋ ਕਿ ਪੁੱਛਣਾ, ‘ਇੱਕ ਆਧੁਨਿਕ ਇਤਾਲਵੀ ਰੈਸਟੋਰੈਂਟ ਲਈ ਇੱਕ ਮੀਨੂ ਡਿਜ਼ਾਈਨ ਬਣਾਓ, ਜਿਸ ਵਿੱਚ ਪਾਸਤਾ ਪਕਵਾਨ ਅਤੇ ਵਾਈਨ ਪੇਅਰਿੰਗ ਸ਼ਾਮਲ ਹੋਣ, ਇੱਕ ਸਾਫ਼, ਸ਼ਾਨਦਾਰ ਸੁਹਜ ਨਾਲ।’
- ਡਿਜ਼ਾਈਨ ਅਤੇ ਵਿਕਾਸ: ਸ਼ੁਰੂਆਤੀ ਡਿਜ਼ਾਈਨ ਸੰਪਤੀਆਂ ਤਿਆਰ ਕਰੋ, ਸ਼ਾਇਦ ਆਈਕਨਾਂ ਜਾਂ ਸਧਾਰਨ ਇੰਟਰਫੇਸ ਤੱਤਾਂ ਦੀ ਬੇਨਤੀ ਕਰੋ। ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਪਾਰਦਰਸ਼ੀ ਬੈਕਗ੍ਰਾਉਂਡ ਵਾਲੀਆਂ ਸੰਪਤੀਆਂ ਦੀ ਬੇਨਤੀ ਕਰਨ ਦੀ ਯੋਗਤਾ ਡਿਜ਼ਾਈਨਰਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਰਦਾਨ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਜਿਹੇ ਤੱਤਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਬਿਨਾਂ ਦਸਤੀ ਬੈਕਗ੍ਰਾਉਂਡ ਹਟਾਉਣ ਦੇ ਦੂਜੇ ਪ੍ਰੋਜੈਕਟਾਂ ‘ਤੇ ਆਸਾਨੀ ਨਾਲ ਲੇਅਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
- ਨਿੱਜੀ ਵਰਤੋਂ: ਕਸਟਮ ਗ੍ਰੀਟਿੰਗ ਕਾਰਡ ਬਣਾਓ, ਘਰ ਦੀ ਮੁਰੰਮਤ ਦੇ ਵਿਚਾਰਾਂ ਦੀ ਕਲਪਨਾ ਕਰੋ (‘ਮੈਨੂੰ ਮੇਰਾ ਲਿਵਿੰਗ ਰੂਮ ਸੇਜ ਗ੍ਰੀਨ ਰੰਗ ਵਿੱਚ ਪੇਂਟ ਕੀਤਾ ਦਿਖਾਓ’), ਜਾਂ ਨਿੱਜੀ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਵਿਲੱਖਣ ਚਿੱਤਰ ਤਿਆਰ ਕਰੋ।
ਸ਼ਕਤੀ ਮਾਡਲ ਦੀ ਭਾਸ਼ਾ ਅਤੇ ਵਿਜ਼ੂਅਲ ਢਾਂਚੇ ਦੀ ਸੰਯੁਕਤ ਸਮਝ ਵਿੱਚ ਹੈ। ਇਹ ਨਾ ਸਿਰਫ਼ ਕੀ ਖਿੱਚਣਾ ਹੈ, ਸਗੋਂ ਇਹ ਵੀ ਵਿਆਖਿਆ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਕਿਵੇਂ ਪੇਸ਼ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ - ਪ੍ਰੋਂਪਟ ਵਿੱਚ ਸ਼ਾਮਲ ਲੇਆਉਟ, ਸ਼ੈਲੀ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਲੋੜਾਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ। OpenAI ਨੋਟ ਕਰਦਾ ਹੈ ਕਿ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਤਕਨੀਕਾਂ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਦੀ ਸ਼ੁੱਧਤਾ ਅਤੇ ਇਕਸਾਰਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ ਲਗਾਇਆ ਗਿਆ ਸੀ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕਿ ਤਿਆਰ ਕੀਤੇ ਚਿੱਤਰ ਉਪਭੋਗਤਾ ਦੇ ਖਾਸ ਇਰਾਦੇ ਨਾਲ ਵਧੇਰੇ ਨੇੜਿਓਂ ਮੇਲ ਖਾਂਦੇ ਹਨ, ਭਾਵੇਂ ਉਹ ਇਰਾਦਾ ਕਲਾਤਮਕ ਹੋਵੇ ਜਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਾਰਜਸ਼ੀਲ। ਵਿਹਾਰਕਤਾ ‘ਤੇ ਇਹ ਫੋਕਸ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਖਿਡੌਣੇ ਵਜੋਂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਬਹੁਮੁਖੀ ਸਾਧਨ ਵਜੋਂ ਸਥਿਤੀ ਦਿੰਦਾ ਹੈ ਜੋ ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਹੈ ਜਿਸਦੀ ਵਰਤੋਂ ਬਹੁਤ ਸਾਰੇ ਪਹਿਲਾਂ ਹੀ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤੀ ਅਤੇ ਟੈਕਸਟ ਬਣਾਉਣ ਲਈ ਕਰਦੇ ਹਨ।
ਅੰਦਰੂਨੀ ਖਤਰਿਆਂ ਨੂੰ ਸੰਬੋਧਿਤ ਕਰਨਾ: ਸੁਰੱਖਿਆ ਅਤੇ ਜ਼ਿੰਮੇਵਾਰੀ
ਸ਼ਕਤੀਸ਼ਾਲੀ ਉਤਪਾਦਕ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਪੇਸ਼ ਕਰਨਾ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ ਸੰਭਾਵੀ ਦੁਰਵਰਤੋਂ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦਾ ਹੈ। OpenAI ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ GPT-4o ਦੀਆਂ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਤੈਨਾਤੀ ਵਿੱਚ ਸੁਰੱਖਿਆ ਇੱਕ ਪ੍ਰਮੁੱਖ ਵਿਚਾਰ ਰਹੀ ਹੈ। AI-ਤਿਆਰ ਵਿਜ਼ੂਅਲ ਨਾਲ ਜੁੜੇ ਜੋਖਮਾਂ ਨੂੰ ਪਛਾਣਦੇ ਹੋਏ, ਕੰਪਨੀ ਨੇ ਸੁਰੱਖਿਆ ਦੇ ਕਈ ਪੱਧਰ ਲਾਗੂ ਕੀਤੇ ਹਨ:
- ਪ੍ਰੋਵੀਨੈਂਸ ਟ੍ਰੈਕਿੰਗ: ਮਾਡਲ ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਸਾਰੇ ਚਿੱਤਰ C2PA (Coalition for Content Provenance and Authenticity) ਸਟੈਂਡਰਡ ਦੇ ਅਨੁਕੂਲ ਮੈਟਾਡੇਟਾ ਨਾਲ ਏਮਬੈਡ ਕੀਤੇ ਗਏ ਹਨ। ਇਹ ਡਿਜੀਟਲ ਵਾਟਰਮਾਰਕ ਇੱਕ ਸੂਚਕ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ ਕਿ ਚਿੱਤਰ AI ਦੁਆਰਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਸਿੰਥੈਟਿਕ ਮੀਡੀਆ ਨੂੰ ਅਸਲ-ਸੰਸਾਰ ਫੋਟੋਗ੍ਰਾਫੀ ਜਾਂ ਮਨੁੱਖ ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਕਲਾ ਤੋਂ ਵੱਖ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਇਹ ਸੰਭਾਵੀ ਗਲਤ ਜਾਣਕਾਰੀ ਜਾਂ ਧੋਖਾਧੜੀ ਵਾਲੀਆਂ ਵਰਤੋਂ ਦਾ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ।
- ਸਮੱਗਰੀ ਸੰਚਾਲਨ: OpenAI ਅੰਦਰੂਨੀ ਸਾਧਨਾਂ ਅਤੇ ਉੱਨਤ ਸੰਚਾਲਨ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ ਨੁਕਸਾਨਦੇਹ ਜਾਂ ਅਣਉਚਿਤ ਸਮੱਗਰੀ ਬਣਾਉਣ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਨੂੰ ਸਵੈਚਲਿਤ ਤੌਰ ‘ਤੇ ਖੋਜਣ ਅਤੇ ਬਲੌਕ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਇਸ ਵਿੱਚ ਇਹਨਾਂ ਦੀ ਸਿਰਜਣਾ ਦੇ ਵਿਰੁੱਧ ਸਖਤ ਪਾਬੰਦੀਆਂ ਲਾਗੂ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ:
- ਗੈਰ-ਸਹਿਮਤੀ ਵਾਲੀ ਜਿਨਸੀ ਸਮੱਗਰੀ (NC inúmeras): ਸਪੱਸ਼ਟ ਨਗਨਤਾ ਅਤੇ ਗ੍ਰਾਫਿਕ ਚਿੱਤਰਾਂ ਸਮੇਤ।
- ਨਫ਼ਰਤ ਭਰੀ ਜਾਂ ਪਰੇਸ਼ਾਨ ਕਰਨ ਵਾਲੀ ਸਮੱਗਰੀ: ਵਿਅਕਤੀਆਂ ਜਾਂ ਸਮੂਹਾਂ ਨੂੰ ਨੀਵਾਂ ਦਿਖਾਉਣ, ਵਿਤਕਰਾ ਕਰਨ ਜਾਂ ਹਮਲਾ ਕਰਨ ਦੇ ਇਰਾਦੇ ਵਾਲੇ ਵਿਜ਼ੂਅਲ।
- ਗੈਰ-ਕਾਨੂੰਨੀ ਕੰਮਾਂ ਜਾਂ ਅਤਿ ਹਿੰਸਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ।
- ਅਸਲ ਵਿਅਕਤੀਆਂ ਦੀ ਸੁਰੱਖਿਆ: ਸਹਿਮਤੀ ਤੋਂ ਬਿਨਾਂ ਅਸਲ ਲੋਕਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ ਜਨਤਕ ਸ਼ਖਸੀਅਤਾਂ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਫੋਟੋਰੀਅਲਿਸਟਿਕ ਤਸਵੀਰਾਂ ਦੀ ਪੀੜ੍ਹੀ ਨੂੰ ਰੋਕਣ ਲਈ ਖਾਸ ਸੁਰੱਖਿਆ ਉਪਾਅ ਮੌਜੂਦ ਹਨ। ਇਸਦਾ ਉਦੇਸ਼ ਡੀਪਫੇਕ ਅਤੇ ਵੱਕਾਰੀ ਨੁਕਸਾਨ ਨਾਲ ਜੁੜੇ ਜੋਖਮਾਂ ਨੂੰ ਘੱਟ ਕਰਨਾ ਹੈ। ਜਦੋਂ ਕਿ ਜਨਤਕ ਸ਼ਖਸੀਅਤਾਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਬਣਾਉਣ ‘ਤੇ ਪਾਬੰਦੀ ਲਗਾਈ ਜਾ ਸਕਦੀ ਹੈ, ਇੱਕ ਮਸ਼ਹੂਰ ਕਲਾਕਾਰ ਦੀ ਸ਼ੈਲੀ ਵਿੱਚ ਤਸਵੀਰਾਂ ਦੀ ਬੇਨਤੀ ਕਰਨਾ ਆਮ ਤੌਰ ‘ਤੇ ਆਗਿਆਯੋਗ ਹੈ।
- ਅੰਦਰੂਨੀ ਅਲਾਈਨਮੈਂਟ ਮੁਲਾਂਕਣ: ਪ੍ਰਤੀਕਿਰਿਆਸ਼ੀਲ ਬਲੌਕਿੰਗ ਤੋਂ ਪਰੇ, OpenAI ਸੁਰੱਖਿਆ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੇ ਨਾਲ ਚਿੱਤਰ ਬਣਾਉਣ ਪ੍ਰਣਾਲੀ ਦੀ ਅਲਾਈਨਮੈਂਟ ਦਾ ਸਰਗਰਮੀ ਨਾਲ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਅੰਦਰੂਨੀ ਤਰਕ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਮਨੁੱਖੀ-ਲਿਖਤ ਸੁਰੱਖਿਆ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਹਵਾਲਾ ਦੇਣਾ ਅਤੇ ਇਹ ਮੁਲਾਂਕਣ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ ਕਿ ਕੀ ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਅਤੇ ਇਨਕਾਰ ਵਿਵਹਾਰ ਇਹਨਾਂ ਸਥਾਪਿਤ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਇੱਕ ਵਧੇਰੇ ਉੱਨਤ, ਕਿਰਿਆਸ਼ੀਲ ਪਹੁੰਚ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਮਾਡਲ ਜ਼ਿੰਮੇਵਾਰੀ ਨਾਲ ਵਿਵਹਾਰ ਕਰਦਾ ਹੈ।
ਇਹ ਉਪਾਅ AI ਉਦਯੋਗ ਦੇ ਅੰਦਰ ਨਵੀਨਤਾ ਨੂੰ ਨੈਤਿਕ ਵਿਚਾਰਾਂ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਨ ਲਈ ਇੱਕ ਚੱਲ ਰਹੇ ਯਤਨ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। ਜਦੋਂ ਕਿ ਕੋਈ ਵੀ ਸਿਸਟਮ ਫੂਲਪਰੂਫ ਨਹੀਂ ਹੈ, ਪ੍ਰੋਵੀਨੈਂਸ ਮਾਰਕਿੰਗ, ਸਮੱਗਰੀ ਫਿਲਟਰਿੰਗ, ਖਾਸ ਪਾਬੰਦੀਆਂ, ਅਤੇ ਅੰਦਰੂਨੀ ਅਲਾਈਨਮੈਂਟ ਜਾਂਚਾਂ ਦਾ ਸੁਮੇਲ ਇਸ ਸ਼ਕਤੀਸ਼ਾਲੀ ਤਕਨਾਲੋਜੀ ਨੂੰ ਇਸ ਤਰੀਕੇ ਨਾਲ ਤੈਨਾਤ ਕਰਨ ਦੀ ਵਚਨਬੱਧਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਜੋ ਸੰਭਾਵੀ ਨੁਕਸਾਨਾਂ ਨੂੰ ਘੱਟ ਕਰਦਾ ਹੈ। ਇਹਨਾਂ ਸੁਰੱਖਿਆ ਪ੍ਰੋਟੋਕੋਲ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਅਤੇ ਨਿਰੰਤਰ ਸੁਧਾਰ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇਗਾ ਕਿਉਂਕਿ AI ਚਿੱਤਰ ਬਣਾਉਣਾ ਵਧੇਰੇ ਪਹੁੰਚਯੋਗ ਅਤੇ ਰੋਜ਼ਾਨਾ ਦੇ ਸਾਧਨਾਂ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਹੁੰਦਾ ਜਾਂਦਾ ਹੈ।
ਪ੍ਰਦਰਸ਼ਨ, ਰੋਲਆਊਟ, ਅਤੇ ਡਿਵੈਲਪਰ ਪਹੁੰਚ
GPT-4o ਦੇ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀ ਵਧੀ ਹੋਈ ਵਫ਼ਾਦਾਰੀ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਸਮਝ ਇੱਕ ਵਪਾਰ-ਬੰਦ ਦੇ ਨਾਲ ਆਉਂਦੀ ਹੈ: ਗਤੀ। ਇਹਨਾਂ ਵਧੇਰੇ ਉੱਨਤ ਚਿੱਤਰਾਂ ਨੂੰ ਬਣਾਉਣ ਵਿੱਚ ਆਮ ਤੌਰ ‘ਤੇ ਟੈਕਸਟ ਜਵਾਬ ਬਣਾਉਣ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਸਮਾਂ ਲੱਗਦਾ ਹੈ, ਕਈ ਵਾਰ ਬੇਨਤੀ ਦੀ ਗੁੰਝਲਤਾ ਅਤੇ ਸਿਸਟਮ ਲੋਡ ਦੇ ਅਧਾਰ ‘ਤੇ ਇੱਕ ਮਿੰਟ ਤੱਕ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਵਿਜ਼ੂਅਲ ਨੂੰ ਸੰਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤਾਂ ਦਾ ਨਤੀਜਾ ਹੈ ਜੋ ਵਿਸਤ੍ਰਿਤ ਪ੍ਰੋਂਪਟਾਂ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਪ੍ਰਸੰਗ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਦਰਸਾਉਂਦੇ ਹਨ। ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਕੁਝ ਹੱਦ ਤੱਕ ਧੀਰਜ ਰੱਖਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ, ਇਹ ਸਮਝਦੇ ਹੋਏ ਕਿ ਉਡੀਕ ਦਾ ਫਲ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਨਿਯੰਤਰਣ, ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਬਿਹਤਰ ਪਾਲਣਾ, ਅਤੇ ਤੇਜ਼, ਘੱਟ ਪ੍ਰਸੰਗ-ਜਾਣੂ ਮਾਡਲਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਉੱਚ ਸਮੁੱਚੀ ਚਿੱਤਰ ਗੁਣਵੱਤਾ ਹੈ।
ਇਸ ਵਿਸ਼ੇਸ਼ਤਾ ਦਾ ਰੋਲਆਊਟ ਪੜਾਵਾਂ ਵਿੱਚ ਪ੍ਰਬੰਧਿਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ:
- ਸ਼ੁਰੂਆਤੀ ਪਹੁੰਚ: ChatGPT (ਮੁਫ਼ਤ, Plus, Pro, ਅਤੇ Team ਪੱਧਰਾਂ ਵਿੱਚ) ਅਤੇ Sora ਇੰਟਰਫੇਸ ਦੇ ਅੰਦਰ ਤੁਰੰਤ ਉਪਲਬਧ। ਇਹ ਇੱਕ ਵਿਸ਼ਾਲ ਉਪਭੋਗਤਾ ਅਧਾਰ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਪੀੜ੍ਹੀ ਦਾ ਅਨੁਭਵ ਕਰਨ ਦਾ ਮੌਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
- ਆਗਾਮੀ ਵਿਸਤਾਰ: Enterprise ਅਤੇ ਸਿੱਖਿਆ ਗਾਹਕਾਂ ਲਈ ਪਹੁੰਚ ਨੇੜ ਭਵਿੱਖ ਲਈ ਯੋਜਨਾਬੱਧ ਹੈ, ਸੰਗਠਨਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਖਾਸ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਸਮਰੱਥਾ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।
- ਡਿਵੈਲਪਰ ਪਹੁੰਚ: ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, OpenAI ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਆਪਣੀ API ਰਾਹੀਂ GPT-4o ਦੀਆਂ ਚਿੱਤਰ ਬਣਾਉਣ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਉਪਲਬਧ ਕਰਾਉਣ ਦੀ ਯੋ