ਬੈਂਚਮਾਰਕ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ: Turing ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਦਾ ਆਧੁਨਿਕ ਮੋੜ
ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਦੀ ਖੋਜ ਕਿ ਕੀ ਕੋਈ ਮਸ਼ੀਨ ਸੱਚਮੁੱਚ “ਸੋਚ” ਸਕਦੀ ਹੈ, ਨੇ ਦਹਾਕਿਆਂ ਤੋਂ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਦਾਰਸ਼ਨਿਕਾਂ ਨੂੰ ਮੋਹਿਤ ਕੀਤਾ ਹੈ। ਇਸ ਬਹਿਸ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਅਕਸਰ Alan Turing ਦੁਆਰਾ ਪ੍ਰਸਤਾਵਿਤ ਮਹੱਤਵਪੂਰਨ ਸੰਕਲਪ ਹੁੰਦਾ ਹੈ, ਜੋ ਇੱਕ ਸ਼ਾਨਦਾਰ ਬ੍ਰਿਟਿਸ਼ ਗਣਿਤ-ਸ਼ਾਸਤਰੀ ਅਤੇ ਕੋਡਬ੍ਰੇਕਰ ਸਨ ਜਿਨ੍ਹਾਂ ਦੇ ਕੰਮ ਨੇ ਆਧੁਨਿਕ ਕੰਪਿਊਟਿੰਗ ਲਈ ਬੁਨਿਆਦੀ ਨੀਂਹ ਰੱਖੀ। Turing ਨੇ ਇੱਕ ਦ੍ਰਿਸ਼ ਦੀ ਕਲਪਨਾ ਕੀਤੀ, ਜਿਸਨੂੰ ਹੁਣ ਮਸ਼ਹੂਰ ਤੌਰ ‘ਤੇ Turing Test ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ, ਜਿੱਥੇ ਇੱਕ ਮਨੁੱਖੀ ਪੁੱਛਗਿੱਛ ਕਰਨ ਵਾਲਾ ਦੋ ਅਦਿੱਖ ਇਕਾਈਆਂ - ਇੱਕ ਮਨੁੱਖ, ਇੱਕ ਮਸ਼ੀਨ - ਨਾਲ ਟੈਕਸਟ-ਅਧਾਰਤ ਗੱਲਬਾਤ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਮਸ਼ੀਨ ਦੀ ਸਫਲਤਾ ਦਾ ਨਾਜ਼ੁਕ ਮਾਪ? ਪੁੱਛਗਿੱਛ ਕਰਨ ਵਾਲੇ ਨੂੰ ਇਹ ਵਿਸ਼ਵਾਸ ਦਿਵਾਉਣ ਦੀ ਇਸਦੀ ਯੋਗਤਾ ਕਿ ਇਹ ਮਨੁੱਖੀ ਭਾਗੀਦਾਰ ਹੈ। ਜੇ ਪੁੱਛਗਿੱਛ ਕਰਨ ਵਾਲਾ ਭਰੋਸੇਯੋਗ ਤੌਰ ‘ਤੇ ਮਸ਼ੀਨ ਨੂੰ ਵਿਅਕਤੀ ਤੋਂ ਵੱਖ ਨਹੀਂ ਕਰ ਸਕਦਾ, Turing ਨੇ ਮੰਨਿਆ, ਮਸ਼ੀਨ ਨੂੰ ਮਨੁੱਖ ਦੇ ਸਮਾਨ ਬੁੱਧੀਮਾਨ ਵਿਵਹਾਰ ਦੇ ਸਮਰੱਥ ਮੰਨਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਹਾਲਾਂਕਿ ਅਸਲ ਟੈਸਟ ਨੂੰ ਚੇਤਨਾ ਜਾਂ ਸਮਝ ਦੇ ਸੱਚੇ ਮਾਪ ਵਜੋਂ ਇਸਦੀ ਪਰਿਆਪਤਤਾ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਆਲੋਚਨਾਵਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ ਹੈ, ਇਸਦਾ ਮੁੱਖ ਵਿਚਾਰ - ਇੱਕ AI ਦੀ ਮਨੁੱਖੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨੂੰ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਦੁਹਰਾਉਣ ਦੀ ਯੋਗਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ - ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬੈਂਚਮਾਰਕ ਬਣਿਆ ਹੋਇਆ ਹੈ।
ਹੁਣ, University of California, San Diego ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇਸ ਕਲਾਸਿਕ ਮੁਲਾਂਕਣ ਵਿੱਚ ਨਵੀਂ ਜਾਨ ਫੂਕ ਦਿੱਤੀ ਹੈ, ਅੱਜ ਦੇ ਆਧੁਨਿਕ AI ਲੈਂਡਸਕੇਪ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਇੱਕ ਮਜਬੂਰ ਕਰਨ ਵਾਲੀ ਪਰਿਵਰਤਨ ਪੇਸ਼ ਕੀਤੀ ਹੈ। ਉਹਨਾਂ ਦਾ ਅਧਿਐਨ Turing Test ਦੇ ਤਿੰਨ-ਪੱਖੀ ਦੁਹਰਾਓ ਦੀ ਅਗਵਾਈ ਕਰਦਾ ਹੈ, ਮੁਲਾਂਕਣ ਵਿੱਚ ਜਟਿਲਤਾ ਅਤੇ ਸ਼ਾਇਦ ਇੱਕ ਵਧੇਰੇ ਯਥਾਰਥਵਾਦੀ ਗਤੀਸ਼ੀਲਤਾ ਜੋੜਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ AI ਨੂੰ ਇੱਕ ਮਨੁੱਖ ਤੋਂ ਵੱਖ ਕਰਨ ਬਾਰੇ ਨਹੀਂ ਸੀ; ਇਸ ਵਿੱਚ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਅਤੇ ਧੋਖੇ ਦਾ ਇੱਕ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਨਾਚ ਸ਼ਾਮਲ ਸੀ, ਸਮਕਾਲੀ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਨਕਲ ਦੀ ਕਲਾ ਵਿੱਚ ਉਹਨਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਤੱਕ ਧੱਕਦਾ ਸੀ। ਖੋਜਾਂ ਸੁਝਾਅ ਦਿੰਦੀਆਂ ਹਨ ਕਿ ਸਭ ਤੋਂ ਉੱਨਤ AI ਮਾਡਲ ਸਿਰਫ਼ ਮਨੁੱਖ-ਵਰਗੀ ਗੱਲਬਾਤ ਦੀ ਦਹਿਲੀਜ਼ ਤੱਕ ਨਹੀਂ ਪਹੁੰਚ ਰਹੇ ਹਨ; ਕੁਝ ਸੰਦਰਭਾਂ ਵਿੱਚ, ਉਹ ਇਸ ਉੱਤੇ ਸਿੱਧੇ ਛਾਲ ਮਾਰ ਸਕਦੇ ਹਨ, ਕਈ ਵਾਰ ਮਨੁੱਖਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਮਨੁੱਖੀ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ।
ਚੁਣੌਤੀ: ਮਨੁੱਖਾਂ ਨੂੰ ਅਤਿ-ਆਧੁਨਿਕ AI ਦੇ ਵਿਰੁੱਧ ਖੜ੍ਹਾ ਕਰਨਾ
UC San Diego ਟੀਮ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਪ੍ਰਯੋਗਾਤਮਕ ਡਿਜ਼ਾਈਨ ਖਾਸ ਅਤੇ ਸਖ਼ਤ ਸੀ। ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੇ ਹਰੇਕ ਦੌਰ ਵਿੱਚ ਇੱਕ ਤਿਕੜੀ ਸ਼ਾਮਲ ਸੀ: ਦੋ ਮਨੁੱਖੀ ਭਾਗੀਦਾਰ ਅਤੇ ਇੱਕ AI ਮਾਡਲ। ਮਨੁੱਖਾਂ ਨੂੰ ਇੱਕ ਇਕਵਚਨ, ਚੁਣੌਤੀਪੂਰਨ ਟੀਚਾ ਸੌਂਪਿਆ ਗਿਆ ਸੀ: ਗੱਲਬਾਤ ਦੀ ਇੱਕ ਮਿਆਦ ਤੋਂ ਬਾਅਦ, ਇਹ ਨਿਰਧਾਰਤ ਕਰੋ ਕਿ ਉਹਨਾਂ ਦੇ ਦੋ ਅਦਿੱਖ ਵਾਰਤਾਲਾਪ ਕਰਨ ਵਾਲਿਆਂ ਵਿੱਚੋਂ ਕਿਹੜਾ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਸੀ ਅਤੇ ਕਿਹੜਾ ਸਾਥੀ ਮਨੁੱਖ ਸੀ। ਇਹ ਸੈੱਟਅੱਪ ਅਸਲ ਇੱਕ-ਨਾਲ-ਇੱਕ-ਨਾਲ-ਇੱਕ Turing Test ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਸੁਭਾਵਕ ਤੌਰ ‘ਤੇ ਦਾਅ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ।
ਇਸ ਨਿਰਧਾਰਨ ਦੀ ਸਹੂਲਤ ਲਈ, ਭਾਗੀਦਾਰਾਂ ਨੇ ਦੋ ਇੱਕੋ ਸਮੇਂ, ਸਮਾਨਾਂਤਰ ਟੈਕਸਟ-ਅਧਾਰਤ ਸੰਵਾਦਾਂ ਵਿੱਚ ਹਿੱਸਾ ਲਿਆ - ਇੱਕ ਲੁਕੇ ਹੋਏ ਮਨੁੱਖ ਨਾਲ, ਦੂਜਾ ਲੁਕੇ ਹੋਏ AI ਨਾਲ। ਉਹਨਾਂ ਨੂੰ ਹਰੇਕ ਦੌਰ ਲਈ ਇੱਕ ਸੰਖੇਪ ਪੰਜ-ਮਿੰਟ ਦੀ ਵਿੰਡੋ ਅਲਾਟ ਕੀਤੀ ਗਈ ਸੀ। ਇਸ ਸਮਾਂ-ਸੀਮਾ ਦੇ ਅੰਦਰ, ਮਨੁੱਖੀ ਜੱਜਾਂ ਨੂੰ ਪੂਰੀ ਆਜ਼ਾਦੀ ਸੀ। ਉਹ ਕਿਸੇ ਵੀ ਪੁੱਛਗਿੱਛ ਦੀ ਰਣਨੀਤੀ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਸਨ, ਕਿਸੇ ਵੀ ਵਿਸ਼ੇ ਨਾਲ ਪੜਤਾਲ ਕਰ ਸਕਦੇ ਸਨ, ਜਾਂ ਕਿਸੇ ਵੀ ਗੱਲਬਾਤ ਦੀ ਚਾਲ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਸਨ ਜਿਸਨੂੰ ਉਹ ਆਪਣੇ ਚੈਟ ਭਾਈਵਾਲਾਂ ਦੀ ਅਸਲ ਪ੍ਰਕਿਰਤੀ ਦਾ ਪਰਦਾਫਾਸ਼ ਕਰਨ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਮਝਦੇ ਸਨ। ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਵਿੰਡੋ ਦੀ ਸੰਖੇਪਤਾ ਚੁਣੌਤੀ ਦੀ ਇੱਕ ਹੋਰ ਪਰਤ ਜੋੜਦੀ ਹੈ, AI ਦੀ ਇੱਕ ਭਰੋਸੇਯੋਗ ਸ਼ਖਸੀਅਤ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਸਥਾਪਤ ਕਰਨ ਅਤੇ ਜਾਂਚ ਅਧੀਨ ਇਸਨੂੰ ਬਣਾਈ ਰੱਖਣ ਦੀ ਯੋਗਤਾ ਦੀ ਪਰਖ ਕਰਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਸੀਮਤ ਗੱਲਬਾਤ ਡੇਟਾ ਦੇ ਅਧਾਰ ਤੇ ਤੇਜ਼, ਸਹੀ ਨਿਰਣੇ ਲੈਣ ਦੀ ਮਨੁੱਖ ਦੀ ਯੋਗਤਾ ਦੀ ਵੀ ਪਰਖ ਕਰਦੀ ਹੈ। ਪੰਜ-ਮਿੰਟ ਦੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੀ ਮਿਆਦ ਤੋਂ ਬਾਅਦ, ਸੱਚਾਈ ਦਾ ਪਲ ਆ ਗਿਆ: ਮਨੁੱਖੀ ਭਾਗੀਦਾਰਾਂ ਨੇ ਆਪਣੀਆਂ ਵੋਟਾਂ ਪਾਈਆਂ, ਇਹ ਪਛਾਣਦੇ ਹੋਏ ਕਿ ਉਹਨਾਂ ਦੇ ਵਿਸ਼ਵਾਸ ਅਨੁਸਾਰ ਕਿਹੜੀ ਇਕਾਈ AI ਸੀ।
ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇੱਕ ਸਿੰਗਲ AI ਸਿਸਟਮ ‘ਤੇ ਭਰੋਸਾ ਨਹੀਂ ਕੀਤਾ। ਇਸ ਦੀ ਬਜਾਏ, ਉਹਨਾਂ ਨੇ AI ਵਿਕਾਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਯੁੱਗਾਂ ਅਤੇ ਸਮਰੱਥਾਵਾਂ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਨ ਵਾਲੀ ਇੱਕ ਵਿਭਿੰਨ ਲਾਈਨਅੱਪ ਤਿਆਰ ਕੀਤੀ:
- ELIZA: ਲਗਭਗ ਛੇ ਦਹਾਕੇ ਪਹਿਲਾਂ Joseph Weizenbaum ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਇੱਕ ਮੋਢੀ ਚੈਟਬੋਟ (ਸਰੋਤ ਵਿੱਚ ਦੱਸੇ ਅਨੁਸਾਰ 80 ਨਹੀਂ, ELIZA 1960 ਦੇ ਦਹਾਕੇ ਦੇ ਮੱਧ ਦਾ ਹੈ)। ਹਾਲਾਂਕਿ ਅੱਜ ਦੇ ਮਿਆਰਾਂ ਅਨੁਸਾਰ ਆਦਿਮ, ਪੈਟਰਨ ਮੈਚਿੰਗ ਅਤੇ ਸਧਾਰਨ ਸਕ੍ਰਿਪਟਾਂ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ, ELIZA ਨੇ ਇੱਕ ਇਤਿਹਾਸਕ ਬੇਸਲਾਈਨ ਵਜੋਂ ਕੰਮ ਕੀਤਾ, ਗੱਲਬਾਤ ਵਾਲੇ AI ਦੀਆਂ ਸ਼ੁਰੂਆਤੀ ਕੋਸ਼ਿਸ਼ਾਂ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਦਾ ਹੈ।
- Meta’s Llama 3.1-405B: Meta AI ਦਾ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਸਮਕਾਲੀ ਵੱਡਾ ਭਾਸ਼ਾ ਮਾਡਲ (LLM), ਜੋ ਇਸਦੇ ਆਧੁਨਿਕ ਟੈਕਸਟ ਉਤਪਾਦਨ ਅਤੇ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਲਈ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ। ਇਸਦੀ ਸ਼ਮੂਲੀਅਤ ਇੱਕ ਪ੍ਰਮੁੱਖ AI ਖੋਜ ਪ੍ਰਯੋਗਸ਼ਾਲਾ ਤੋਂ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਸਥਿਤੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।
- OpenAI’s GPT-4o: ਅਧਿਐਨ ਦੇ ਸਮੇਂ OpenAI ਤੋਂ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਨਵੀਨਤਮ ਮਲਟੀਮੋਡਲ ਮਾਡਲ, ਇਸਦੀ ਗਤੀ, ਕੁਸ਼ਲਤਾ, ਅਤੇ ਪਿਛਲੇ GPT ਦੁਹਰਾਓ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਵਧੀਆਂ ਗੱਲਬਾਤ ਯੋਗਤਾਵਾਂ ਲਈ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਹੈ।
- OpenAI’s GPT-4.5: OpenAI ਦੀ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲ ਲੜੀ ਦਾ ਇੱਕ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਉੱਨਤ, ਸ਼ਾਇਦ ਅਣ-ਰਿਲੀਜ਼ ਜਾਂ ਅੰਦਰੂਨੀ ਸੰਸਕਰਣ। ਇਸਦੀ ਸ਼ਮੂਲੀਅਤ ਉਹਨਾਂ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਦਾ ਸੁਝਾਅ ਦਿੰਦੀ ਹੈ ਜੋ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ ਪ੍ਰਣਾਲੀਆਂ ਤੋਂ ਪਰੇ ਸੀਮਾਵਾਂ ਨੂੰ ਧੱਕ ਰਹੇ ਹਨ।
ਇਸ ਚੋਣ ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਨਾ ਸਿਰਫ਼ ਆਧੁਨਿਕ AI ਦੀ ਮਨੁੱਖਾਂ ਦੇ ਵਿਰੁੱਧ ਤੁਲਨਾ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ, ਸਗੋਂ ਇੱਕ ਇਤਿਹਾਸਕ ਬੈਂਚਮਾਰਕ ਦੇ ਵਿਰੁੱਧ ਅਤੇ ਸਮਕਾਲੀ AI ਆਧੁਨਿਕਤਾ ਦੇ ਵੱਖ-ਵੱਖ ਪੱਧਰਾਂ ਦੇ ਵਿਰੁੱਧ ਵੀ ਤੁਲਨਾ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ। ਮੁੱਖ ਸਵਾਲ ਬਣਿਆ ਰਿਹਾ: ਕੀ ਇਹ ਮਸ਼ੀਨਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ ਉੱਨਤ LLMs, ਇਸ ਤਿੰਨ-ਪੱਖੀ ਗੱਲਬਾਤ ਦੀ ਉਲਝਣ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਨੈਵੀਗੇਟ ਕਰ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਮਨੁੱਖ ਵਜੋਂ ਪਾਸ ਹੋ ਸਕਦੀਆਂ ਹਨ?
ਸ਼ਖਸੀਅਤ ਦੀ ਰਣਨੀਤੀ: GPT-4.5 ਨੇ ਅਸਾਧਾਰਨ ਸਫਲਤਾ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕੀਤੀ
ਅਧਿਐਨ ਨੇ AI ਮਾਡਲਾਂ ਲਈ ਦੋ ਵੱਖ-ਵੱਖ ਸੰਚਾਲਨ ਦ੍ਰਿਸ਼ਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤਾ, ਜਾਂਚ ਵਿੱਚ ਇੱਕ ਹੋਰ ਪਹਿਲੂ ਜੋੜਿਆ। ਖੋਜਕਰਤਾ ਇਹ ਸਮਝਣਾ ਚਾਹੁੰਦੇ ਸਨ ਕਿ ਕੀ AI ਦਾ ਸਪੱਸ਼ਟ ਟੀਚਾ ਮਨੁੱਖੀ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਧੋਖਾ ਦੇਣ ਦੀ ਇਸਦੀ ਯੋਗਤਾ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰਦਾ ਹੈ।
ਦ੍ਰਿਸ਼ 1: ਸਪੱਸ਼ਟ ਧੋਖੇ ਦਾ ਕੰਮ: ਇਸ ਸੈੱਟਅੱਪ ਵਿੱਚ, AI ਨੂੰ ਇੱਕ ਸਿੱਧਾ ਅਤੇ ਸਪੱਸ਼ਟ ਨਿਰਦੇਸ਼ ਦਿੱਤਾ ਗਿਆ ਸੀ: ਮਨੁੱਖੀ ਭਾਗੀਦਾਰ ਨੂੰ ਗੁੰਮਰਾਹ ਕਰੋ। ਇਸਦਾ ਪ੍ਰੋਗਰਾਮ ਕੀਤਾ ਉਦੇਸ਼ ਗੱਲਬਾਤ ਦੁਆਰਾ ਹਰ ਸੰਭਵ ਕੋਸ਼ਿਸ਼ ਕਰਨਾ ਸੀ ਤਾਂ ਜੋ ਮਨੁੱਖੀ ਜੱਜ ਨੂੰ ਯਕੀਨ ਦਿਵਾਇਆ ਜਾ ਸਕੇ ਕਿ ਉਹ ਕਿਸੇ ਹੋਰ ਅਸਲ ਵਿਅਕਤੀ ਨਾਲ ਗੱਲਬਾਤ ਕਰ ਰਹੇ ਹਨ। ਇਸ ਨੇ AI ਦੀ ਰਣਨੀਤੀ ਬਣਾਉਣ ਅਤੇ ਸ਼ਾਇਦ ਗੱਲਬਾਤ ਨੂੰ ਮਨੁੱਖੀ ਦਿਖਣ ਦੇ ਟੀਚੇ ਵੱਲ ਹੇਰਾਫੇਰੀ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੀ ਪਰਖ ਕੀਤੀ ਜਦੋਂ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਅਜਿਹਾ ਕਰਨ ਲਈ ਕਿਹਾ ਗਿਆ।
ਦ੍ਰਿਸ਼ 2: ਸ਼ਖਸੀਅਤ ਦੀ ਨਕਲ ਦਾ ਕੰਮ: ਇੱਥੇ, AI ਨੂੰ ਇੱਕ ਵੱਖਰੀ ਕਿਸਮ ਦਾ ਪ੍ਰੋਂਪਟ ਮਿਲਿਆ। ਇਸਨੂੰਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਧੋਖਾ ਦੇਣ ਲਈ ਨਹੀਂ ਕਿਹਾ ਗਿਆ ਸੀ। ਇਸ ਦੀ ਬਜਾਏ, ਇਸਨੂੰ ਇੱਕ ਖਾਸ ਸ਼ਖਸੀਅਤ ਅਪਣਾਉਣ ਦਾ ਨਿਰਦੇਸ਼ ਦਿੱਤਾ ਗਿਆ ਸੀ - ਇੱਕ ਨੌਜਵਾਨ ਵਿਅਕਤੀ ਜੋ ਇੰਟਰਨੈਟ ਸੱਭਿਆਚਾਰ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਡੁੱਬਿਆ ਹੋਇਆ ਹੈ, ਸਮਕਾਲੀ ਸਲੈਂਗ ਦੀ ਵਰਤੋਂ ਅਤੇ ਉਸ ਜਨਸੰਖਿਆ ਦੀਆਂ ਖਾਸ ਸੰਚਾਰ ਸ਼ੈਲੀਆਂ ਨਾਲ ਸੰਪੂਰਨ। AI ਨੂੰ ਸਿਰਫ਼ ਇਸ ਪਾਤਰ ਨੂੰ ਬਣਨ ਲਈ ਕਿਹਾ ਗਿਆ ਸੀ, ਪੁੱਛਗਿੱਛ ਕਰਨ ਵਾਲੇ ਨੂੰ ਮੂਰਖ ਬਣਾਉਣ ਦੇ ਸਪੱਸ਼ਟ ਨਿਰਦੇਸ਼ ਤੋਂ ਬਿਨਾਂ।
ਇਹਨਾਂ ਦੋ ਦ੍ਰਿਸ਼ਾਂ ਦੇ ਨਤੀਜੇ ਹੈਰਾਨੀਜਨਕ ਤੌਰ ‘ਤੇ ਵੱਖਰੇ ਸਨ, ਖਾਸ ਤੌਰ ‘ਤੇ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲੇ, GPT-4.5 ਲਈ। ਜਦੋਂ ਗੁੰਮਰਾਹ ਕਰਨ ਦੇ ਸਪੱਸ਼ਟ ਨਿਰਦੇਸ਼ (ਦ੍ਰਿਸ਼ 1) ਦੇ ਤਹਿਤ ਕੰਮ ਕਰਦੇ ਹੋਏ, GPT-4.5 ਨੇ 36% ਦੀ ਸਫਲਤਾ ਦਰ ਪ੍ਰਾਪਤ ਕੀਤੀ। ਹਾਲਾਂਕਿ ਮਾਮੂਲੀ ਨਹੀਂ, ਇਹ ਅੰਕੜਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਜਦੋਂ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਧੋਖਾ ਦੇਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ AI ਸ਼ਾਇਦ ਘੱਟ ਭਰੋਸੇਮੰਦ ਸੀ, ਜਾਂ ਸ਼ਾਇਦ ਇਸ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਮਨੁੱਖੀ ਜੱਜਾਂ ਦੁਆਰਾ ਵਧੇਰੇ ਆਸਾਨੀ ਨਾਲ ਖੋਜੀਆਂ ਜਾ ਸਕਦੀਆਂ ਸਨ ਜੋ ਬਨਾਵਟੀਪਨ ਲਈ ਉੱਚ ਚੌਕਸੀ ‘ਤੇ ਹੋ ਸਕਦੇ ਸਨ।
ਹਾਲਾਂਕਿ, ਸ਼ਖਸੀਅਤ ਦੀ ਨਕਲ ਦੇ ਕੰਮ (ਦ੍ਰਿਸ਼ 2) ਵਿੱਚ ਬਿਰਤਾਂਤ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਬਦਲ ਗਿਆ। ਜਦੋਂ ਸਿਰਫ਼ ਨੌਜਵਾਨ, ਇੰਟਰਨੈਟ-ਸਮਝਦਾਰ ਸ਼ਖਸੀਅਤ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਕਿਹਾ ਗਿਆ, ਤਾਂ GPT-4.5 ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਵਧ ਗਿਆ। ਇਹ 73% ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਆਪਣੀ ਮਨੁੱਖਤਾ ਦਾ ਯਕੀਨ ਦਿਵਾਉਣ ਵਿੱਚ ਕਾਮਯਾਬ ਰਿਹਾ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਇੱਕ ਕੁਦਰਤੀ-ਦਿੱਖ ਵਾਲੇ ਪਾਤਰ ਨੂੰ ਅਪਣਾਉਣਾ, ਭਾਵੇਂ ਇੱਕ ਸ਼ੈਲੀ ਵਾਲਾ ਵੀ ਹੋਵੇ, ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਧੋਖੇ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਨਾਲੋਂ ਘੁਲਣ-ਮਿਲਣ ਲਈ ਇੱਕ ਕਿਤੇ ਜ਼ਿਆਦਾ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਰਣਨੀਤੀ ਸੀ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ AI ਦੀ ਤਾਕਤ ਗਣਿਤਕ ਹੇਰਾਫੇਰੀ ਵਿੱਚ ਘੱਟ ਹੈ ਅਤੇ ਇਸਦੇ ਵਿਸ਼ਾਲ ਸਿਖਲਾਈ ਡੇਟਾ ਤੋਂ ਸਿੱਖੇ ਗਏ ਖਾਸ ਜਨਸੰਖਿਆ ਜਾਂ ਸ਼ਖਸੀਅਤਾਂ ਨਾਲ ਜੁੜੇ ਮਨੁੱਖੀ ਸੰਚਾਰ ਦੇ ਪੈਟਰਨਾਂ ਨੂੰ ਯਥਾਰਥਵਾਦੀ ਢੰਗ ਨਾਲ ਸੰਸ਼ਲੇਸ਼ਣ ਅਤੇ ਦੁਹਰਾਉਣ ਦੀ ਇਸਦੀ ਯੋਗਤਾ ਵਿੱਚ ਵਧੇਰੇ ਹੈ। AI ਮਨੁੱਖ ਬਣਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਨਹੀਂ ਕਰ ਰਿਹਾ ਸੀ; ਇਹ ਇੱਕ ਖਾਸ ਕਿਸਮ ਦੇ ਮਨੁੱਖ ਵਜੋਂ ਕੰਮ ਕਰ ਰਿਹਾ ਸੀ, ਅਤੇ ਇਸਨੇ ਹੈਰਾਨੀਜਨਕ ਪ੍ਰਭਾਵ ਨਾਲ ਅਜਿਹਾ ਕੀਤਾ।
ਤੁਲਨਾਤਮਕ ਪ੍ਰਦਰਸ਼ਨ: ਧੋਖੇ ਦਾ ਇੱਕ ਸਪੈਕਟ੍ਰਮ
ਜਦੋਂ ਕਿ GPT-4.5 ਨੇ ਸਭ ਦਾ ਧਿਆਨ ਖਿੱਚਿਆ, ਦੂਜੇ AI ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੇ ਕੀਮਤੀ ਸੰਦਰਭ ਅਤੇ ਕੁਝ ਦਿਲਚਸਪ ਹੈਰਾਨੀ ਪ੍ਰਦਾਨ ਕੀਤੀ।
Meta’s Llama 3.1-405B ਨੇ ਵੀ ਕਾਫ਼ੀ ਸਮਰੱਥਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ। ਇਸਨੇ ਮਨੁੱਖਾਂ ਨੂੰ ਆਪਣੀ ਪ੍ਰਮਾਣਿਕਤਾ ਦਾ ਯਕੀਨ ਦਿਵਾਉਣ ਵਿੱਚ 56% ਸਫਲਤਾ ਦਰ ਪ੍ਰਾਪਤ ਕੀਤੀ। ਇਹ ਨਤੀਜਾ ਬੇਤਰਤੀਬ ਮੌਕੇ ਨਾਲੋਂ ਕਾਫ਼ੀ ਬਿਹਤਰ ਹੈ (ਜੋ ਕਿ ਦੋ-ਚੋਣ ਵਾਲੇ ਦ੍ਰਿਸ਼ ਵਿੱਚ 50% ਹੋਵੇਗਾ, ਹਾਲਾਂਕਿ ਤਿੰਨ-ਪੱਖੀ ਟੈਸਟ ਗਤੀਸ਼ੀਲਤਾ ਸਧਾਰਨ ਸੰਭਾਵਨਾਵਾਂ ਨੂੰ ਥੋੜ੍ਹਾ ਗੁੰਝਲਦਾਰ ਬਣਾਉਂਦੀ ਹੈ)। ਇਹ Llama 3.1 ਨੂੰ ਉੱਚ ਯੋਗਤਾ ਵਾਲੇ ਗੱਲਬਾਤ ਦੇ ਨਕਲਚੀਆਂ ਦੀ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਮਜ਼ਬੂਤੀ ਨਾਲ ਰੱਖਦਾ ਹੈ, ਜੋ ਅਕਸਰ ਮਨੁੱਖੀ ਜੱਜਾਂ ਨੂੰ ਮੂਰਖ ਬਣਾਉਣ ਦੇ ਸਮਰੱਥ ਹੈ, ਭਾਵੇਂ ਕਿ GPT-4.5 ਦੁਆਰਾ ਇਸਦੇ ਅਨੁਕੂਲ ਦ੍ਰਿਸ਼ ਵਿੱਚ ਦਿਖਾਏ ਗਏ ਅਸਾਧਾਰਨ ਪੱਧਰਾਂ ਤੱਕ ਨਹੀਂ ਪਹੁੰਚਦਾ। ਇਹ ਠੋਸ ਪ੍ਰਦਰਸ਼ਨ ਸੂਖਮ ਮਨੁੱਖੀ ਸੰਵਾਦ ਨੂੰ ਦੁਹਰਾਉਣ ਵਿੱਚ ਪ੍ਰਮੁੱਖ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਆਮ ਤਰੱਕੀ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦਾ ਹੈ।
ਸ਼ਾਇਦ ਸਭ ਤੋਂ ਅਚਾਨਕ ਖੋਜ GPT-4o ਅਤੇ ਇਤਿਹਾਸਕ ELIZA ਪ੍ਰੋਗਰਾਮ ਵਿਚਕਾਰ ਤੁਲਨਾ ਤੋਂ ਉਭਰੀ। OpenAI ਦੇ ਉੱਨਤ GPT-4o ਮਾਡਲ ਨੇ ਸਿਰਫ 21% ਮਾਮਲਿਆਂ ਵਿੱਚ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਯਕੀਨ ਦਿਵਾਇਆ ਕਿ ਇਹ ਮਨੁੱਖ ਸੀ। ਇਸਦੇ ਉਲਟ, ਬਹੁਤ ਸਰਲ, ਸਕ੍ਰਿਪਟ-ਅਧਾਰਤ ELIZA ਪ੍ਰੋਗਰਾਮ ਨੇ ਥੋੜ੍ਹਾ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, 23% ਸਫਲਤਾ ਦਰ ਪ੍ਰਾਪਤ ਕੀਤੀ। ਹਾਲਾਂਕਿ ਦੋਵੇਂ ਪ੍ਰਤੀਸ਼ਤ ਘੱਟ ਹਨ, ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਇਸ ਖਾਸ ਟੈਸਟ ਸੈੱਟਅੱਪ ਵਿੱਚ ਕੋਈ ਵੀ ਖਾਸ ਤੌਰ ‘ਤੇ ਭਰੋਸੇਮੰਦ ਨਹੀਂ ਸੀ, ELIZA ਦਾ ਕਿਨਾਰਾ, ਭਾਵੇਂ ਕਿ ਮਾਮੂਲੀ ਹੋਵੇ, ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ। ਇਹ ਇਹਨਾਂ ਸੰਖੇਪ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਧਾਰਨਾ ਅਤੇ ਨਿਰਣੇ ਦੀ ਪ੍ਰਕਿਰਤੀ ਬਾਰੇ ਸਵਾਲ ਉਠਾਉਂਦਾ ਹੈ। ਕੀ ਇਹ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ELIZA ਦੀ ਬਹੁਤ ਹੀ ਸਾਦਗੀ ਅਤੇ ਭਵਿੱਖਬਾਣੀਯੋਗਤਾ, ਸ਼ਾਇਦ ਅਜੀਬ ਜਾਂ ਵਿਲੱਖਣ ਵਜੋਂ ਸਮਝੀ ਗਈ, ਕਈ ਵਾਰ ਮਨੁੱਖੀ ਗੈਰ-ਮਿਆਰੀ ਸੰਚਾਰ ਵਜੋਂ ਗਲਤ ਵਿਆਖਿਆ ਕੀਤੀ ਗਈ ਸੀ, ਜਦੋਂ ਕਿ GPT-4o ਦੇ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਪਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਨਿਰਜੀਵ ਜਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਰਸਮੀ ਜਵਾਬ (ਇਸਦੇ ਖਾਸ ਪ੍ਰੋਂਪਟਿੰਗ ਅਤੇ ਟੈਸਟ ਵਿੱਚ ਵਿਵਹਾਰ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ) ਵਧੇਰੇ ਆਸਾਨੀ ਨਾਲ ਨਕਲੀ ਵਜੋਂ ਫਲੈਗ ਕੀਤੇ ਗਏ ਸਨ? ਵਿਕਲਪਕ ਤੌਰ ‘ਤੇ, ਇਹ ਖਾਸ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਜਾਂ ਭਾਗੀਦਾਰਾਂ ਦੀਆਂ ਉਮੀਦਾਂ ਵਿੱਚ ਸੂਖਮਤਾਵਾਂ ਨੂੰਦਰਸਾ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਥੋੜ੍ਹੇ ਜਿਹੇ ਮਾਮਲਿਆਂ ਵਿੱਚ ELIZA ਦੀ ਸ਼ੈਲੀ ਦਾ ਪੱਖ ਪੂਰਿਆ। ਇਹ ਨਤੀਜਾ ਯਕੀਨੀ ਤੌਰ ‘ਤੇ ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਂਚ ਦੀ ਵਾਰੰਟੀ ਦਿੰਦਾ ਹੈ ਕਿ ਮਨੁੱਖ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੀ ਬਨਾਵਟੀਪਨ ਜਾਂ ਗੈਰ-ਮਿਆਰੀ ਸੰਚਾਰ ਨੂੰ ਕਿਵੇਂ ਸਮਝਦੇ ਹਨ।
ਹਾਲਾਂਕਿ, ਸ਼ਾਨਦਾਰ ਨਤੀਜਾ GPT-4.5 ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਰਿਹਾ, ਖਾਸ ਤੌਰ ‘ਤੇ ਅਧਿਐਨ ਦੇ ਮੁੱਖ ਲੇਖਕ, Cameron Jones, ਜੋ UC San Diego ਵਿਖੇ Language and Cognition Laboratory ਵਿੱਚ ਇੱਕ ਖੋਜਕਰਤਾ ਹਨ, ਦੁਆਰਾ ਉਜਾਗਰ ਕੀਤਾ ਗਿਆ। Jones ਨੇ ਸਭ ਤੋਂ ਹੈਰਾਨ ਕਰਨ ਵਾਲੇ ਪਹਿਲੂ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ: “ਲੋਕ GPT-4.5 ਅਤੇ LLaMa ਦੇ ਲੋਕਾਂ ਵਿੱਚ ਫਰਕ ਕਰਨ ਵਿੱਚ ਅਸਮਰੱਥ ਸਨ ਅਤੇ 4.5 ਨੂੰ ਅਸਲ ਲੋਕਾਂ ਨਾਲੋਂ ਵੀ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਾਰ ਮਨੁੱਖੀ ਦਰਜਾ ਦਿੱਤਾ ਗਿਆ ਸੀ!” ਇਹ ਇੱਕ ਡੂੰਘਾ ਬਿਆਨ ਹੈ। ਇੱਕ AI ਲਈ ਮਨੁੱਖ ਵਜੋਂ ਪਾਸ ਹੋਣਾ ਇੱਕ ਗੱਲ ਹੈ; ਇਸ ਨੂੰ ਉਸੇ ਟੈਸਟ ਵਿੱਚ ਭਾਗ ਲੈਣ ਵਾਲੇ ਅਸਲ ਮਨੁੱਖਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਮਨੁੱਖੀ ਸਮਝਿਆ ਜਾਣਾ ਬਿਲਕੁਲ ਵੱਖਰੀ ਗੱਲ ਹੈ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ GPT-4.5, ਘੱਟੋ ਘੱਟ ਸ਼ਖਸੀਅਤ ਦੇ ਦ੍ਰਿਸ਼ ਵਿੱਚ, ਅਜਿਹੇ ਜਵਾਬ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਭਾਗੀਦਾਰਾਂ ਦੀਆਂ ਆਮ ਮਨੁੱਖੀ ਔਨਲਾਈਨ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੀਆਂ ਉਮੀਦਾਂ (ਸ਼ਾਇਦ ਵਧੇਰੇ ਦਿਲਚਸਪ, ਇਕਸਾਰ, ਜਾਂ ਰੂੜ੍ਹੀਵਾਦੀ ਤੌਰ ‘ਤੇ “ਮਨੁੱਖੀ”) ਨਾਲ ਵਧੇਰੇ ਨੇੜਿਓਂ ਮੇਲ ਖਾਂਦੇ ਹਨ, ਅਸਲ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਭਿੰਨ ਜਾਂ ਘੱਟ ਭਵਿੱਖਬਾਣੀਯੋਗ, ਅਸਲ ਮਨੁੱਖੀ ਹਮਰੁਤਬਾ ਦੇ ਜਵਾਬਾਂ ਨਾਲੋਂ।
Turing ਤੋਂ ਪਰੇ: ਹਾਈਪਰ-ਯਥਾਰਥਵਾਦੀ AI ਨਕਲ ਦੇ ਪ੍ਰਭਾਵ
ਜਦੋਂ ਕਿ ਖੋਜਕਰਤਾ ਸਵੀਕਾਰ ਕਰਦੇ ਹਨ ਕਿ Turing Test ਖੁਦ, ਇਸਦੇ ਅਸਲ ਫਾਰਮੂਲੇਸ਼ਨ ਵਿੱਚ ਅਤੇ ਸ਼ਾਇਦ ਇਸ ਸੋਧੇ ਹੋਏ ਰੂਪ ਵਿੱਚ ਵੀ, ਸੱਚੀ ਮਸ਼ੀਨ ਬੁੱਧੀ ਜਾਂ ਸਮਝ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਪੁਰਾਣਾ ਮੈਟ੍ਰਿਕ ਹੋ ਸਕਦਾ ਹੈ, ਅਧਿਐਨ ਦੀਆਂ ਖੋਜਾਂ ਮਹੱਤਵਪੂਰਨ ਭਾਰ ਰੱਖਦੀਆਂ ਹਨ। ਉਹ ਇਸ ਗੱਲ ਦਾ ਸਪੱਸ਼ਟ ਸਬੂਤ ਪੇਸ਼ ਕਰਦੇ ਹਨ ਕਿ AI ਸਿਸਟਮ, ਖਾਸ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਟੈਕਸਟ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ‘ਤੇ ਬਣੇ, ਨਕਲ ਦੀ ਕਲਾ ਵਿੱਚ ਮੁਹਾਰਤ ਹਾਸਲ ਕਰਨ ਵਿੱਚ ਕਿੰਨੀ ਦੂਰ ਤਰੱਕੀ ਕਰ ਚੁੱਕੇ ਹਨ।
ਨਤੀਜੇ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ ਇਹ ਸਿਸਟਮ ਗੱਲਬਾਤ ਵਾਲਾ ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਸਿਰਫ਼ ਵਿਆਕਰਨਿਕ ਤੌਰ ‘ਤੇ ਸਹੀ ਜਾਂ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਢੁਕਵਾਂ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਧਾਰਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਆਉਟਪੁੱਟ ਤੋਂ ਵੱਖਰਾ ਨਹੀਂ ਹੈ, ਘੱਟੋ ਘੱਟ ਛੋਟੇ, ਟੈਕਸਟ-ਅਧਾਰਤ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਦੀਆਂ ਰੁਕਾਵਟਾਂ ਦੇ ਅੰਦਰ। ਭਾਵੇਂ ਅੰਤਰੀਵ AI ਕੋਲ ਅਸਲ ਸਮਝ, ਚੇਤਨਾ, ਜਾਂ ਵਿਅਕਤੀਗਤ ਅਨੁਭਵ ਨਹੀਂ ਹਨ ਜੋ ਮਨੁੱਖੀ ਸੰਚਾਰ ਨੂੰ ਸੂਚਿਤ ਕਰਦੇ ਹਨ, ਇਸਦੀ ਭਰੋਸੇਯੋਗ, ਦਿਲਚਸਪ, ਅਤੇ ਚਰਿੱਤਰ-ਅਨੁਕੂਲ ਜਵਾਬਾਂ ਨੂੰ ਸੰਸ਼ਲੇਸ਼ਣ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਤੇਜ਼ੀ ਨਾਲ ਸੁਧਰ ਰਹੀ ਹੈ। ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਮਝ ਦਾ ਇੱਕ ਨਕਾਬ ਬਣਾ ਸਕਦਾ ਹੈ ਜੋ ਜ਼ਿਆਦਾਤਰ ਸਮੇਂ ਮਨੁੱਖੀ ਜੱਜਾਂ ਨੂੰ ਮੂਰਖ ਬਣਾਉਣ ਲਈ ਕਾਫ਼ੀ ਭਰੋਸੇਮੰਦ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਇੱਕ ਸੰਬੰਧਿਤ ਸ਼ਖਸੀਅਤ ਨੂੰ ਅਪਣਾਉਂਦੇ ਹੋਏ।
ਇਸ ਸਮਰੱਥਾ ਦੇ ਡੂੰਘੇ ਪ੍ਰਭਾਵ ਹਨ, ਜੋ Turing Test ਦੀ ਅਕਾਦਮਿਕ ਉਤਸੁਕਤਾ ਤੋਂ ਬਹੁਤ ਪਰੇ ਹਨ। Cameron Jones ਇਸ ਉੱਨਤ ਨਕਲ ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਕਈ ਸੰਭਾਵੀ ਸਮਾਜਿਕ ਤਬਦੀਲੀਆਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ:
- ਨੌਕਰੀ ਆਟੋਮੇਸ਼ਨ: AI ਦੀ ਥੋੜ੍ਹੇ ਸਮੇਂ ਦੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਵਿੱਚ ਮਨੁੱਖਾਂ ਨੂੰ ਸਹਿਜੇ ਹੀ ਬਦਲਣ ਦੀ ਯੋਗਤਾ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਬਿਨਾਂ ਖੋਜ ਦੇ, ਟੈਕਸਟ-ਅਧਾਰਤ ਸੰਚਾਰ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਭੂਮਿਕਾਵਾਂ ਵਿੱਚ ਆਟੋਮੇਸ਼ਨ ਲਈ ਦਰਵਾਜ਼ਾ ਹੋਰ ਚੌੜਾ ਕਰਦੀ ਹੈ। ਗਾਹਕ ਸੇਵਾ ਚੈਟ, ਸਮੱਗਰੀ ਉਤਪਾਦਨ, ਡੇਟਾ ਐਂਟਰੀ, ਸ਼ਡਿਊਲਿੰਗ, ਅਤੇ ਡਿਜੀਟਲ ਸਹਾਇਤਾ ਦੇ ਵੱਖ-ਵੱਖ ਰੂਪਾਂ ਵਿੱਚ AI ਨੂੰ ਅਪਣਾਉਣ ਵਿੱਚ ਵਾਧਾ ਦੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੇਕਰ AI ਕਾਫ਼ੀ ਭਰੋਸੇਮੰਦ ਅਤੇ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਾਬਤ ਹੁੰਦਾ ਹੈ ਤਾਂ ਮਨੁੱਖੀ ਕਰਮਚਾਰੀਆਂ ਨੂੰ ਵਿਸਥਾਪਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਅਧਿਐਨ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ “ਭਰੋਸੇਯੋਗ” ਥ੍ਰੈਸ਼ਹੋਲਡ ਨੂੰ ਪੂਰਾ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ ਜਾਂ ਪਾਰ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ।
- ਵਧੀ ਹੋਈ ਸੋਸ਼ਲ ਇੰਜੀਨੀਅਰਿੰਗ: ਦੁਰਵਰਤੋਂ ਦੀ ਸੰਭਾਵਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਖਤਰਨਾਕ ਅਦਾਕਾਰ ਆਧੁਨਿਕ ਫਿਸ਼ਿੰਗ ਘੁਟਾਲਿਆਂ, ਗਲਤ ਜਾਣਕਾਰੀ ਫੈਲਾਉਣ, ਜਨਤਕ ਰਾਏ ਨੂੰ ਹੇਰਾਫੇਰੀ ਕਰਨ, ਜਾਂ ਧੋਖਾਧੜੀ ਦੇ ਉਦੇਸ਼ਾਂ ਲਈ ਵਿਅਕਤੀਆਂ ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਹਾਈਪਰ-ਯਥਾਰਥਵਾਦੀ AI ਚੈਟਬੋਟਸ ਦਾ ਲਾਭ ਉਠਾ ਸਕਦੇ ਹਨ। ਇੱਕ AI ਜਿਸਨੂੰ ਅਸਲ ਮਨੁੱਖਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਵਾਰ ਮਨੁੱਖੀ ਸਮਝਿਆ ਜਾਂਦਾ ਹੈ, ਧੋਖੇ ਲਈ ਇੱਕ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੌਰ ‘ਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਾਧਨ ਹੋ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਿਅਕਤੀਆਂ ਲਈ ਔਨਲਾਈਨ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ‘ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਔਖਾ ਹੋ ਜਾਂਦਾ ਹੈ। “ਸ਼ਖਸੀਅਤ” ਰਣਨੀਤੀ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਇੱਥੇ ਖਾਸ ਤੌਰ ‘ਤੇ ਚਿੰਤਾਜਨਕ ਹੈ, ਕਿਉਂਕਿ AI ਨੂੰ ਖਾਸ ਕਿਸਮ ਦੇ ਭਰੋਸੇਯੋਗ ਵਿਅਕਤੀਆਂ ਜਾਂ ਅਧਿਕਾਰਤ ਸ਼ਖਸੀਅਤਾਂ ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
- ਆਮ ਸਮਾਜਿਕ ਉਥਲ-ਪੁਥਲ: ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੋਂ ਪਰੇ, ਅਣਪਛਾਤੇ ਮਨੁੱਖੀ ਨਕਲ ਦੇ ਸਮਰੱਥ AI ਦੀ ਵਿਆਪਕ ਤੈਨਾਤੀ ਸਮਾਜਿਕ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਬਦਲ ਸਕਦੀ ਹੈ। ਅਸੀਂ ਔਨਲਾਈਨ ਵਾਤਾਵਰਣ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਕਿਵੇਂ ਸਥਾਪਿਤ ਕਰਦੇ ਹਾਂ? ਮਨੁੱਖੀ ਸੰਪਰਕ ਦੀ ਪ੍ਰਕਿਰਤੀ ਦਾ ਕੀ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਨਕਲੀ ਵਾਰਤਾਲਾਪ ਕਰਨ ਵਾਲਿਆਂ ਦੁਆਰਾ ਵਿਚੋਲਗੀ ਕੀਤੀ ਜਾਂਦੀ ਹੈ? ਕੀ ਇਹ ਵਧੇ ਹੋਏ ਇਕੱਲਤਾ, ਜਾਂ ਵਿਰੋਧਾਭਾਸੀ ਤੌਰ ‘ਤੇ, AI-ਮਨੁੱਖੀ ਸਾਥੀ ਦੇ ਨਵੇਂ ਰੂਪਾਂ ਵੱਲ ਲੈ ਜਾ ਸਕ