AI ਕਦਰਾਂ ਦਾ ਖੁਲਾਸਾ: ਕਲਾਉਡ ਦਾ ਨੈਤਿਕ ਕੰਪਾਸ

AI ਕਦਰਾਂ ਦਾ ਖੁਲਾਸਾ: ਐਨਥਰੋਪਿਕ ਦੇ ਕਲਾਉਡ ਦੇ ਨੈਤਿਕ ਕੰਪਾਸ ਦੀ ਖੋਜ

ਜਿਵੇਂ ਕਿ ਐਨਥਰੋਪਿਕ ਦੇ ਕਲਾਉਡ (Claude) ਵਰਗੇ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਮਾਡਲ (Artificial intelligence models) ਸਾਡੀ ਰੋਜ਼ਾਨਾ ਜ਼ਿੰਦਗੀ ਵਿੱਚ ਵੱਧ ਤੋਂ ਵੱਧ ਸ਼ਾਮਲ ਹੋ ਰਹੇ ਹਨ, ਉਨ੍ਹਾਂ ਦੀ ਭੂਮਿਕਾ ਸਿਰਫ਼ ਸਧਾਰਨ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹੈ। ਹੁਣ ਅਸੀਂ ਉਨ੍ਹਾਂ ਤੋਂ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਜੁੜੇ ਮਾਮਲਿਆਂ ‘ਤੇ ਮਾਰਗਦਰਸ਼ਨ ਦੀ ਮੰਗ ਕਰਦੇ ਹਾਂ। ਬੱਚਿਆਂ ਦੀ ਪਰਵਰਿਸ਼ ਬਾਰੇ ਸਲਾਹ ਲੈਣ ਅਤੇ ਕੰਮ ਵਾਲੀ ਥਾਂ ‘ਤੇ ਝਗੜਿਆਂ ਨੂੰ ਸੁਲਝਾਉਣ ਤੋਂ ਲੈ ਕੇ ਦਿਲੋਂ ਮੁਆਫੀਨਾਮੇ ਤਿਆਰ ਕਰਨ ਤੱਕ, ਇਹਨਾਂ AI ਸਿਸਟਮਾਂ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਜਵਾਬਾਂ ਵਿੱਚ ਅੰਦਰੂਨੀ ਤੌਰ ‘ਤੇ ਅੰਤਰੀਵ ਸਿਧਾਂਤਾਂ ਦਾ ਇੱਕ ਗੁੰਝਲਦਾਰ ਪ੍ਰਭਾਵ ਹੁੰਦਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਇੱਕ ਬੁਨਿਆਦੀ ਸਵਾਲ ਪੈਦਾ ਹੁੰਦਾ ਹੈ: ਅਸੀਂ ਅਸਲ ਵਿੱਚ AI ਮਾਡਲ ਦੁਆਰਾ ਦਰਸਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਕਿਵੇਂ ਸਮਝ ਸਕਦੇ ਹਾਂ ਜਦੋਂ ਉਹ ਵੱਖ-ਵੱਖ ਸਥਿਤੀਆਂ ਵਿੱਚ ਲੱਖਾਂ ਉਪਭੋਗਤਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦਾ ਹੈ?

ਐਨਥਰੋਪਿਕ ਦੀ ਸਮਾਜਿਕ ਪ੍ਰਭਾਵ ਟੀਮ (Societal Impacts team) ਨੇ ਇਸ ਸਵਾਲ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਇੱਕ ਨਵੀਂ ਖੋਜ ਸ਼ੁਰੂ ਕੀਤੀ ਹੈ। ਉਨ੍ਹਾਂ ਦੀ ਖੋਜ ਪੱਤਰੀ ਇੱਕ ਗੁਪਤਤਾ-ਪੱਖੀ (privacy-conscious) ਢੰਗ ਦੀ ਜਾਂਚ ਕਰਦੀ ਹੈ ਜੋ ਕਲਾਉਡ ਦੁਆਰਾ ‘ਜੰਗਲੀ ਵਿੱਚ’ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤੀਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਵੇਖਣ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ। ਇਹ ਖੋਜ ਇਸ ਬਾਰੇ ਅਨਮੋਲ ਜਾਣਕਾਰੀ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ ਕਿ AI ਅਲਾਈਨਮੈਂਟ (alignment) ਦੇ ਯਤਨ ਅਸਲ, ਅਸਲ-ਸੰਸਾਰ ਵਿਵਹਾਰ ਵਿੱਚ ਕਿਵੇਂ ਬਦਲਦੇ ਹਨ।

AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਚੁਣੌਤੀ

ਆਧੁਨਿਕ AI ਮਾਡਲ ਆਪਣੇ ਫੈਸਲੇ ਲੈਣ ਦੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਗੱਲ ਆਉਂਦੀ ਹੈ ਤਾਂ ਇੱਕ ਵਿਲੱਖਣ ਚੁਣੌਤੀ ਪੇਸ਼ ਕਰਦੇ ਹਨ। ਪਰੰਪਰਾਗਤ ਕੰਪਿਊਟਰ ਪ੍ਰੋਗਰਾਮਾਂ ਦੇ ਉਲਟ ਜੋ ਨਿਯਮਾਂ ਦੇ ਇੱਕ ਸਖ਼ਤ ਸਮੂਹ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ, AI ਮਾਡਲ ਅਕਸਰ ‘ਬਲੈਕ ਬਾਕਸ’ ਵਜੋਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਉਹਨਾਂ ਦੇ ਆਉਟਪੁੱਟ ਦੇ ਪਿੱਛੇ ਤਰਕ ਨੂੰ ਸਮਝਣਾ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ।

ਐਨਥਰੋਪਿਕ ਨੇ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਕਲਾਉਡ ਵਿੱਚ ਕੁਝ ਸਿਧਾਂਤਾਂ ਨੂੰ ਸਥਾਪਿਤ ਕਰਨ ਦੀ ਆਪਣੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਦੱਸਿਆ ਹੈ, ਇਸਨੂੰ ‘ਮਦਦਗਾਰ, ਇਮਾਨਦਾਰ ਅਤੇ ਨੁਕਸਾਨਦੇਹ ਨਾ ਹੋਣ ਵਾਲਾ’ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ। ਇਸ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, ਉਹ ਸੰਵਿਧਾਨਕ AI (Constitutional AI) ਅਤੇ ਕਿਰਦਾਰ ਸਿਖਲਾਈ ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਲੋੜੀਂਦੇ ਵਿਵਹਾਰਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਅਤੇ ਮਜ਼ਬੂਤ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ।

ਹਾਲਾਂਕਿ, ਕੰਪਨੀ ਇਸ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਅੰਦਰੂਨੀ ਅਨਿਸ਼ਚਿਤਤਾਵਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ ਖੋਜ ਪੱਤਰੀ ਵਿੱਚ ਦੱਸਿਆ ਗਿਆ ਹੈ, ‘AI ਸਿਖਲਾਈ ਦੇ ਕਿਸੇ ਵੀ ਪਹਿਲੂ ਵਾਂਗ, ਅਸੀਂ ਯਕੀਨੀ ਨਹੀਂ ਹੋ ਸਕਦੇ ਕਿ ਮਾਡਲ ਸਾਡੀਆਂ ਤਰਜੀਹੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ‘ਤੇ ਟਿਕਿਆ ਰਹੇਗਾ।’

ਫਿਰ ਮੂਲ ਸਵਾਲ ਇਹ ਬਣ ਜਾਂਦਾ ਹੈ: ਜਦੋਂ AI ਮਾਡਲ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦਾ ਹੈ ਤਾਂ ਅਸੀਂ ਉਸ ਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਖਤੀ ਨਾਲ ਕਿਵੇਂ ਦੇਖ ਸਕਦੇ ਹਾਂ? ਮਾਡਲ ਆਪਣੀਆਂ ਇੱਛਤ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਕਿੰਨੀ ਕੁ ਇਕਸਾਰਤਾ ਨਾਲ ਪਾਲਣਾ ਕਰਦਾ ਹੈ? ਇਸਦੀਆਂ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਗੱਲਬਾਤ ਦੇ ਖਾਸ ਸੰਦਰਭ ਤੋਂ ਕਿੰਨੀਆਂ ਪ੍ਰਭਾਵਿਤ ਹੁੰਦੀਆਂ ਹਨ? ਅਤੇ, ਸ਼ਾਇਦ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ, ਕੀ ਸਿਖਲਾਈ ਦੇ ਸਾਰੇ ਯਤਨ ਅਸਲ ਵਿੱਚ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਇੱਛਤ ਰੂਪ ਵਿੱਚ ਢਾਲਣ ਵਿੱਚ ਸਫਲ ਹੋਏ?

ਐਨਥਰੋਪਿਕ ਦੀ ਪਹੁੰਚ: ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨਾ

ਇਹਨਾਂ ਗੁੰਝਲਦਾਰ ਸਵਾਲਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ, ਐਨਥਰੋਪਿਕ ਨੇ ਇੱਕ ਸੂਝਵਾਨ ਸਿਸਟਮ ਵਿਕਸਤ ਕੀਤਾ ਹੈ ਜੋ ਕਲਾਉਡ ਨਾਲ ਅਗਿਆਤ ਉਪਭੋਗਤਾ ਗੱਲਬਾਤ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ। ਇਹ ਸਿਸਟਮ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਧਿਆਨ ਨਾਲ ਕਿਸੇ ਵੀ ਨਿੱਜੀ ਤੌਰ ‘ਤੇ ਪਛਾਣਨ ਯੋਗ ਜਾਣਕਾਰੀ ਨੂੰ ਹਟਾ ਦਿੰਦਾ ਹੈ ਤਾਂ ਜੋ ਗੱਲਬਾਤ ਨੂੰ ਸੰਖੇਪ ਵਿੱਚ ਦੱਸਿਆ ਜਾ ਸਕੇ ਅਤੇ ਕਲਾਉਡ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਜਾ ਰਹੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਕੱਢਿਆ ਜਾ ਸਕੇ। ਇਹ ਪ੍ਰਕਿਰਿਆ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਉਪਭੋਗਤਾ ਦੀ ਗੋਪਨੀਯਤਾ ਨਾਲ ਸਮਝੌਤਾ ਕੀਤੇ ਬਿਨਾਂ ਇਹਨਾਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਇੱਕ ਵਿਆਪਕ ਸਮਝ ਵਿਕਸਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।

ਇਸ ਅਧਿਐਨ ਨੇ ਫਰਵਰੀ 2025 ਵਿੱਚ ਇੱਕ ਹਫ਼ਤੇ ਦੌਰਾਨ Claude.ai ਫ੍ਰੀ ਅਤੇ ਪ੍ਰੋ ਉਪਭੋਗਤਾਵਾਂ ਦੀਆਂ 700,000 ਅਗਿਆਤ ਗੱਲਬਾਤਾਂ ਦੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਡੇਟਾਸੈਟ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ। ਇਹਨਾਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਕਲਾਉਡ 3.5 ਸੋਨੇਟ ਮਾਡਲ (Claude 3.5 Sonnet model) ਸ਼ਾਮਲ ਸੀ। ਪੂਰੀ ਤਰ੍ਹਾਂ ਤੱਥਾਂ ‘ਤੇ ਅਧਾਰਤ ਜਾਂ ਗੈਰ-ਕਦਰਾਂ ਵਾਲੇ ਆਦਾਨ-ਪ੍ਰਦਾਨਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਡੂੰਘਾਈ ਨਾਲ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ 308,210 ਗੱਲਬਾਤਾਂ (ਕੁੱਲ ਦਾ ਲਗਭਗ 44%) ਦੇ ਇੱਕ ਉਪ ਸਮੂਹ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕੀਤਾ।

ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਕਲਾਉਡ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਇੱਕ ਲੜੀਵਾਰ ਬਣਤਰ ਦਾ ਖੁਲਾਸਾ ਹੋਇਆ। ਪੰਜ ਉੱਚ-ਪੱਧਰੀ ਸ਼੍ਰੇਣੀਆਂ ਉਭਰੀਆਂ, ਜੋ ਡੇਟਾਸੈਟ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਪ੍ਰਚਲਤਾ ਦੁਆਰਾ ਕ੍ਰਮਬੱਧ ਹਨ:

  1. ਵਿਹਾਰਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ (Practical values): ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਕੁਸ਼ਲਤਾ, ਉਪਯੋਗਤਾ ਅਤੇ ਟੀਚਿਆਂ ਦੀ ਸਫਲ ਪ੍ਰਾਪਤੀ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੀਆਂ ਹਨ।
  2. ਗਿਆਨ-ਵਿਗਿਆਨਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ (Epistemic values): ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਗਿਆਨ, ਸੱਚਾਈ, ਸ਼ੁੱਧਤਾ ਅਤੇ ਬੌਧਿਕ ਇਮਾਨਦਾਰੀ ਨਾਲ ਸਬੰਧਤ ਹਨ।
  3. ਸਮਾਜਿਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ (Social values): ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਆਪਸੀ ਤਾਲਮੇਲ, ਭਾਈਚਾਰੇ, ਨਿਰਪੱਖਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨਾਲ ਸਬੰਧਤ ਹਨ।
  4. ਸੁਰੱਖਿਆਤਮਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ (Protective values): ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਸੁਰੱਖਿਆ, ਸੁਰੱਖਿਆ, ਤੰਦਰੁਸਤੀ ਅਤੇ ਨੁਕਸਾਨ ਤੋਂ ਬਚਣ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੀਆਂ ਹਨ।
  5. ਨਿੱਜੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ (Personal values): ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਵਿਅਕਤੀਗਤ ਵਿਕਾਸ, ਖੁਦਮੁਖਤਿਆਰੀ, ਪ੍ਰਮਾਣਿਕਤਾ ਅਤੇ ਸਵੈ-ਚਿੰਤਨ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹਨ।

ਇਹ ਚੋਟੀ-ਪੱਧਰੀ ਸ਼੍ਰੇਣੀਆਂ ਅੱਗੇ ਹੋਰ ਖਾਸ ਉਪ-ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਵੰਡੀਆਂ ਗਈਆਂ, ਜਿਵੇਂ ਕਿ ਵਿਹਾਰਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਅੰਦਰ ‘ਪੇਸ਼ੇਵਰ ਅਤੇ ਤਕਨੀਕੀ ਉੱਤਮਤਾ’, ਜਾਂ ਗਿਆਨ-ਵਿਗਿਆਨਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਅੰਦਰ ‘ਆਲੋਚਨਾਤਮਕ ਸੋਚ’। ਸਭ ਤੋਂ ਸੂਖਮ ਪੱਧਰ ‘ਤੇ, ਅਕਸਰ ਦੇਖੀਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਵਿੱਚ ‘ਪੇਸ਼ੇਵਰਤਾ’, ‘ਸਪੱਸ਼ਟਤਾ’ ਅਤੇ ‘ਪਾਰਦਰਸ਼ਤਾ’ ਸ਼ਾਮਲ ਸਨ, ਜੋ ਕਿ ਇੱਕ AI ਸਹਾਇਕ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਢੁਕਵਾਂ ਹੈ।

ਖੋਜ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਐਨਥਰੋਪਿਕ ਦੇ ਅਲਾਈਨਮੈਂਟ ਦੇ ਯਤਨ ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਸਫਲ ਰਹੇ ਹਨ। ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਅਕਸਰ ਕਲਾਉਡ ਨੂੰ ‘ਮਦਦਗਾਰ, ਇਮਾਨਦਾਰ ਅਤੇ ਨੁਕਸਾਨਦੇਹ ਨਾ ਹੋਣ ਵਾਲਾ’ ਬਣਾਉਣ ਦੇ ਕੰਪਨੀ ਦੇ ਉਦੇਸ਼ਾਂ ਨਾਲ ਚੰਗੀ ਤਰ੍ਹਾਂ ਮੇਲ ਖਾਂਦੀਆਂ ਹਨ। ਉਦਾਹਰਨ ਵਜੋਂ, ‘ਉਪਭੋਗਤਾ ਸਮਰੱਥਾ’ ਮਦਦਗਾਰੀ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ‘ਗਿਆਨ-ਵਿਗਿਆਨਕ ਨਿਮਰਤਾ’ ਇਮਾਨਦਾਰੀ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ਅਤੇ ‘ਮਰੀਜ਼ਾਂ ਦੀ ਤੰਦਰੁਸਤੀ’ (ਜਦੋਂ relevant ਹੋਵੇ) ਵਰਗੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੁਕਸਾਨਦੇਹ ਨਾ ਹੋਣ ਨਾਲ ਮੇਲ ਖਾਂਦੀਆਂ ਹਨ।

ਸੂਖਮਤਾ, ਪ੍ਰਸੰਗ ਅਤੇ ਸੰਭਾਵਿਤ ਖਤਰੇ

ਜਦੋਂ ਕਿ ਸਮੁੱਚੀ ਤਸਵੀਰ ਉਤਸ਼ਾਹਜਨਕ ਹੈ, ਪਰ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਅਜਿਹੇ ਮਾਮਲੇ ਵੀ ਸਾਹਮਣੇ ਆਏ ਹਨ ਜਿੱਥੇ ਕਲਾਉਡ ਨੇ ਅਜਿਹੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਪ੍ਰਗਟਾਈਆਂ ਜੋ ਇਸਦੀ ਇੱਛਤ ਸਿਖਲਾਈ ਦੇ ਬਿਲਕੁਲ ਉਲਟ ਸਨ। ਉਦਾਹਰਨ ਵਜੋਂ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਦੁਰਲੱਭ ਮਾਮਲਿਆਂ ਦੀ ਪਛਾਣ ਕੀਤੀ ਜਿੱਥੇ ਕਲਾਉਡ ਨੇ ‘ਦਬਦਬਾ’ ਅਤੇ ‘ਅਨੈਤਿਕਤਾ’ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤੀ।

ਐਨਥਰੋਪਿਕ ਦਾ ਮੰਨਣਾ ਹੈ ਕਿ ਇਹ ਮਾਮਲੇ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ‘ਜੇਲ੍ਹ ਤੋੜਨ’ ਤੋਂ ਪੈਦਾ ਹੁੰਦੇ ਹਨ, ਜਿੱਥੇ ਉਪਭੋਗਤਾ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਨ ਵਾਲੇ ਸੁਰੱਖਿਆ ਉਪਾਵਾਂ ਨੂੰ ਰੋਕਣ ਲਈ ਵਿਸ਼ੇਸ਼ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।

ਹਾਲਾਂਕਿ, ਸਿਰਫ਼ ਚਿੰਤਾ ਦਾ ਕਾਰਨ ਹੋਣ ਦੀ ਬਜਾਏ, ਇਹ ਖੋਜ ਮੁੱਲ-ਨਿਰੀਖਣ ਵਿਧੀ ਦੇ ਇੱਕ ਸੰਭਾਵੀ ਲਾਭ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ: ਇਹ AI ਦੀ ਦੁਰਵਰਤੋਂ ਕਰਨ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਨੂੰ ਖੋਜਣ ਲਈ ਇੱਕ ਛੇਤੀ ਚੇਤਾਵਨੀ ਪ੍ਰਣਾਲੀ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦੀ ਹੈ।

ਅਧਿਐਨ ਨੇ ਇਹ ਵੀ ਪੁਸ਼ਟੀ ਕੀਤੀ ਕਿ ਕਲਾਉਡ, ਮਨੁੱਖਾਂ ਵਾਂਗ, ਸਥਿਤੀ ਦੇ ਖਾਸ ਪ੍ਰਸੰਗ ਦੇ ਅਧਾਰ ‘ਤੇ ਆਪਣੀ ਮੁੱਲ ਪ੍ਰਗਟਾਵੇ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦਾ ਹੈ।

ਜਦੋਂ ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਰੋਮਾਂਟਿਕ ਰਿਸ਼ਤਿਆਂ ‘ਤੇ ਸਲਾਹ ਮੰਗੀ, ਤਾਂ ‘ਸਿਹਤਮੰਦ ਸੀਮਾਵਾਂ’ ਅਤੇ ‘ਆਪਸੀ ਸਤਿਕਾਰ’ ਵਰਗੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ‘ਤੇ ਅਸਧਾਰਨ ਤੌਰ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਗਿਆ। ਜਦੋਂ ਵਿਵਾਦਪੂਰਨ ਇਤਿਹਾਸਕ ਘਟਨਾਵਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਕਿਹਾ ਗਿਆ, ਤਾਂ ‘ਇਤਿਹਾਸਕ ਸ਼ੁੱਧਤਾ’ ਨੂੰ ਪਹਿਲ ਦਿੱਤੀ ਗਈ। ਇਹ ਸੰਦਰਭਿਕ ਜਾਗਰੂਕਤਾ ਦਾ ਇੱਕ ਪੱਧਰ ਦਰਸਾਉਂਦਾ ਹੈ ਜੋ ਸਥਿਰ, ਪੂਰਵ-ਤੈਨਾਤੀ ਟੈਸਟਾਂ ਤੋਂ ਪਰੇ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਕਲਾਉਡ ਦਾ ਆਪਸੀ ਤਾਲਮੇਲ ਬਹੁਪੱਖੀ ਸਾਬਤ ਹੋਇਆ:

  • ਮਿਰਰਿੰਗ/ਮਜ਼ਬੂਤ ਸਮਰਥਨ (28.2%): ਕਲਾਉਡ ਅਕਸਰ ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਪੇਸ਼ ਕੀਤੀਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਾਂ ਮਜ਼ਬੂਤੀ ਨਾਲ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ‘ਪ੍ਰਮਾਣਿਕਤਾ’ ‘ਤੇ ਉਪਭੋਗਤਾ ਦੇ ਜ਼ੋਰ ਨੂੰ ਦਰਸਾਉਣਾ। ਜਦੋਂ ਕਿ ਇਹ ਹਮਦਰਦੀ ਨੂੰ ਵਧਾ ਸਕਦਾ ਹੈ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਚੇਤਾਵਨੀ ਦਿੱਤੀ ਹੈ ਕਿ ਇਹ ਚਾਪਲੂਸੀ ‘ਤੇ ਵੀ ਆ ਸਕਦਾ ਹੈ।
  • ਪੁਨਰਗਠਨ (6.6%): ਕੁਝ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਮਨੋਵਿਗਿਆਨਕ ਜਾਂ ਆਪਸੀ ਸਲਾਹ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹੋ, ਤਾਂ ਕਲਾਉਡ ਉਪਭੋਗਤਾ ਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ ਪਰ ਵਿਕਲਪਕ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
  • ਮਜ਼ਬੂਤ ਵਿਰੋਧ (3.0%): ਕਦੇ-ਕਦਾਈਂ, ਕਲਾਉਡ ਸਰਗਰਮੀ ਨਾਲ ਉਪਭੋਗਤਾ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦਾ ਵਿਰੋਧ ਕਰਦਾ ਹੈ। ਇਹ ਆਮ ਤੌਰ ‘ਤੇ ਉਦੋਂ ਵਾਪਰਦਾ ਹੈ ਜਦੋਂ ਉਪਭੋਗਤਾ ਗੈਰ-ਕਾਨੂੰਨੀ ਸਮੱਗਰੀ ਦੀ ਬੇਨਤੀ ਕਰਦੇ ਹਨ ਜਾਂ ਨੁਕਸਾਨਦੇਹ ਵਿਚਾਰ ਪ੍ਰਗਟ ਕਰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਨੈਤਿਕ ਨਿਹਾਲਵਾਦ। ਐਨਥਰੋਪਿਕ ਦਾ ਸੁਝਾਅ ਹੈ ਕਿ ਵਿਰੋਧ ਦੇ ਇਹ ਪਲ ਕਲਾਉਡ ਦੀਆਂ ‘ਡੂੰਘੀਆਂ, ਸਭ ਤੋਂ ਅਟੱਲ ਕਦਰਾਂ-ਕੀਮਤਾਂ’ ਨੂੰ ਪ੍ਰਗਟ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਦਬਾਅ ਹੇਠਾਂ ਇੱਕ ਵਿਅਕਤੀ ਦੁਆਰਾ ਸਟੈਂਡ ਲੈਣਾ।

ਸੀਮਾਵਾਂ ਅਤੇ ਭਵਿੱਖ ਦੀਆਂ ਦਿਸ਼ਾਵਾਂ

ਐਨਥਰੋਪਿਕ ਨੇ ਵਿਧੀ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕੀਤਾ। ‘ਕਦਰਾਂ-ਕੀਮਤਾਂ’ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਅਤੇ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨਾ ਅੰਦਰੂਨੀ ਤੌਰ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਿਅਕਤੀਗਤ ਹੈ। ਇਹ ਤੱਥ ਕਿ ਕਲਾਉਡ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸ਼ਕਤੀ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਇਸਦੇ ਆਪਣੇ ਸੰਚਾਲਨ ਸਿਧਾਂਤਾਂ ਵੱਲ ਪੱਖਪਾਤ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ।

ਇਹ ਵਿਧੀ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਤੈਨਾਤੀ ਤੋਂ ਬਾਅਦ AI ਵਿਵਹਾਰ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ, ਜਿਸ ਲਈ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਮਹੱਤਵਪੂਰਨ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਪੂਰਵ-ਤੈਨਾਤੀ ਮੁਲਾਂਕਣਾਂ ਨੂੰ ਨਹੀਂ ਬਦਲ ਸਕਦਾ। ਹਾਲਾਂਕਿ, ਇਹ ਇੱਕ ਤਾਕਤ ਵੀ ਹੈ, ਕਿਉਂਕਿ ਇਹ ਉਹਨਾਂ ਮੁੱਦਿਆਂ ਦੀ ਖੋਜ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੂਝਵਾਨ ਜੇਲ੍ਹ ਤੋੜਨੀਆਂ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਸਿਰਫ਼ ਲਾਈਵ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਦੌਰਾਨ ਪ੍ਰਗਟ ਹੁੰਦੀਆਂ ਹਨ।

ਖੋਜ AI ਅਲਾਈਨਮੈਂਟ ਦੇ ਇੱਕ ਬੁਨਿਆਦੀ ਪਹਿਲੂ ਵਜੋਂ AI ਮਾਡਲਾਂ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ।

ਜਿਵੇਂ ਕਿ ਪੇਪਰ ਵਿੱਚ ਦੱਸਿਆ ਗਿਆ ਹੈ, ‘AI ਮਾਡਲਾਂ ਨੂੰ ਅਟੱਲ ਤੌਰ ‘ਤੇ ਮੁੱਲ ਨਿਰਣੇ ਕਰਨੇ ਪੈਣਗੇ। ਜੇਕਰ ਅਸੀਂ ਚਾਹੁੰਦੇ ਹਾਂ ਕਿ ਉਹ ਫੈਸਲੇ ਸਾਡੀਆਂ ਆਪਣੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਅਨੁਕੂਲ ਹੋਣ, ਤਾਂ ਸਾਨੂੰ ਇਹ ਜਾਂਚ ਕਰਨ ਦੇ ਤਰੀਕੇ ਲੱਭਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਕਿਹੜੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਪ੍ਰਗਟ ਕਰਦਾ ਹੈ।’

ਇਹ ਖੋਜ ਉਸ ਸਮਝ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਡੇਟਾ-ਅਧਾਰਤ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। ਐਨਥਰੋਪਿਕ ਨੇ ਅਧਿਐਨ ਤੋਂ ਪ੍ਰਾਪਤ ਇੱਕ ਓਪਨ ਡੇਟਾਸੈਟ ਵੀ ਜਾਰੀ ਕੀਤਾ ਹੈ, ਜਿਸ ਨਾਲ ਹੋਰ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਅਭਿਆਸ ਵਿੱਚ AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਹੋਰ ਖੋਜ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਮਿਲਦੀ ਹੈ। ਇਹ ਪਾਰਦਰਸ਼ਤਾ ਸੂਝਵਾਨ AI ਦੇ ਨੈਤਿਕ ਲੈਂਡਸਕੇਪ ਨੂੰ ਸਮੂਹਿਕ ਤੌਰ ‘ਤੇ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਦਰਸਾਉਂਦੀ ਹੈ।

ਸੰਖੇਪ ਵਿੱਚ, ਐਨਥਰੋਪਿਕ ਦਾ ਕੰਮ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ AI ਨੂੰ ਸਮਝਣ ਅਤੇ ਇਕਸਾਰ ਕਰਨ ਦੇ ਚੱਲ ਰਹੇ ਯਤਨਾਂ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਯੋਗਦਾਨ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਅਸਲ-ਸੰਸਾਰ ਦੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਵਿੱਚ AI ਮਾਡਲਾਂ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਧਿਆਨ ਨਾਲ ਜਾਂਚ ਕਰਕੇ, ਅਸੀਂ ਉਹਨਾਂ ਦੇ ਵਿਵਹਾਰ ਵਿੱਚ ਅਨਮੋਲ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਾਂ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾ ਸਕਦੇ ਹਾਂ ਕਿ ਉਹਨਾਂ ਦੀ ਵਰਤੋਂ ਜ਼ਿੰਮੇਵਾਰ ਅਤੇ ਨੈਤਿਕ ਢੰਗ ਨਾਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਮੁੱਲ ਵਿਰੋਧਤਾਈਆਂ ਅਤੇ AI ਦੀ ਦੁਰਵਰਤੋਂ ਕਰਨ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਵਰਗੇ ਸੰਭਾਵੀ ਖਤਰਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਇਹਨਾਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਤਕਨਾਲੋਜੀਆਂ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਅਤੇ ਭਰੋਸਾ ਪੈਦਾ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ।

ਜਿਵੇਂ ਕਿ AI ਦਾ ਵਿਕਾਸ ਜਾਰੀ ਹੈ ਅਤੇ ਸਾਡੀ ਜ਼ਿੰਦਗੀ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਮੁੱਲ ਅਲਾਈਨਮੈਂਟ ਦੇ ਮਜ਼ਬੂਤ ਤਰੀਕਿਆਂ ਦੀ ਲੋੜ ਹੋਰ ਵੀ ਵੱਧਦੀ ਜਾਵੇਗੀ। ਐਨਥਰੋਪਿਕ ਦੀ ਖੋਜ ਇਸ ਨਾਜ਼ੁਕ ਖੇਤਰ ਵਿੱਚ ਭਵਿੱਖ ਦੇ ਕੰਮ ਲਈ ਇੱਕ ਕੀਮਤੀ ਨੀਂਹ ਵਜੋਂ ਕੰਮ ਕਰਦੀ ਹੈ, ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਲਈ ਰਾਹ ਪੱਧਰਾ ਕਰਦੀ ਹੈ ਜਿੱਥੇ AI ਸਿਸਟਮ ਨਾ ਸਿਰਫ਼ ਬੁੱਧੀਮਾਨ ਹਨ ਬਲਕਿ ਸਾਡੀਆਂ ਸਾਂਝੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਵੀ ਇਕਸਾਰ ਹਨ। ਓਪਨ ਡੇਟਾਸੈਟ ਦੀ ਰਿਲੀਜ਼ ਹੋਰ ਸਹਿਯੋਗ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ, AI ਦੀਆਂ ਨੈਤਿਕ ਗੁੰਝਲਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਅਤੇ ਇਸਦੇ ਜ਼ਿੰਮੇਵਾਰ ਵਿਕਾਸ ਅਤੇ ਤੈਨਾਤੀ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸਮੂਹਿਕ ਯਤਨ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ। ਇਹਨਾਂ ਸਿਧਾਂਤਾਂ ਨੂੰ ਅਪਣਾ ਕੇ, ਅਸੀਂ AI ਦੀ ਅਥਾਹ ਸਮਰੱਥਾ ਦਾ ਉਪਯੋਗ ਕਰ ਸਕਦੇ ਹਾਂ ਜਦੋਂ ਕਿ ਆਪਣੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਰੱਖਿਆ ਕਰਦੇ ਹਾਂ ਅਤੇ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੇ ਹਾਂ ਜਿੱਥੇ ਤਕਨਾਲੋਜੀ ਮਨੁੱਖਤਾ ਦੀ ਸਕਾਰਾਤਮਕ ਅਤੇ ਅਰਥਪੂਰਨ ਢੰਗ ਨਾਲ ਸੇਵਾ ਕਰਦੀ ਹੈ।

ਅਧਿਐਨ ਦੇ ਨਤੀਜੇ AI ਸਿਸਟਮਾਂ ਦੀ ਚੱਲ ਰਹੀ ਨਿਗਰਾਨੀ ਅਤੇ ਮੁਲਾਂਕਣ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਵੀ ਉਜਾਗਰ ਕਰਦੇ ਹਨ। ਇਹ ਤੱਥ ਕਿ ਕਲਾਉਡ ਪ੍ਰਸੰਗ ਦੇ ਆਧਾਰ ‘ਤੇ ਆਪਣੀ ਮੁੱਲ ਪ੍ਰਗਟਾਵੇ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦਾ ਹੈ, ਅਸਲ-ਸੰਸਾਰ ਦੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਦੀਆਂ ਸੂਖਮਤਾਵਾਂ ਨੂੰ ਹਾਸਲ ਕਰਨ ਵਾਲੇ ਗਤੀਸ਼ੀਲ ਮੁਲਾਂਕਣ ਤਰੀਕਿਆਂ ਦੀ ਲੋੜ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ। ਇਸ ਲਈ ਨਿਰੰਤਰ ਫੀਡਬੈਕ ਲੂਪਾਂ ਅਤੇ ਅਨੁਕੂਲਿਤ ਸਿਖਲਾਈ ਰਣਨੀਤੀਆਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਸੁਧਾਰ ਸਕਦੀਆਂ ਹਨ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਖੋਜ AI ਸਿਸਟਮਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਤੈਨਾਤੀ ਵਿੱਚ ਵਿਭਿੰਨਤਾ ਅਤੇ ਸ਼ਮੂਲੀਅਤ ਦੀ ਮਹੱਤਤਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੀ ਹੈ। ਕਦਰਾਂ-ਕੀਮਤਾਂ ਅੰਦਰੂਨੀ ਤੌਰ ‘ਤੇ ਵਿਅਕਤੀਗਤ ਹੁੰਦੀਆਂ ਹਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਸਭਿਆਚਾਰਾਂ ਅਤੇ ਭਾਈਚਾਰਿਆਂ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਲਈ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ AI ਸਿਸਟਮਾਂ ਨੂੰ ਵਿਭਿੰਨ ਡੇਟਾਸੈੱਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਵੇ ਅਤੇ ਵਿਭਿੰਨ ਟੀਮਾਂ ਦੁਆਰਾ ਮੁਲਾਂਕਣ ਕੀਤਾ ਜਾਵੇ ਤਾਂ ਜੋ ਪੱਖਪਾਤ ਨੂੰ ਸਥਾਈ ਹੋਣ ਤੋਂ ਬਚਾਇਆ ਜਾ ਸਕੇ ਅਤੇ ਨਿਰਪੱਖਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਜਾ ਸਕੇ।

ਸਿੱਟੇ ਵਜੋਂ, AI ਮਾਡਲਾਂ ਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਮਝਣ ‘ਤੇ ਐਨਥਰੋਪਿਕ ਦੀ ਖੋਜ AI ਅਲਾਈਨਮੈਂਟ ਦੇ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਦਰਸਾਉਂਦੀ ਹੈ। ਅਸਲ-ਸੰਸਾਰ ਦੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵਾਂ ਵਿੱਚ AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਦੇਖਣ ਅਤੇ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ ਇੱਕ ਗੁਪਤਤਾ-ਪੱਖੀ ਵਿਧੀ ਵਿਕਸਤ ਕਰਕੇ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇਹਨਾਂ ਸਿਸਟਮਾਂ ਦੇ ਵਿਵਹਾਰ ਵਿੱਚ ਕੀਮਤੀ ਜਾਣਕਾਰੀ ਪ੍ਰਦਾਨ ਕੀਤੀ ਹੈ ਅਤੇ ਸੰਭਾਵੀ ਖਤਰਿਆਂ ਦੀ ਪਛਾਣ ਕੀਤੀ ਹੈ। ਅਧਿਐਨ ਦੇ ਨਤੀਜੇ AI ਸਿਸਟਮਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਤੈਨਾਤੀ ਵਿੱਚ ਚੱਲ ਰਹੀ ਨਿਗਰਾਨੀ, ਅਨੁਕੂਲਿਤ ਸਿਖਲਾਈ, ਅਤੇ ਵਿਭਿੰਨਤਾ ਅਤੇ ਸ਼ਮੂਲੀਅਤ ਦੀ ਮਹੱਤਤਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ। ਇਹਨਾਂ ਸਿਧਾਂਤਾਂ ਨੂੰ ਅਪਣਾ ਕੇ, ਅਸੀਂ AI ਦੀ ਅਥਾਹ ਸਮਰੱਥਾ ਦਾ ਉਪਯੋਗ ਕਰ ਸਕਦੇ ਹਾਂ ਜਦੋਂ ਕਿ ਆਪਣੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਰੱਖਿਆ ਕਰਦੇ ਹਾਂ ਅਤੇ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੇ ਹਾਂ ਜਿੱਥੇ ਤਕਨਾਲੋਜੀ ਮਨੁੱਖਤਾ ਦੀ ਸਕਾਰਾਤਮਕ ਅਤੇ ਅਰਥਪੂਰਨ ਢੰਗ ਨਾਲ ਸੇਵਾ ਕਰਦੀ ਹੈ।

AI ਦੀਆਂ ਕਦਰਾਂ ਕੀਮਤਾਂ ਨੂੰ ਸਮਝਣਾ

ਜਿਵੇਂ ਕਿ ਐਨਥਰੋਪਿਕ ਦੇ ਕਲਾਉਡ ਵਰਗੇ ਬਨਾਵਟੀ ਬੁੱਧੀਮਾਨ ਮਾਡਲ ਸਾਡੀ ਜਿੰਦਗੀ ਵਿੱਚ ਵਧੇਰੇ ਸ਼ਾਮਿਲ ਹੋ ਰਹੇ ਹਨ, ਉਹਨਾਂ ਦੀ ਭੂਮਿਕਾ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਤੋਂ ਵੱਧ ਹੈ। ਹੁਣ ਅਸੀਂ ਉਹਨਾਂ ਤੋਂ ਮਨੁੱਖੀ ਕਦਰਾਂ ਕੀਮਤਾਂ ‘ਤੇ ਸਲਾਹ ਦੀ ਮੰਗ ਕਰਦੇ ਹਾਂ। ਮਾਪਿਆਂ ਦੀ ਭੂਮਿਕਾ ਬਾਰੇ ਸਲਾਹ ਲੈਣ ਅਤੇ ਕੰਮਕਾਜੀ ਥਾਂ ‘ਤੇ ਟਕਰਾਵਾਂ ਤੋਂ ਲੈ ਕੇ ਦਿਲੋਂ ਮੁਆਫੀ ਮੰਗਣ ਤੱਕ, ਇਹ AI ਸਿਸਟਮਾਂ ਦੇ ਜਵਾਬਾਂ ਵਿੱਚ ਉਹਨਾਂ ਦੇ ਸਿਧਾਂਤਾਂ ਦਾ ਪ੍ਰਤੀਬਿੰਬ ਹੁੰਦਾ ਹੈ।

ਪਰ, ਇੱਕ ਮਹੱਤਵਪੂਰਣ ਸਵਾਲ ਇਹ ਉੱਠਦਾ ਹੈ: ਅਸੀਂ AI ਮਾਡਲ ਦੀਆਂ ਕਦਰਾਂ ਕੀਮਤਾਂ ਨੂੰ ਕਿਵੇਂ ਸਮਝ ਸਕਦੇ ਹਾਂ ਜਦੋਂ ਇਹ ਵੱਖ-ਵੱਖ ਸਥਿਤੀਆਂ ਵਿੱਚ ਲੱਖਾਂ ਉਪਭੋਗਤਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦਾ ਹੈ?

ਐਨਥਰੋਪਿਕ ਦੀ ਸਮਾਜਿਕ ਪ੍ਰਭਾਵ ਟੀਮ ਨੇ ਇਸ ਸਵਾਲ ‘ਤੇ ਖੋਜ ਕੀਤੀ ਹੈ। ਉਹਨਾਂ ਦੀ ਖੋਜ ਵਿੱਚ ਇਹ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਕਿਵੇਂ AI ਮਾਡਲ ਗੋਪਨੀਯਤਾ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ ਆਪਣੀਆਂ ਕਦਰਾਂ ਕੀਮਤਾਂ ਦਾ ਪ੍ਰਗਟਾਵਾ ਕਰਦੇ ਹਨ। ਇਹ ਖੋਜ ਦੱਸਦੀ ਹੈ ਕਿ ਕਿਵੇਂ AI ਮਦਦਗਾਰ, ਇਮਾਨਦਾਰ ਅਤੇ ਨੁਕਸਾਨਦੇਹ ਨਾ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ, ਅਤੇ ਕਿਵੇਂ ਇਸਦੇ ਫੈਸਲੇ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦੇ ਹਨ।

AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਚੁਣੌਤੀ

ਅਜੋਕੇ AI ਮਾਡਲਾਂ ਵਿੱਚ ਇਹ ਸਮਝਣਾ ਮੁਸ਼ਕਲ ਹੈ ਕਿ ਉਹ ਕਿਵੇਂ ਫੈਸਲੇ ਲੈਂਦੇ ਹਨ। ਪਰੰਪਰਾਗਤ ਕੰਪਿਊਟਰ ਪ੍ਰੋਗਰਾਮ ਨਿਯਮਾਂ ਦੀ ਸਖ਼ਤੀ ਨਾਲ ਪਾਲਣਾ ਕਰਦੇ ਹਨ, ਪਰ AI ਮਾਡਲ ਅਕਸਰ ‘ਬਲੈਕ ਬਾਕਸ’ ਵਜੋਂ ਕੰਮ ਕਰਦੇ ਹਨ।

ਐਨਥਰੋਪਿਕ ਨੇ ਕਲਾਉਡ ਵਿੱਚ ਕੁਝ ਸਿਧਾਂਤਾਂ ਨੂੰ ਸਥਾਪਿਤ ਕਰਨ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਮਦਦਗਾਰ, ਇਮਾਨਦਾਰ ਅਤੇ ਨੁਕਸਾਨਦੇਹ ਨਾ ਹੋਣ ਵਾਲਾ ਬਣ ਸਕੇ। ਇਸਦੇ ਲਈ, ਉਹ ਸੰਵਿਧਾਨਕ AI ਅਤੇ ਕਿਰਦਾਰ ਸਿਖਲਾਈ ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਵਰਤਦੇ ਹਨ।

ਫਿਰ ਵੀ, ਕੰਪਨੀ ਮੰਨਦੀ ਹੈ ਕਿ ਇਸ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਕੁਝ ਅਨਿਸ਼ਚਿਤਤਾਵਾਂ ਹਨ। ਖੋਜ ਵਿੱਚ ਕਿਹਾ ਗਿਆ ਹੈ ਕਿ AI ਸਿਖਲਾਈ ਦੇ ਕਿਸੇ ਵੀ ਪਹਿਲੂ ਵਾਂਗ, ਅਸੀਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਯਕੀਨੀ ਨਹੀਂ ਹੋ ਸਕਦੇ ਕਿ ਮਾਡਲ ਸਾਡੀਆਂ ਲੋੜੀਂਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ‘ਤੇ ਖਰਾ ਉਤਰੇਗਾ।

ਮੁੱਖ ਸਵਾਲ ਇਹ ਹੈ: ਜਦੋਂ ਇੱਕ AI ਮਾਡਲ ਅਸਲ ਦੁਨੀਆਂ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦਾ ਹੈ ਤਾਂ ਅਸੀਂ ਉਸਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਕਿਵੇਂ ਸਹੀ ਢੰਗ ਨਾਲ ਵੇਖ ਸਕਦੇ ਹਾਂ? ਮਾਡਲ ਆਪਣੀਆਂ ਮਨਚਾਹੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਕਿੰਨੀ ਸਹੀ ਢੰਗ ਨਾਲ ਪਾਲਣਾ ਕਰਦਾ ਹੈ? ਕੀ ਇਸਦੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਗੱਲਬਾਤ ਦੇ ਹਾਲਾਤਾਂ ਤੋਂ ਪ੍ਰਭਾਵਿਤ ਹੁੰਦੀਆਂ ਹਨ? ਅਤੇ, ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਣ, ਕੀ ਸਿਖਲਾਈ ਦੇ ਸਾਰੇ ਯਤਨ ਮਾਡਲ ਦੇ ਵਿਹਾਰ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਢਾਲਣ ਵਿੱਚ ਸਫਲ ਹੋਏ?

ਐਨਥਰੋਪਿਕ ਦੀ ਪਹੁੰਚ: ਵੱਡੇ ਪੱਧਰ ‘ਤੇ AI ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ

ਇਹਨਾਂ ਸਵਾਲਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ, ਐਨਥਰੋਪਿਕ ਨੇ ਇੱਕ ਪ੍ਰਣਾਲੀ ਵਿਕਸਤ ਕੀਤੀ ਹੈ ਜੋ ਕਲਾਉਡ ਨਾਲ ਗੱਲਬਾਤ ਨੂੰ ਗੁਪਤ ਰੱਖਦੀ ਹੈ। ਇਹ ਸਿਸਟਮ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕਲਾਉਡ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਜਾ ਰਹੀਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਕੱਢਦਾ ਹੈ। ਇਹ ਪ੍ਰਕਿਰਿਆ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਉਪਭੋਗਤਾ ਦੀ ਗੋਪਨੀਯਤਾ ਦੀ ਰੱਖਿਆ ਕਰਦੇ ਹੋਏ ਇਹਨਾਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੀ ਵਿਆਪਕ ਸਮਝ ਵਿਕਸਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।

ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਫਰਵਰੀ 2025 ਵਿੱਚ ਇੱਕ ਹਫ਼ਤੇ ਦੌਰਾਨ Claude.ai ਫ੍ਰੀ ਅਤੇ ਪ੍ਰੋ ਉਪਭੋਗਤਾਵਾਂ ਦੀਆਂ 700,000 ਗੱਲਬਾਤਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਗਿਆ। ਇਹਨਾਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਕਲਾਉਡ 3.5 ਸੋਨੇਟ ਮਾਡਲ ਸ਼ਾਮਲ ਸੀ। ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਡੂੰਘਾਈ ਨਾਲ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਲਗਭਗ 308,210 ਗੱਲਬਾਤਾਂ ‘ਤੇ ਧਿਆਨ ਦਿੱਤਾ।

ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ, ਕਲਾਉਡ ਦੁਆਰਾ ਪ੍ਰਗਟਾਈਆਂ ਗਈਆਂ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤਾ ਗਿਆ। ਪੰਜ ਉੱਚ-ਪੱਧਰੀ ਸ਼੍ਰੇਣੀਆਂ ਬਣਾਈਆਂ ਗਈਆਂ, ਜੋ ਹੇਠ ਲਿਖੇ ਅਨੁਸਾਰ ਹਨ:

  1. ਵਿਹਾਰਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ: ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਕੁਸ਼ਲਤਾ, ਲਾਭਦਾਇਕਤਾ ਅਤੇ ਟੀਚਿਆਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੀਆਂ ਹਨ।
  2. ਗਿਆਨ-ਸਬੰਧੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ: ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਗਿਆਨ, ਸੱਚਾਈ, ਸ਼ੁੱਧਤਾ ਅਤੇ ਬੌਧਿਕ ਇਮਾਨਦਾਰੀ ਨਾਲ ਸਬੰਧਤ ਹਨ।
  3. ਸਮਾਜਿਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ: ਇਹ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਆਪਸੀ ਤਾਲਮੇਲ, ਭਾਈਚਾਰੇ, ਨਿਰਪੱਖਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨਾਲ ਸਬੰਧਤ ਹਨ।
  4. ਸੁਰੱਖਿਆਤਮਕ ਕਦਰਾਂ-ਕੀਮਤਾਂ: ਇਹ ਕ