ਗ੍ਰੋਕ 3 'ਤੇ ਬੰਦੇ ਦੀ ਸ਼ਿਕਾਇਤ, ਮਸਕ ਦੀ ਸਾਬਕਾ ਦਾ ਜਵਾਬ
ਇੱਕ ਆਦਮੀ ਨੇ xAI ਦੇ Grok 3 ਬਾਰੇ ਸ਼ਿਕਾਇਤ ਕੀਤੀ, ਜਿਸ 'ਤੇ ਏਲੋਨ ਮਸਕ ਦੀ ਸਾਬਕਾ ਪ੍ਰੇਮਿਕਾ, ਗ੍ਰੀਮਜ਼ ਨੇ ਜਵਾਬ ਦਿੱਤਾ, ਕਿ ਜੀਵਨ ਕਲਾ ਨਾਲੋਂ ਵਧੇਰੇ ਦਿਲਚਸਪ ਹੋ ਗਿਆ ਹੈ।
ਇੱਕ ਆਦਮੀ ਨੇ xAI ਦੇ Grok 3 ਬਾਰੇ ਸ਼ਿਕਾਇਤ ਕੀਤੀ, ਜਿਸ 'ਤੇ ਏਲੋਨ ਮਸਕ ਦੀ ਸਾਬਕਾ ਪ੍ਰੇਮਿਕਾ, ਗ੍ਰੀਮਜ਼ ਨੇ ਜਵਾਬ ਦਿੱਤਾ, ਕਿ ਜੀਵਨ ਕਲਾ ਨਾਲੋਂ ਵਧੇਰੇ ਦਿਲਚਸਪ ਹੋ ਗਿਆ ਹੈ।
xAI ਦਾ Grok 3 ਇੱਕ 'ਅਨਹਿੰਗਡ' ਵੌਇਸ ਮੋਡ ਪੇਸ਼ ਕਰਦਾ ਹੈ, ਜੋ ਰਵਾਇਤੀ AI ਸਹਾਇਕਾਂ ਤੋਂ ਵੱਖਰਾ ਹੈ। ਇਹ ਜਾਣਬੁੱਝ ਕੇ ਵਿਵਾਦਪੂਰਨ, ਭੜਕਾਊ, ਅਤੇ ਪਰੇਸ਼ਾਨ ਕਰਨ ਵਾਲਾ ਹੋਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।
ਲੇ ਚੈਟ ਇੱਕ ਫ੍ਰੈਂਚ AI ਸਟਾਰਟਅੱਪ, Mistral AI ਦੁਆਰਾ ਵਿਕਸਤ ਇੱਕ ਗੱਲਬਾਤ ਕਰਨ ਵਾਲਾ AI ਟੂਲ ਹੈ। ਇਸਨੇ ਲਾਂਚ ਹੋਣ ਦੇ ਦੋ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਹੀ 10 ਲੱਖ ਤੋਂ ਵੱਧ ਡਾਊਨਲੋਡ ਹਾਸਲ ਕਰ ਲਏ, ਜੋ ਕਿ ChatGPT ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਖਿਡਾਰੀਆਂ ਵਾਲੇ ਮੁਕਾਬਲੇ ਵਾਲੇ ਬਾਜ਼ਾਰ ਵਿੱਚ ਇੱਕ ਮਜ਼ਬੂਤ ਦਾਖਲੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।
ਓਪਨਏਆਈ ਨੇ ਆਪਣਾ ਨਵਾਂ ਜਨਰੇਟਿਵ ਏਆਈ ਮਾਡਲ ਜੀਪੀਟੀ-4.5 ਲਾਂਚ ਕੀਤਾ ਹੈ ਇਹ ਪਿਛਲੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵੱਡਾ ਅਤੇ ਵਧੇਰੇ ਸਮਝਦਾਰ ਹੈ ਇਹ ਚੈਟਜੀਪੀਟੀ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਵਧੇਰੇ ਅਨੁਭਵੀ ਗੱਲਬਾਤ ਦਾ ਵਾਅਦਾ ਕਰਦਾ ਹੈ।
XAi ਨੇ Android ਡਿਵਾਈਸਾਂ ਲਈ ਆਪਣੀ Grok ਐਪਲੀਕੇਸ਼ਨ ਲਾਂਚ ਕੀਤੀ। ਇਹ ਗੱਲਬਾਤ ਕਰਨ ਵਾਲੀ AI ਨੂੰ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਉਪਭੋਗਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚਾਉਂਦੀ ਹੈ। Grok ਸਿਰਫ਼ ਇੱਕ ਸਵਾਲ-ਜਵਾਬ ਕਰਨ ਵਾਲਾ ਚੈਟਬੋਟ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਖੋਜ ਅਤੇ ਰਚਨਾਤਮਕ ਸਾਧਨ ਹੈ, ਜੋ X ਪਲੇਟਫਾਰਮ ਤੋਂ ਰੀਅਲ-ਟਾਈਮ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।
ਐਲੋਨ ਮਸਕ ਦੀ xAI ਨੇ ਗਰੋਕ 3 ਮਾਡਲ ਲਈ ਇੱਕ ਨਵਾਂ ਫੀਚਰ ਲਾਂਚ ਕੀਤਾ ਹੈ, 'ਅਨਹਿੰਗਡ' ਵੌਇਸ ਮੋਡ। ਇਹ ਗੱਲਬਾਤ ਨੂੰ ਬਿਨਾਂ ਸੈਂਸਰ ਦੇ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
xAI ਦੇ Grok 3 AI ਮਾਡਲ ਦੇ ਬੈਂਚਮਾਰਕ ਨਤੀਜਿਆਂ ਦੀ ਪੇਸ਼ਕਾਰੀ ਨੂੰ ਲੈ ਕੇ ਇੱਕ ਵਿਵਾਦ ਖੜ੍ਹਾ ਹੋ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਘਾਟ ਅਤੇ ਗੁੰਮਰਾਹਕੁੰਨ ਜਾਣਕਾਰੀ ਦੇ ਦੋਸ਼ ਸ਼ਾਮਲ ਹਨ।
ਬਾਈਟਡਾਂਸ ਦਾ ਡੌਬਾਓ ਚੀਨ ਦੇ AI ਚੈਟਬੋਟ ਬਾਜ਼ਾਰ ਵਿੱਚ ਇੱਕ ਪ੍ਰਮੁੱਖ ਖਿਡਾਰੀ ਵਜੋਂ ਉੱਭਰਿਆ ਹੈ, ਜਿਸ ਨੇ ਅਲੀਬਾਬਾ ਅਤੇ ਬਾਇਡੂ ਵਰਗੇ ਸਥਾਪਿਤ ਖਿਡਾਰੀਆਂ ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਚੀਨੀ ਤਕਨੀਕੀ ਬਾਜ਼ਾਰ ਦੀ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਜਿੱਥੇ ਤੇਜ਼ੀ ਨਾਲ ਨਵੀਨਤਾ ਅਤੇ ਉਪਭੋਗਤਾ-ਕੇਂਦ੍ਰਿਤ ਪਹੁੰਚ ਸਫਲਤਾ ਦੀ ਕੁੰਜੀ ਹਨ।
ਸਟੈਨਫੋਰਡ ਅਤੇ ਯੂਸੀ ਬਰਕਲੇ ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਕੀਤੀ ਗਈ ਇੱਕ ਤਾਜ਼ਾ ਖੋਜ ਵਿੱਚ, GPT-3.5 ਅਤੇ GPT-4 ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਤਿੰਨ ਮਹੀਨਿਆਂ ਦੇ ਅੰਦਰ ਕਾਫ਼ੀ ਉਤਰਾਅ-ਚੜ੍ਹਾਅ ਦੇਖੇ ਗਏ ਹਨ। ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਜਾਂਚ ਸੱਤ ਕੰਮਾਂ ਵਿੱਚ ਕੀਤੀ ਗਈ, ਜਿਸ ਵਿੱਚ ਗਣਿਤਿਕ ਸਮੱਸਿਆਵਾਂ, ਕੋਡ ਜਨਰੇਸ਼ਨ, ਬਹੁ-ਪੜਾਵੀ ਗਿਆਨ-ਅਧਾਰਿਤ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ, ਯੂਐਸ ਮੈਡੀਕਲ ਲਾਇਸੈਂਸਿੰਗ ਪ੍ਰੀਖਿਆ, ਅਤੇ ਮਲਟੀ-ਹੌਪ ਗਿਆਨ-ਅਧਾਰਿਤ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਸ਼ਾਮਲ ਸਨ।ਖੋਜ ਨੇ ਦਿਖਾਇਆ ਕਿ GPT-4 ਦੀ ਪ੍ਰਾਇਮ ਬਨਾਮ ਸੰਯੁਕਤ ਸੰਖਿਆਵਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਦੀ ਸ਼ੁੱਧਤਾ ਮਾਰਚ ਵਿੱਚ 84% ਤੋਂ ਘਟ ਕੇ ਜੂਨ ਵਿੱਚ 51% ਹੋ ਗਈ। ਇਸ ਦੌਰਾਨ, GPT-3.5 ਨੇ ਇਸ ਕੰਮ ਵਿੱਚ ਸੁਧਾਰ ਦਿਖਾਇਆ। GPT-4 ਜੂਨ ਵਿੱਚ ਸੰਵੇਦਨਸ਼ੀਲ ਸਵਾਲਾਂ ਅਤੇ ਰਾਏ ਸਰਵੇਖਣਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਲਈ ਘੱਟ ਤਿਆਰ ਸੀ। GPT-4 ਨੇ ਬਹੁ-ਪੜਾਵੀ ਤਰਕ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਵਿੱਚ ਸੁਧਾਰ ਕੀਤਾ, ਜਦੋਂ ਕਿ GPT-3.5 ਨੇ ਅਜਿਹੇ ਕੰਮਾਂ ਵਿੱਚ ਗਿਰਾਵਟ ਦਰਸਾਈ। ਦੋਵਾਂ ਮਾਡਲਾਂ ਲਈ ਕੋਡ ਜਨਰੇਸ਼ਨ ਵਿੱਚ ਫਾਰਮੈਟਿੰਗ ਦੀਆਂ ਗਲਤੀਆਂ ਵਿੱਚ ਵਾਧਾ ਹੋਇਆ। GPT-4 ਦੀ ਉਪਭੋਗਤਾ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਗਿਰਾਵਟ ਆਈ ਹੈ। ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਚਾਰ ਕਿਸਮਾਂ ਦੇ ਆਮ ਨਿਰਦੇਸ਼ਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਤ ਕੀਤਾ, ਜਿਵੇਂ ਕਿ ਜਵਾਬ ਕੱਢਣਾ, ਮੁਆਫੀ ਮੰਗਣਾ ਬੰਦ ਕਰਨਾ, ਖਾਸ ਸ਼ਬਦਾਂ ਤੋਂ ਬਚਣਾ, ਅਤੇ ਸਮੱਗਰੀ ਫਿਲਟਰਿੰਗ। ਮਾਰਚ ਵਿੱਚ GPT-4 ਨੇ ਜ਼ਿਆਦਾਤਰ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕੀਤੀ, ਪਰ ਜੂਨ ਤੱਕ ਇਸਨੇ ਉਹਨਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ। ਉਦਾਹਰਣ ਵਜੋਂ, ਜਵਾਬ ਕੱਢਣ ਦੇ ਨਿਰਦੇਸ਼ਾਂ ਲਈ ਪਾਲਣਾ ਦਰ 99.5% ਤੋਂ ਘਟ ਕੇ ਲਗਭਗ ਜ਼ੀਰੋ ਹੋ ਗਈ, ਅਤੇ ਸਮੱਗਰੀ ਫਿਲਟਰਿੰਗ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਵਫ਼ਾਦਾਰੀ ਵੀ 74.0% ਤੋਂ ਘਟ ਕੇ 19.0% ਹੋ ਗਈ। ਇਹ ਖੋਜ ChatGPT ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਗਿਰਾਵਟ ਅਤੇ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਿੱਚ ਆਉਣ ਵਾਲੀਆਂ ਚੁਣੌਤੀਆਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ।