ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3: ਏ.ਆਈ. ਚੈਲੇਂਜ | pa

ਫ੍ਰੈਂਚ ਸਟਾਰਟਅੱਪ ਕੰਪਨੀ ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਆਪਣਾ ਨਵਾਂ ਮਲਟੀਮੋਡਲ ਮਾਡਲ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਜਾਰੀ ਕੀਤਾ ਹੈ। ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਸ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਕਲਾਉਡ ਸੋਨੇਟ 3.7 (Claude Sonnet 3.7) ਦੇ ਬਰਾਬਰ ਹੈ ਅਤੇ ਡੀਪਸੀਕ ਵੀ3 (DeepSeek V3) ਨਾਲੋਂ ਘੱਟ ਕੀਮਤ ਵਾਲਾ ਹੈ। ਇਸ ਖ਼ਬਰ ਨੇ ਤਕਨਾਲੋਜੀ ਜਗਤ ਵਿੱਚ ਤੁਰੰਤ ਹੀ ਸਾਰਿਆਂ ਦਾ ਧਿਆਨ ਆਪਣੇ ਵੱਲ ਖਿੱਚ ਲਿਆ। ਪਰ, ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਅਸਲ ਟੈਸਟਿੰਗ ਤੋਂ ਬਾਅਦ ਪਾਇਆ ਕਿ ਇਸ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਅਧਿਕਾਰਤ ਇਸ਼ਤਿਹਾਰਾਂ ਤੋਂ ਬਹੁਤ ਵੱਖਰੀ ਹੈ। ਕੁਝ ਲੋਕਾਂ ਨੇ ਤਾਂ ਇੱਥੋਂ ਤੱਕ ਸੁਝਾਅ ਦਿੱਤਾ ਕਿ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਸਨੂੰ ਡਾਊਨਲੋਡ ਕਰਨ ਵਿੱਚ ਆਪਣਾ ਸਮਾਂ ਅਤੇ ਪੈਸਾ ਬਰਬਾਦ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ।

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 ਦੀ ਅਧਿਕਾਰਤ ਘੋਸ਼ਣਾ

ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਆਪਣੇ ਅਧਿਕਾਰਤ ਬਲੌਗ ਵਿੱਚ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀਆਂ ਕਈ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਹੈ:

ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਕੀਮਤ ਵਿੱਚ ਸੰਤੁਲਨ: ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦਾ ਉਦੇਸ਼ ਉੱਚ ਪੱਧਰੀ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਦਾਨਾ ਕਰਨਾ ਅਤੇ ਇਸ ਦੇ ਨਾਲ ਹੀ ਕੀਮਤ ਨੂੰ ਅੱਠ ਗੁਣਾ ਘਟਾਉਣਾ ਹੈ, ਜਿਸ ਨਾਲ ਕਾਰੋਬਾਰੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ ਜਾ ਸਕੇ।
ਵਿਸ਼ੇਸ਼ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਫਾਇਦਾ: ਇਹ ਮਾਡਲ ਕੋਡਿੰਗ ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਮਝ ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
ਕਾਰੋਬਾਰੀ ਪੱਧਰ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ: ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਕਾਰੋਬਾਰੀ ਪੱਧਰ ਦੀਆਂ ਕਈ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ ਡਿਪਲਾਇਮੈਂਟ, ਲੋਕਲ ਡਿਪਲਾਇਮੈਂਟ ਅਤੇ ਵੀ.ਪੀ.ਸੀ. (VPC) ਦੇ ਅੰਦਰ ਡਿਪਲਾਇਮੈਂਟ ਦਾ ਸਮਰਥਨ ਸ਼ਾਮਲ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਕਸਟਮਾਈਜ਼ਡ ਸਿਖਲਾਈ ਅਤੇ ਕਾਰੋਬਾਰੀ ਟੂਲਜ਼ ਅਤੇ ਸਿਸਟਮਾਂ ਵਿੱਚ ਏਕੀਕਰਣ ਦੀ ਸਹੂਲਤ ਵੀ ਦਿੰਦਾ ਹੈ।

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 ਏ.ਪੀ.ਆਈ. (Mistral Medium 3 API) ਮਿਸਟਰਲ ਲਾ ਪਲੇਟਫਾਰਮ (Mistral La Plateforme) ਅਤੇ ਐਮਾਜ਼ਾਨ ਸੇਜਮੇਕਰ (Amazon Sagemaker) ‘ਤੇ ਲਾਂਚ ਕੀਤੀ ਗਈ ਹੈ, ਅਤੇ ਇਸਨੂੰ ਜਲਦੀ ਹੀ ਆਈ.ਬੀ.ਐਮ. ਵਾਟਸਨਐਕਸ (IBM WatsonX), ਐਨਵੀਡੀਆ ਐਨ.ਆਈ.ਐਮ. (NVIDIA NIM), ਐਜ਼ਿਊਰ ਏ.ਆਈ. ਫਾਊਂਡਰੀ (Azure AI Foundry) ਅਤੇ ਗੂਗਲ ਕਲਾਉਡ ਵਰਟੈਕਸ (Google Cloud Vertex) ‘ਤੇ ਵੀ ਉਪਲਬਧ ਕਰਵਾਇਆ ਜਾਵੇਗਾ।

ਕਾਰਗੁਜ਼ਾਰੀ ਮਾਪਦੰਡਾਂ ਦੀ ਤੁਲਨਾ

ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਕਈ ਬੈਂਚਮਾਰਕ ਟੈਸਟਾਂ ਵਿੱਚ ਕਲਾਉਡ ਸੋਨੇਟ 3.7 (Claude Sonnet 3.7) ਦੇ 90% ਤੱਕ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਹੈ, ਪਰ ਇਸਦੀ ਕੀਮਤ ਕਾਫ਼ੀ ਘੱਟ ਹੈ। ਖਾਸ ਤੌਰ ‘ਤੇ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਟੋਕਨ ਦੀ ਇਨਪੁਟ ਕੀਮਤ 0.4 ਡਾਲਰ ਅਤੇ ਆਉਟਪੁੱਟ ਕੀਮਤ 2 ਡਾਲਰ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਲਾਮਾ 4 ਮੈਵੇਰਿਕ (Llama 4 Maverick) ਅਤੇ ਕੋਹੇਅਰ ਕਮਾਂਡ ਏ (Cohere Command A) ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਓਪਨ ਸੋਰਸ ਮਾਡਲਾਂ ਤੋਂ ਵੀ ਵਧੀਆ ਦੱਸੀ ਜਾਂਦੀ ਹੈ। ਏ.ਪੀ.ਆਈ. (API) ਜਾਂ ਸੁਤੰਤਰ ਡਿਪਲਾਇਮੈਂਟ ਦੁਆਰਾ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਕੀਮਤ ਡੀਪਸੀਕ ਵੀ3 (DeepSeek V3) ਤੋਂ ਘੱਟ ਹੈ। ਇਸ ਮਾਡਲ ਨੂੰ ਚਾਰ ਜੀ.ਪੀ.ਯੂ. (GPU) ਜਾਂ ਇਸ ਤੋਂ ਵੱਧ ਵਾਲੇ ਕਿਸੇ ਵੀ ਸਵੈ-ਹੋਸਟ ਕੀਤੇ ਵਾਤਾਵਰਣ ਸਮੇਤ, ਕਿਸੇ ਵੀ ਕਲਾਉਡ ‘ਤੇ ਡਿਪਲਾਈਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਕਾਰੋਬਾਰੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ‘ਤੇ ਧਿਆਨ

ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਜ਼ੋਰ ਦਿੱਤਾ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦਾ ਟੀਚਾ ਇੱਕ ਅਜਿਹਾ ਮਾਡਲ ਬਣਨਾ ਹੈ ਜੋ ਖਾਸ ਤੌਰ ‘ਤੇ ਕੋਡਿੰਗ ਅਤੇ ਐਸ.ਟੀ.ਈ.ਐਮ. (STEM) ਕੰਮਾਂ ਵਿੱਚ ਉੱਤਮ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇ, ਅਤੇ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵੱਡੇ ਅਤੇ ਹੌਲੀ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੇ ਬਰਾਬਰ ਹੋਵੇ।

ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ ਜਾਰੀ ਕੀਤੇ ਗਏ ਅੰਕੜਿਆਂ ਅਨੁਸਾਰ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਲਗਭਗ ਲਾਮਾ 4 ਮੈਵੇਰਿਕ (Llama 4 Maverick) ਅਤੇ ਜੀ.ਪੀ.ਟੀ.-4ਓ. (GPT-4o) ਤੋਂ ਵੱਧ ਹੈ, ਅਤੇ ਕਲਾਉਡ ਸੋਨੇਟ 3.7 (Claude Sonnet 3.7) ਅਤੇ ਡੀਪਸੀਕ 3.1 (DeepSeek 3.1) ਦੇ ਨੇੜੇ ਹੈ।

ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਹੋਰ ਬਿਹਤਰ ਤਰੀਕੇ ਨਾਲ ਪਰਖਣ ਲਈ, ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਤੀਜੀ ਧਿਰ ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਮੁਲਾਂਕਣਾਂ ਦੇ ਨਤੀਜੇ ਵੀ ਜਾਰੀ ਕੀਤੇ, ਜੋ ਅਸਲ ਦੁਨੀਆ ਦੇ ਉਪਯੋਗਾਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। ਨਤੀਜਿਆਂ ਤੋਂ ਪਤਾ ਚੱਲਦਾ ਹੈ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਕੋਡਿੰਗ ਖੇਤਰ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਹੈ, ਅਤੇ ਹਰ ਪੱਖੋਂ ਦੂਜੇ ਪ੍ਰਤੀਯੋਗੀਆਂ ਨਾਲੋਂ ਵਧੀਆ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਦਾਨ ਕੀਤੀ ਹੈ।

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਕਾਰੋਬਾਰੀ ਵਾਤਾਵਰਣ ਦੇ ਅਨੁਕੂਲ ਹੋਣ ਦੀ ਸਮਰੱਥਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਵੀ ਦੂਜੇ ਐਸ.ਓ.ਟੀ.ਏ. (SOTA) ਮਾਡਲਾਂ ਤੋਂ ਵਧੀਆ ਹੈ। ਇਹ ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਆਪਣੀ ਬੁੱਧੀ ਨੂੰ ਕਾਰੋਬਾਰੀ ਸਿਸਟਮਾਂ ਵਿੱਚ ਪੂਰੀ ਤਰ੍ਹਾਂ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦਾ ਇੱਕ ਤਰੀਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਏ.ਪੀ.ਆਈ. (API) ਫਾਈਨ-ਟਿਊਨਿੰਗ ਅਤੇ ਮਾਡਲ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਵਿੱਚ ਆਉਣ ਵਾਲੀਆਂ ਮੁਸ਼ਕਲਾਂ ਨੂੰ ਹੱਲ ਕਰਦਾ ਹੈ।

ਲੇ ਚੈਟ ਐਂਟਰਪ੍ਰਾਈਜ਼ (Le Chat Enterprise)

ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਮਾਡਲ ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਲੇ ਚੈਟ ਐਂਟਰਪ੍ਰਾਈਜ਼ (Le Chat Enterprise) ਵੀ ਲਾਂਚ ਕੀਤਾ ਹੈ, ਜੋ ਕਿ ਕਾਰੋਬਾਰਾਂ ਲਈ ਇੱਕ ਚੈਟਬੋਟ ਸੇਵਾ ਹੈ। ਇਹ ਇੱਕ ਏ.ਆਈ. (AI) ਇੰਟੈਲੀਜੈਂਟ ਏਜੰਟ ਬਿਲਡਿੰਗ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਅਤੇ ਮਿਸਟਰਲ ਦੇ ਮਾਡਲ ਨੂੰ ਜੀਮੇਲ (Gmail), ਗੂਗਲ ਡਰਾਈਵ (Google Drive) ਅਤੇ ਸ਼ੇਅਰਪੁਆਇੰਟ (SharePoint) ਵਰਗੀਆਂ ਤੀਜੀ ਧਿਰ ਦੀਆਂ ਸੇਵਾਵਾਂ ਨਾਲ ਜੋੜਦਾ ਹੈ।

ਲੇ ਚੈਟ ਐਂਟਰਪ੍ਰਾਈਜ਼ (Le Chat Enterprise) ਦਾ ਉਦੇਸ਼ ਕਾਰੋਬਾਰਾਂ ਦੁਆਰਾ ਦਰਪੇਸ਼ ਏ.ਆਈ. (AI) ਚੁਣੌਤੀਆਂ ਨੂੰ ਹੱਲ ਕਰਨਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਟੂਲ ਫਰੈਗਮੈਂਟੇਸ਼ਨ, ਅਸੁਰੱਖਿਅਤ ਜਾਣਕਾਰੀ ਏਕੀਕਰਣ, ਸਖ਼ਤ ਮਾਡਲ ਅਤੇ ਨਿਵੇਸ਼ ‘ਤੇ ਹੌਲੀ ਰਿਟਰਨ, ਅਤੇ ਸਾਰੇ ਸੰਗਠਨਾਤਮਕ ਕੰਮਾਂ ਲਈ ਇੱਕ ਯੂਨੀਫਾਈਡ ਏ.ਆਈ. (AI) ਪਲੇਟਫਾਰਮ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ।

ਲੇ ਚੈਟ ਐਂਟਰਪ੍ਰਾਈਜ਼ (Le Chat Enterprise) ਜਲਦੀ ਹੀ ਐਮ.ਸੀ.ਪੀ. (MCP) ਪ੍ਰੋਟੋਕੋਲ ਦਾ ਸਮਰਥਨ ਕਰੇਗਾ, ਜੋ ਕਿ ਐਂਥ੍ਰੋਪਿਕ (Anthropic) ਦੁਆਰਾ ਏ.ਆਈ. (AI) ਨੂੰ ਡਾਟਾ ਸਿਸਟਮਾਂ ਅਤੇ ਸੌਫਟਵੇਅਰ ਨਾਲ ਜੋੜਨ ਲਈ ਪ੍ਰਸਤਾਵਿਤ ਇੱਕ ਮਿਆਰ ਹੈ।

ਮਿਸਟਰਲ ਲਾਰਜ (Mistral Large) ਬਾਰੇ ਭਵਿੱਖਬਾਣੀ

ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਨੇ ਆਪਣੇ ਬਲੌਗ ਵਿੱਚ ਇਹ ਵੀ ਦੱਸਿਆ ਕਿ ਹਾਲਾਂਕਿ ਮਿਸਟਰਲ ਸਮਾਲ (Mistral Small) ਅਤੇ ਮਿਸਟਰਲ ਮੀਡੀਅਮ (Mistral Medium) ਪਹਿਲਾਂ ਹੀ ਜਾਰੀ ਕੀਤੇ ਜਾ ਚੁੱਕੇ ਹਨ, ਪਰ ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਵਿੱਚ ਉਨ੍ਹਾਂ ਕੋਲ ਇੱਕ "ਵੱਡੀ" ਯੋਜਨਾ ਹੈ, ਜੋ ਕਿ ਮਿਸਟਰਲ ਲਾਰਜ (Mistral Large) ਹੈ। ਉਨ੍ਹਾਂ ਕਿਹਾ ਕਿ ਹੁਣੇ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਮਿਸਟਰਲ ਮੀਡੀਅਮ (Mistral Medium) ਪਹਿਲਾਂ ਹੀ ਲਾਮਾ 4 ਮੈਵੇਰਿਕ (Llama 4 Maverick) ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਓਪਨ ਸੋਰਸ ਮਾਡਲਾਂ ਤੋਂ ਕਿਤੇ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਮਿਸਟਰਲ ਲਾਰਜ (Mistral Large) ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਹੋਰ ਵੀ ਉਮੀਦ ਭਰੀ ਹੋਵੇਗੀ।

ਉਪਭੋਗਤਾ ਟੈਸਟਿੰਗ ਦੀ ਅਸਲ ਸਥਿਤੀ

ਪਰ, ਮਿਸਟਰਲ ਏ.ਆਈ. (Mistral AI) ਦੁਆਰਾ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਸ਼ਕਤੀਸ਼ਾਲੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਵੱਡਾ ਪ੍ਰਚਾਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਮੀਡੀਆ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਤੁਰੰਤ ਅਸਲ ਟੈਸਟਿੰਗ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੀ, ਜਿਸਦੇ ਨਤੀਜੇ ਹੈਰਾਨ ਕਰਨ ਵਾਲੇ ਸਨ।

ਕਾਰਗੁਜ਼ਾਰੀ ਟੈਸਟਿੰਗ ਵਿੱਚ ਗਿਰਾਵਟ

ਨਿਊਯਾਰਕ ਟਾਈਮਜ਼ (New York Times) ਦੇ ਕਨੈਕਸ਼ਨਜ਼ (Connections) ਕਾਲਮ ਸ਼ਬਦਾਵਲੀ ਵਰਗੀਕਰਣ ‘ਤੇ ਆਧਾਰਿਤ ਮੁਲਾਂਕਣ ਵਿੱਚ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਨਿਰਾਸ਼ਾਜਨਕ ਰਿਹਾ, ਅਤੇ ਇਸਦਾ ਜ਼ਿਕਰ ਕਿਤੇ ਵੀ ਨਹੀਂ ਮਿਲਿਆ। ਨਵੇਂ 100 ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਮੁਲਾਂਕਣ ਵਿੱਚ ਵੀ ਇਹ ਮੋਹਰੀ ਮਾਡਲਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਨਹੀਂ ਸੀ।

ਕੁਝ ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਟੈਸਟ ਕਰਨ ਤੋਂ ਬਾਅਦ ਕਿਹਾ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਲਿਖਣ ਦੀ ਸਮਰੱਥਾ ਵਿੱਚ ਕੋਈ ਖਾਸ ਸੁਧਾਰ ਨਹੀਂ ਹੋਇਆ ਹੈ। ਹਾਲਾਂਕਿ, ਐਲ.ਐਲ.ਐਮ. (LLM) ਮੁਲਾਂਕਣ ਵਿੱਚ, ਇਹ ਪੈਰੇਟੋ ਫਰੰਟ ‘ਤੇ ਸੀ।

ਜ਼ੂ ਲਿਆਂਗ (Zhu Liang) ਦੇ ਟੈਸਟ ਵਿੱਚ ਪਾਇਆ ਗਿਆ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਕੋਡਿੰਗ ਅਤੇ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਦੋਵਾਂ ਵਿੱਚ ਚੰਗਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, ਅਤੇ ਇਹ ਦੋਵਾਂ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਚੋਟੀ ਦੇ ਪੰਜ ਵਿੱਚ ਸ਼ਾਮਲ ਸੀ।

ਕੋਡਿੰਗ ਕੰਮਾਂ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਨ

ਸਧਾਰਨ ਕੋਡਿੰਗ ਟਾਸਕ (Next.js TODO ਐਪਲੀਕੇਸ਼ਨ) ਵਿੱਚ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਸੰਖੇਪ ਅਤੇ ਸਪਸ਼ਟ ਜਵਾਬ ਤਿਆਰ ਕੀਤੇ, ਜਿਸਦੀ ਰੇਟਿੰਗ ਜੇਮਿਨੀ 2.5 ਪ੍ਰੋ (Gemini 2.5 Pro) ਅਤੇ ਕਲਾਉਡ 3.5 ਸੋਨੇਟ (Claude 3.5 Sonnet) ਦੇ ਬਰਾਬਰ ਸੀ, ਪਰ ਡੀਪਸੀਕ ਵੀ3 (DeepSeek V3) (ਨਵਾਂ) ਅਤੇ ਜੀ.ਪੀ.ਟੀ.-4.1 (GPT-4.1) ਤੋਂ ਘੱਟ ਸੀ।

ਜਟਿਲ ਕੋਡਿੰਗ ਟਾਸਕ (ਬੈਂਚਮਾਰਕ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ) ਵਿੱਚ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਜੇਮਿਨੀ 2.5 ਪ੍ਰੋ (Gemini 2.5 Pro) ਅਤੇ ਡੀਪਸੀਕ ਵੀ3 (DeepSeek V3) (ਨਵਾਂ) ਦੇ ਸਮਾਨ ਔਸਤ ਨਤੀਜੇ ਦਿੱਤੇ, ਪਰ ਜੀ.ਪੀ.ਟੀ.-4.1 (GPT-4.1), ਓ3 (o3) ਅਤੇ ਕਲਾਉਡ 3.7 ਸੋਨੇਟ (Claude 3.7 Sonnet) ਤੋਂ ਘੱਟ ਵਧੀਆ ਸੀ।

ਲਿਖਣ ਦੀ ਸਮਰੱਥਾ ਦਾ ਮੁਲਾਂਕਣ

ਲਿਖਣ ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਨੇ ਜ਼ਿਆਦਾਤਰ ਮੁੱਖ ਨੁਕਤਿਆਂ ਨੂੰ ਕਵਰ ਕੀਤਾ, ਪਰ ਫਾਰਮੈਟ ਸਹੀ ਨਹੀਂ ਸੀ। ਇਸਦੀ ਰੇਟਿੰਗ ਡੀਪਸੀਕ ਵੀ3 (DeepSeek V3) (ਨਵਾਂ) ਅਤੇ ਕਲਾਉਡ 3.7 ਸੋਨੇਟ (Claude 3.7 Sonnet) ਦੇ ਨੇੜੇ ਸੀ, ਪਰ ਜੀ.ਪੀ.ਟੀ.-4.1 (GPT-4.1) ਅਤੇ ਜੇਮਿਨੀ 2.5 ਪ੍ਰੋ (Gemini 2.5 Pro) ਤੋਂ ਘੱਟ ਸੀ।

ਮਸ਼ਹੂਰ ਹਸਤੀ "ਕਰਮਿੰਸਕੀ-ਦੰਦਾਂ ਦਾ ਡਾਕਟਰ" (karminski-牙医) ਨੇ ਟੈਸਟਿੰਗ ਤੋਂ ਬਾਅਦ ਇਹ ਵੀ ਕਿਹਾ ਕਿ ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਓਨੀ ਮਜ਼ਬੂਤ ਨਹੀਂ ਹੈ ਜਿੰਨੀ ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ ਦੱਸੀ ਗਈ ਹੈ, ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਸਨੂੰ ਡਾਊਨਲੋਡ ਨਾ ਕਰਨ ਦੀ ਸਲਾਹ ਦਿੱਤੀ ਹੈ, ਤਾਂ ਜੋ ਉਹ ਆਪਣਾ ਡਾਟਾ ਅਤੇ ਹਾਰਡ ਡਿਸਕ ਸਪੇਸ ਬਰਬਾਦ ਹੋਣ ਤੋਂ ਬਚਾ ਸਕਣ।

ਤੁਲਨਾ ਅਤੇ ਮੁੜ-ਵਿਚਾਰ

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦਾ ਮਾਮਲਾ ਸਾਨੂੰ ਇੱਕ ਵਾਰ ਫਿਰ ਯਾਦ ਦਿਵਾਉਂਦਾ ਹੈ ਕਿ ਏ.ਆਈ. (AI) ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਸਮੇਂ, ਸਾਨੂੰ ਸਿਰਫ਼ ਅਧਿਕਾਰਤ ਪ੍ਰਚਾਰ ਅਤੇ ਬੈਂਚਮਾਰਕ ਟੈਸਟਿੰਗ ਦੇ ਨਤੀਜਿਆਂ ‘ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਹੋਣਾ ਚਾਹੀਦਾ, ਸਗੋਂ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਅਸਲ ਤਜ਼ਰਬਿਆਂ ਅਤੇ ਤੀਜੀ ਧਿਰ ਦੇ ਮੁਲਾਂਕਣਾਂ ਨੂੰ ਵੀ ਮਹੱਤਵ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ।

ਅਧਿਕਾਰਤ ਪ੍ਰਚਾਰ ਅਕਸਰ ਮਾਡਲ ਦੀਆਂ ਚੰਗੀਆਂ ਗੱਲਾਂ ਨੂੰ ਹੀ ਦਿਖਾਉਂਦਾ ਹੈ, ਅਤੇ ਇਸਦੀਆਂ ਕਮੀਆਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਦਾ ਹੈ। ਬੈਂਚਮਾਰਕ ਟੈਸਟਿੰਗ ਭਾਵੇਂ ਕੁਝ ਹੱਦ ਤੱਕ ਮਦਦਗਾਰ ਹੋ ਸਕਦੀ ਹੈ, ਪਰ ਇਹ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਹੀਂ ਦਰਸਾਉਂਦੀ। ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਅਸਲ ਤਜ਼ਰਬੇ ਅਤੇ ਤੀਜੀ ਧਿਰ ਦੇ ਮੁਲਾਂਕਣ ਵਧੇਰੇ ਨਿਰਪੱਖ ਅਤੇ ਵਿਆਪਕ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਇਹ ਮਾਡਲ ਦੀਆਂ ਚੰਗੀਆਂ ਅਤੇ ਮਾੜੀਆਂ ਗੱਲਾਂ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਮਝਣ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਏ.ਆਈ. (AI) ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਕਈ ਕਾਰਕਾਂ ਤੋਂ ਪ੍ਰਭਾਵਿਤ ਹੁੰਦੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਿਖਲਾਈ ਡਾਟਾ, ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ, ਅਤੇ ਓਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਐਲਗੋਰਿਦਮ ਸ਼ਾਮਲ ਹਨ। ਵੱਖ-ਵੱਖ ਮਾਡਲ ਵੱਖ-ਵੱਖ ਕੰਮਾਂ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਤਰ੍ਹਾਂ ਦੇ ਫਾਇਦੇ ਅਤੇ ਨੁਕਸਾਨ ਦਿਖਾ ਸਕਦੇ ਹਨ। ਇਸ ਲਈ, ਏ.ਆਈ. (AI) ਮਾਡਲ ਦੀ ਚੋਣ ਕਰਦੇ ਸਮੇਂ, ਸਾਨੂੰ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਜ਼ਰੂਰਤਾਂ ਦੇ ਅਨੁਸਾਰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ।

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਰਿਲੀਜ਼ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਅਸਲ ਟੈਸਟਿੰਗ ਦੇ ਨਤੀਜਿਆਂ ਵਿੱਚ ਵੱਡਾ ਅੰਤਰ ਏ.ਆਈ. (AI) ਮਾਡਲ ਮੁਲਾਂਕਣ ਮਾਪਦੰਡਾਂ ਬਾਰੇ ਵਿਚਾਰ-ਵਟਾਂਦਰੇ ਨੂੰ ਜਨਮ ਦਿੰਦਾ ਹੈ। ਏ.ਆਈ. (AI) ਮਾਡਲ ਮੁਲਾਂਕਣ ਪ੍ਰਣਾਲੀ ਨੂੰ ਵਧੇਰੇ ਵਿਗਿਆਨਕ, ਨਿਰਪੱਖ ਅਤੇ ਵਿਆਪਕ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ, ਇਹ ਇੱਕ ਅਜਿਹਾ ਮੁੱਦਾ ਹੈ ਜਿਸ ‘ਤੇ ਡੂੰਘਾਈ ਨਾਲ ਵਿਚਾਰ ਕਰਨ ਦੀ ਲੋੜ ਹੈ।

ਉਦਯੋਗ ‘ਤੇ ਪ੍ਰਭਾਵ

ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦੀ ਘਟਨਾ ਦਾ ਪੂਰੇ ਏ.ਆਈ. (AI) ਉਦਯੋਗ ‘ਤੇ ਵੀ ਕੁਝ ਅਸਰ ਪਿਆ ਹੈ। ਇੱਕ ਪਾਸੇ, ਇਹ ਏ.ਆਈ. (AI) ਕੰਪਨੀਆਂ ਨੂੰ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਤਜ਼ਰਬਿਆਂ ‘ਤੇ ਵਧੇਰੇ ਧਿਆਨ ਦੇਣ ਅਤੇ ਵਧੇਰੇ ਪ੍ਰਚਾਰ ਅਤੇ ਝੂਠੇ ਪ੍ਰਚਾਰ ਤੋਂ ਬਚਣ ਦੀ ਯਾਦ ਦਿਵਾਉਂਦਾ ਹੈ। ਦੂਜੇ ਪਾਸੇ, ਇਹ ਏ.ਆਈ. (AI) ਖੇਤਰ ਦੇ ਪੇਸ਼ੇਵਰਾਂ ਨੂੰ ਏ.ਆਈ. (AI) ਮਾਡਲ ਮੁਲਾਂਕਣ ਮਾਪਦੰਡਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਸੁਧਾਰ ‘ਤੇ ਵਧੇਰੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਲਈ ਪ੍ਰੇਰਿਤ ਕਰਦਾ ਹੈ।

ਭਵਿੱਖ ਵਿੱਚ, ਏ.ਆਈ. (AI) ਤਕਨਾਲੋਜੀ ਦੇ ਨਿਰੰਤਰ ਵਿਕਾਸ ਦੇ ਨਾਲ, ਏ.ਆਈ. (AI) ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਲਗਾਤਾਰ ਸੁਧਾਰ ਹੋਵੇਗਾ, ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦਾ ਖੇਤਰ ਵੀ ਲਗਾਤਾਰ ਵਧਦਾ ਜਾਵੇਗਾ। ਸਾਨੂੰ ਏ.ਆਈ. (AI) ਤਕਨਾਲੋਜੀ ਨੂੰ ਵਧੇਰੇ ਤਰਕਸ਼ੀਲ ਅਤੇ ਨਿਰਪੱਖ ਢੰਗ ਨਾਲ ਦੇਖਣ ਦੀ ਲੋੜ ਹੈ। ਸਾਨੂੰ ਇਸਦੀ ਵੱਡੀ ਸੰਭਾਵਨਾ ਨੂੰ ਵੀ ਦੇਖਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਇਸਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਵੀ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਿਰਫ਼ ਇਸ ਤਰੀਕੇ ਨਾਲ ਅਸੀਂ ਏ.ਆਈ. (AI) ਤਕਨਾਲੋਜੀ ਦੀ ਬਿਹਤਰ ਵਰਤੋਂ ਕਰਕੇ ਮਨੁੱਖੀ ਸਮਾਜ ਲਈ ਮੁੱਲ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਾਂ।

ਸੰਖੇਪ ਵਿੱਚ, ਮਿਸਟਰਲ ਮੀਡੀਅਮ 3 (Mistral Medium 3) ਦਾ ਮਾਮਲਾ ਇੱਕ ਚੇਤਾਵਨੀ ਹੈ, ਜੋ ਸਾਨੂੰ ਏ.ਆਈ. (AI) ਮਾਡਲਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਸਮੇਂ ਆਲੋਚਨਾਤਮਕ ਸੋਚ ਰੱਖਣ ਅਤੇ ਅਧਿਕਾਰਤ ਪ੍ਰਚਾਰ ‘ਤੇ ਅੰਨ੍ਹੇਵਾਹ ਵਿਸ਼ਵਾਸ ਨਾ ਕਰਨ ਅਤੇ ਅਸਲ ਤਜ਼ਰਬਿਆਂ ਅਤੇ ਤੀਜੀ ਧਿਰ ਦੇ ਮੁਲਾਂਕਣਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਸਹੀ ਫੈਸਲਾ ਲੈਣ ਦੀ ਯਾਦ ਦਿਵਾਉਂਦਾ ਹੈ।

ਤੇ ਅੱਪਡੇਟ ਕੀਤਾ ਗਿਆ 2025-05-09

# AIGC # Llama # Mistral