Mistral Medium 3: ਯੂਰਪ ਦੀ AI ਭਵਿੱਖ? | pa

ਫਰਾਂਸ ਦੀ ਸਟਾਰਟਅੱਪ ਕੰਪਨੀ Mistral AI ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਆਪਣਾ ਨਵੀਨਤਮ ਮਲਟੀਮੋਡਲ ਮਾਡਲ Mistral Medium 3 ਜਾਰੀ ਕੀਤਾ ਹੈ, ਜਿਸਨੇ ਉਦਯੋਗ ਵਿੱਚ ਵਿਆਪਕ ਧਿਆਨ ਖਿੱਚਿਆ ਹੈ। Mistral ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਸ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ Claude Sonnet 3.7 ਦੇ 90% ਦੇ ਬਰਾਬਰ ਜਾਂ ਇਸ ਤੋਂ ਵੀ ਵੱਧ ਹੈ, ਜਦੋਂ ਕਿ ਇਸਦੀ ਕੀਮਤ DeepSeek V3 ਤੋਂ ਘੱਟ ਹੈ, ਇਸ ਲਈ ਇਹ ਇੱਕ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਵਿਕਲਪ ਹੈ। ਹਾਲਾਂਕਿ, ਅਸਲ ਟੈਸਟ ਦੇ ਨਤੀਜੇ ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ ਕੀਤੇ ਗਏ ਪ੍ਰਚਾਰ ਤੋਂ ਕੁਝ ਵੱਖਰੇ ਹਨ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੀ ਅਸਲੀਅਤ ਬਾਰੇ ਵਿਚਾਰ ਵਟਾਂਦਰੇ ਸ਼ੁਰੂ ਹੋ ਗਏ ਹਨ।

Mistral Medium 3 ਦੀਆਂ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ

Mistral ਨੇ ਆਪਣੇ ਅਧਿਕਾਰਤ ਬਲੌਗ ਵਿੱਚ Mistral Medium 3 ਦੀਆਂ ਕਈ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਜ਼ਿਕਰ ਕੀਤਾ ਹੈ:

ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਕੀਮਤ ਵਿੱਚ ਸੰਤੁਲਨ: Mistral Medium 3 ਦਾ ਉਦੇਸ਼ ਉੱਚ ਪੱਧਰੀ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਨਾਲ-ਨਾਲ ਕੀਮਤ ਨੂੰ ਅੱਠਵੇਂ ਹਿੱਸੇ ਤੱਕ ਘਟਾਉਣਾ ਅਤੇ ਤੈਨਾਤੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਰਲ ਬਣਾਉਣਾ ਹੈ, ਤਾਂ ਜੋ ਕਾਰੋਬਾਰੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ ਜਾ ਸਕੇ।
ਪੇਸ਼ੇਵਰ ਐਪਲੀਕੇਸ਼ਨ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ: ਇਹ ਮਾਡਲ ਕੋਡ ਲਿਖਣ ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਮਝ ਵਰਗੇ ਪੇਸ਼ੇਵਰ ਐਪਲੀਕੇਸ਼ਨ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
ਕਾਰੋਬਾਰੀ-ਪੱਧਰ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ: Mistral Medium 3 ਕਾਰੋਬਾਰੀ-ਪੱਧਰ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਇੱਕ ਲੜੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ ਤੈਨਾਤੀ, ਸਥਾਨਕ ਤੈਨਾਤੀ ਅਤੇ VPC ਦੇ ਅੰਦਰ ਤੈਨਾਤੀ, ਅਨੁਕੂਲਿਤ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ, ਅਤੇ ਕਾਰੋਬਾਰੀ ਟੂਲ ਅਤੇ ਸਿਸਟਮਾਂ ਵਿੱਚ ਏਕੀਕਰਣ ਸ਼ਾਮਲ ਹਨ।

Mistral Medium 3 API ਹੁਣ Mistral La Plateforme ਅਤੇ Amazon Sagemaker ‘ਤੇ ਉਪਲਬਧ ਹੈ, ਅਤੇ ਜਲਦੀ ਹੀ IBM WatsonX, NVIDIA NIM, Azure AI Foundry ਅਤੇ Google Cloud Vertex ‘ਤੇ ਵੀ ਉਪਲਬਧ ਹੋਵੇਗਾ।

ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਕੀਮਤ ਦਾ ਆਦਾਨ-ਪ੍ਰਦਾਨ

Mistral Medium 3 ਦੀ ਇੱਕ ਵੱਡੀ ਵਿਸ਼ੇਸ਼ਤਾ ਇਹ ਹੈ ਕਿ ਇਹ ਉੱਚ ਪੱਧਰੀ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਦਾਨ ਕਰਨ ਦੇ ਨਾਲ-ਨਾਲ ਕੀਮਤ ਵਿੱਚ ਵੀ ਵੱਡੀ ਕਟੌਤੀ ਕਰਦਾ ਹੈ। ਅਧਿਕਾਰਤ ਅੰਕੜਿਆਂ ਅਨੁਸਾਰ, ਵੱਖ-ਵੱਖ ਬੈਂਚਮਾਰਕ ਟੈਸਟਾਂ ਵਿੱਚ, Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ Claude Sonnet 3.7 ਦੇ 90% ਤੱਕ ਪਹੁੰਚਦੀ ਹੈ ਜਾਂ ਇਸ ਤੋਂ ਵੀ ਵੱਧ ਜਾਂਦੀ ਹੈ, ਪਰ ਕੀਮਤ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਕਮੀ ਆਈ ਹੈ (ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਟੋਕਨਾਂ ਦੀ ਇਨਪੁਟ ਕੀਮਤ $0.4 ਹੈ, ਅਤੇ ਆਉਟਪੁੱਟ ਕੀਮਤ $2 ਹੈ)।

ਇਸ ਤੋਂ ਇਲਾਵਾ, Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ Llama 4 Maverick ਅਤੇ Cohere Command A ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਓਪਨ ਸੋਰਸ ਮਾਡਲਾਂ ਤੋਂ ਵੀ ਵੱਧ ਹੈ। ਭਾਵੇਂ ਇਹ API ਹੋਵੇ ਜਾਂ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਤੈਨਾਤ ਕੀਤਾ ਗਿਆ ਹੋਵੇ, Mistral Medium 3 ਦੀ ਕੀਮਤ DeepSeek V3 ਤੋਂ ਘੱਟ ਹੈ।

Mistral Medium 3 ਨੂੰ ਕਿਸੇ ਵੀ ਕਲਾਉਡ ‘ਤੇ ਤੈਨਾਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਚਾਰ GPU ਜਾਂ ਇਸ ਤੋਂ ਵੱਧ ਵਾਲੇ ਸਵੈ-ਹੋਸਟ ਕੀਤੇ ਵਾਤਾਵਰਣ ਵੀ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਵਧੇਰੇ ਲਚਕਤਾ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।

ਉੱਚ ਪੱਧਰੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੀ ਭਾਲ

Mistral ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ Mistral Medium 3 ਦਾ ਉਦੇਸ਼ ਇੱਕ ਉੱਚ ਪੱਧਰੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਾਲਾ ਮਾਡਲ ਬਣਨਾ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਕੋਡਿੰਗ ਅਤੇ STEM ਕੰਮਾਂ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ, ਅਤੇ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਉਹਨਾਂ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਦੇ ਨੇੜੇ ਹੈ ਜੋ ਵੱਡੇ ਅਤੇ ਹੌਲੀ ਹਨ।

Mistral ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੀ ਗਈ ਸਾਰਣੀ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਲਗਭਗ Llama 4 Maverick ਅਤੇ GPT-4o ਤੋਂ ਵੱਧ ਗਈ ਹੈ, ਅਤੇ Claude Sonnet 3.7 ਅਤੇ DeepSeek 3.1 ਦੇ ਪੱਧਰ ਦੇ ਨੇੜੇ ਹੈ। ਹਾਲਾਂਕਿ, ਇਹ ਡੇਟਾ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਅਕਾਦਮਿਕ ਬੈਂਚਮਾਰਕ ਟੈਸਟਾਂ ਤੋਂ ਆਉਂਦਾ ਹੈ, ਜੋ ਅਸਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਦਰਸਾਉਣ ਵਿੱਚ ਅਸਮਰੱਥ ਹੋ ਸਕਦਾ ਹੈ।

ਮਨੁੱਖੀ ਮੁਲਾਂਕਣ ਦੀ ਪੂਰਤੀ

Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਵਧੇਰੇ ਵਿਆਪਕ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ, Mistral ਨੇ ਤੀਜੀ ਧਿਰ ਦੇ ਮਨੁੱਖੀ ਮੁਲਾਂਕਣ ਨਤੀਜੇ ਵੀ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤੇ। ਮਨੁੱਖੀ ਮੁਲਾਂਕਣ ਅਸਲ ਸੰਸਾਰ ਦੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਦਰਸਾਉਂਦਾ ਹੈ, ਅਤੇ ਅਕਾਦਮਿਕ ਬੈਂਚਮਾਰਕ ਟੈਸਟਾਂ ਦੀਆਂ ਕਮੀਆਂ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦਾ ਹੈ।

ਮਨੁੱਖੀ ਮੁਲਾਂਕਣ ਨਤੀਜਿਆਂ ਤੋਂ, Mistral Medium 3 ਕੋਡਿੰਗ ਦੇ ਖੇਤਰ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਹਰ ਪਹਿਲੂ ਵਿੱਚ ਦੂਜੇ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨਾਲੋਂ ਬਿਹਤਰ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ Mistral Medium 3 ਵਿੱਚ ਅਸਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਕੁਝ ਫਾਇਦੇ ਹੋ ਸਕਦੇ ਹਨ।

ਕਾਰੋਬਾਰੀ-ਪੱਧਰ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਡਿਜ਼ਾਈਨ

Mistral Medium 3 ਕਾਰੋਬਾਰੀ ਵਾਤਾਵਰਣ ਨੂੰ ਅਨੁਕੂਲ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਦੂਜੇ SOTA ਮਾਡਲਾਂ ਤੋਂ ਬਿਹਤਰ ਹੈ। ਜਦੋਂ ਕਾਰੋਬਾਰਾਂ ਨੂੰ API ਦੁਆਰਾ ਵਧੀਆਟਿਊਨਿੰਗ ਕਰਨ ਜਾਂ ਸ਼ੁਰੂ ਤੋਂ ਆਪਣੇ ਆਪ ਤੈਨਾਤ ਕਰਨ ਅਤੇ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਨ ਦੇ ਮੁਸ਼ਕਲ ਵਿਕਲਪਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ, ਤਾਂ Mistral Medium 3 ਕਾਰੋਬਾਰੀ ਸਿਸਟਮਾਂ ਵਿੱਚ ਬੁੱਧੀ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦਾ ਇੱਕ ਤਰੀਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਕਾਰੋਬਾਰੀ ਲੋੜਾਂ ਨੂੰ ਹੋਰ ਪੂਰਾ ਕਰਨ ਲਈ, Mistral ਨੇ Mistral Medium 3 ਮਾਡਲ ਦੁਆਰਾ ਸੰਚਾਲਿਤ Le Chat Enterprise ਵੀ ਲਾਂਚ ਕੀਤਾ, ਜੋ ਕਿ ਕਾਰੋਬਾਰਾਂ ਲਈ ਇੱਕ ਚੈਟਬੋਟ ਸੇਵਾ ਹੈ। Le Chat Enterprise ਇੱਕ AI ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਨਿਰਮਾਣ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਅਤੇ Mistral ਦੇ ਮਾਡਲ ਨੂੰ Gmail, Google Drive ਅਤੇ SharePoint ਵਰਗੀਆਂ ਤੀਜੀ ਧਿਰ ਦੀਆਂ ਸੇਵਾਵਾਂ ਨਾਲ ਜੋੜਦਾ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਕਾਰੋਬਾਰਾਂ ਦੁਆਰਾ ਦਰਪੇਸ਼ AI ਚੁਣੌਤੀਆਂ ਨੂੰ ਹੱਲ ਕਰਨਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਟੂਲ ਖੰਡਨ, ਅਸੁਰੱਖਿਅਤ ਗਿਆਨ ਏਕੀਕਰਣ, ਸਖ਼ਤ ਮਾਡਲ ਅਤੇ ਹੌਲੀ ਨਿਵੇਸ਼ ‘ਤੇ ਰਿਟਰਨ, ਸਾਰੇ ਸੰਗਠਨਾਤਮਕ ਕੰਮ ਲਈ ਇੱਕ ਯੂਨੀਫਾਈਡ AI ਪਲੇਟਫਾਰਮ ਪ੍ਰਦਾਨ ਕਰਨਾ।

Le Chat Enterprise ਜਲਦੀ ਹੀ MCP ਪ੍ਰੋਟੋਕੋਲ ਦਾ ਸਮਰਥਨ ਕਰੇਗਾ, ਜੋ ਕਿ Anthropic ਦੁਆਰਾ AI ਨੂੰ ਡੇਟਾ ਸਿਸਟਮਾਂ ਅਤੇ ਸੌਫਟਵੇਅਰ ਨਾਲ ਜੋੜਨ ਲਈ ਪ੍ਰਸਤਾਵਿਤ ਇੱਕ ਮਿਆਰ ਹੈ।

Mistral ਦਾ ਭਵਿੱਖੀ ਦ੍ਰਿਸ਼ਟੀਕੋਣ

Mistral ਨੇ ਬਲੌਗ ਵਿੱਚ ਦੱਸਿਆ ਕਿ ਭਾਵੇਂ Mistral Small ਅਤੇ Mistral Medium ਪਹਿਲਾਂ ਹੀ ਜਾਰੀ ਕੀਤੇ ਜਾ ਚੁੱਕੇ ਹਨ, ਪਰ ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਵਿੱਚ, ਉਹਨਾਂ ਦੀ ਇੱਕ "ਵੱਡੀ" ਯੋਜਨਾ ਹੈ, ਜੋ ਕਿ Mistral Large ਹੈ। ਉਹਨਾਂ ਨੇ ਕਿਹਾ ਕਿ ਹੁਣੇ ਹੀ ਜਾਰੀ ਕੀਤਾ ਗਿਆ Mistral Medium Llama 4 Maverick ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਓਪਨ ਸੋਰਸ ਮਾਡਲਾਂ ਤੋਂ ਬਹੁਤ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਅਤੇ Mistral Large ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਹੋਰ ਵੀ ਉਮੀਦ ਭਰੀ ਹੈ।

Mistral Large ਦੀ ਰਿਲੀਜ਼ ਬਿਨਾਂ ਸ਼ੱਕ AI ਦੇ ਖੇਤਰ ਵਿੱਚ Mistral ਦੀ ਪ੍ਰਤੀਯੋਗੀਤਾ ਨੂੰ ਹੋਰ ਵਧਾਏਗੀ, ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਵਧੇਰੇ ਵਿਕਲਪ ਪ੍ਰਦਾਨ ਕਰੇਗੀ।

ਅਸਲ ਟੈਸਟ ਵਿੱਚ ਗਿਰਾਵਟ

ਭਾਵੇਂ Mistral ਨੂੰ Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ‘ਤੇ ਪੂਰਾ ਭਰੋਸਾ ਹੈ, ਅਤੇ ਦਾਅਵਾ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਇਸਨੇ Claude Sonnet 3.7 ਦੇ 90% ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਪਰ ਅਸਲ ਟੈਸਟ ਦੇ ਨਤੀਜਿਆਂ ਨੇ ਕੁਝ ਸਮੱਸਿਆਵਾਂ ਜ਼ਾਹਰ ਕੀਤੀਆਂ ਹਨ।

ਮੀਡੀਆ ਅਤੇ ਨੈਟੀਜ਼ਨਾਂ ਨੇ ਜਲਦੀ ਹੀ Mistral Medium 3 ‘ਤੇ ਅਸਲ ਟੈਸਟ ਸ਼ੁਰੂ ਕੀਤੇ, ਪਰ ਨਤੀਜੇ ਨਿਰਾਸ਼ਾਜਨਕ ਸਨ। "ਨਿਊਯਾਰਕ ਟਾਈਮਜ਼" ਕਨੈਕਸ਼ਨ ਕਾਲਮ ਸ਼ਬਦਾਵਲੀ ਵਰਗੀਕਰਣ ਸਵਾਲਾਂ ‘ਤੇ ਆਧਾਰਿਤ ਮੁਲਾਂਕਣ ਵਿੱਚ, Medium 3 ਸਭ ਤੋਂ ਹੇਠਲੇ ਸਥਾਨ ‘ਤੇ ਹੈ, ਅਤੇ ਇਸਨੂੰ ਲੱਭਣਾ ਵੀ ਮੁਸ਼ਕਲ ਹੈ। ਨਵੇਂ 100 ਸਵਾਲਾਂ ਦੇ ਮੁਲਾਂਕਣ ਵਿੱਚ, ਇਹ ਫਰੰਟ ਰੋਅ ਮਾਡਲਾਂ ਵਿੱਚ ਵੀ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ।

ਕੁਝ ਉਪਭੋਗਤਾਵਾਂ ਨੇ Medium 3 ਦੀ ਜਾਂਚ ਕਰਨ ਤੋਂ ਬਾਅਦ ਕਿਹਾ ਕਿ ਇਸਦੀ ਲਿਖਣ ਦੀ ਸਮਰੱਥਾ ਅਜੇ ਵੀ ਪਹਿਲਾਂ ਵਰਗੀ ਹੀ ਹੈ, ਅਤੇ ਇਸ ਵਿੱਚ ਕੋਈ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਨਹੀਂ ਹੋਇਆ ਹੈ। ਹਾਲਾਂਕਿ, LLM ਮੁਲਾਂਕਣ ਵਿੱਚ, ਇਹ ਪੈਰੇਟੋ ਫਰੰਟੀਅਰ ‘ਤੇ ਹੈ।

Zhu Liang ਦੇ ਟੈਸਟ ਦੇ ਨਤੀਜੇ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ Mistral Medium 3 ਕੋਡ ਲਿਖਣ ਅਤੇ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਦੋਵਾਂ ਵਿੱਚ ਠੋਸ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਇਹ ਦੋਵੇਂ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਚੋਟੀ ਦੇ ਪੰਜ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ।

ਸਧਾਰਨ ਕੋਡਿੰਗ ਕੰਮ (Next.js TODO ਐਪਲੀਕੇਸ਼ਨ) ਵਿੱਚ:

ਇਸਨੇ ਸੰਖੇਪ ਅਤੇ ਸਪਸ਼ਟ ਜਵਾਬ ਦਿੱਤੇ
ਸਕੋਰ Gemini 2.5 Pro, Claude 3.5 Sonnet ਦੇ ਲਗਭਗ ਬਰਾਬਰ ਸੀ
DeepSeek V3 (ਨਵਾਂ) ਅਤੇ GPT-4.1 ਤੋਂ ਘੱਟ

ਜਟਿਲ ਕੋਡਿੰਗ ਕੰਮ (ਬੈਂਚਮਾਰਕ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ) ਵਿੱਚ:

ਪੈਦਾ ਹੋਏ ਔਸਤ ਨਤੀਜੇ Gemini 2.5 Pro ਅਤੇ DeepSeek V3 (ਨਵਾਂ) ਦੇ ਸਮਾਨ ਸਨ
GPT-4.1, o3 ਅਤੇ Claude 3.7 Sonnet ਤੋਂ ਘੱਟ

ਲਿਖਣ ਵਿੱਚ:

ਇਸਦੀ ਸਮੱਗਰੀ ਨੇ ਜ਼ਿਆਦਾਤਰ ਮੁੱਖ ਨੁਕਤਿਆਂ ਨੂੰ ਕਵਰ ਕੀਤਾ, ਪਰ ਫਾਰਮੈਟ ਗਲਤ ਸੀ
ਸਕੋਰ DeepSeek V3 (ਨਵਾਂ) ਅਤੇ Claude 3.7 Sonnet ਦੇ ਸਮਾਨ ਸੀ
GPT-4.1 ਅਤੇ Gemini 2.5 Pro ਤੋਂ ਘੱਟ

ਜਾਣੇ-ਪਛਾਣੇ ਵੱਡੇ ਨਾਮ "karminski-ਦੰਦਾਂ ਦਾ ਡਾਕਟਰ" ਨੇ ਅਸਲ ਵਿੱਚ ਜਾਂਚ ਕਰਨ ਤੋਂ ਬਾਅਦ ਪਾਇਆ ਕਿ Mistral Medium 3 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਉਨੀ ਮਜ਼ਬੂਤ ਨਹੀਂ ਹੈ ਜਿੰਨੀ ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ ਦੱਸੀ ਗਈ ਹੈ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਡਾਊਨਲੋਡ ਨਾ ਕਰਨ ਦੀ ਸਲਾਹ ਦਿੱਤੀ, ਤਾਂ ਜੋ ਟ੍ਰੈਫਿਕ ਅਤੇ ਹਾਰਡ ਡਿਸਕ ਸਪੇਸ ਨੂੰ ਬਰਬਾਦ ਹੋਣ ਤੋਂ ਬਚਾਇਆ ਜਾ ਸਕੇ।

ਸਿੱਟਾ

Mistral Medium 3, ਯੂਰਪੀ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਨਵੀਨਤਾਕਾਰੀ ਕੋਸ਼ਿਸ਼ ਵਜੋਂ, ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਕੀਮਤ ਵਿੱਚ ਸੰਤੁਲਨ ਬਣਾਉਂਦਾ ਹੈ, ਅਤੇ ਕਾਰੋਬਾਰੀ-ਪੱਧਰ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਗਿਆ ਹੈ। ਹਾਲਾਂਕਿ, ਅਸਲ ਟੈਸਟ ਦੇ ਨਤੀਜੇ ਅਧਿਕਾਰਤ ਪ੍ਰਚਾਰ ਤੋਂ ਕੁਝ ਵੱਖਰੇ ਹਨ, ਜੋ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ Mistral ਨੇ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਪ੍ਰਚਾਰ ਨੂੰ ਵਧਾ-ਚੜ੍ਹਾ ਕੇ ਪੇਸ਼ ਕੀਤਾ ਹੋ ਸਕਦਾ ਹੈ।

ਇਸਦੇ ਬਾਵਜੂਦ, Mistral Medium 3 ਵਿੱਚ ਅਜੇ ਵੀ ਕੁਝ ਸੰਭਾਵਨਾਵਾਂ ਹਨ, ਖਾਸ ਕਰਕੇ ਕੋਡਿੰਗ ਅਤੇ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ। ਭਵਿੱਖ ਵਿੱਚ, Mistral ਨੂੰ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਹੋਰ ਬਿਹਤਰ ਬਣਾਉਣ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਦਾ ਵਿਸ਼ਵਾਸ ਹਾਸਲ ਕਰਨ ਲਈ ਅਸਲ ਐਪਲੀਕੇਸ਼ਨ ਟੈਸਟਿੰਗ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਦੀ ਲੋੜ ਹੈ। ਇਸਦੇ ਨਾਲ ਹੀ, Mistral Large ਦੀ ਰਿਲੀਜ਼ ਵੀ ਉਮੀਦ ਭਰੀ ਹੈ, ਸ਼ਾਇਦ ਇਹ Mistral Medium 3 ਦੀਆਂ ਕਮੀਆਂ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦੀ ਹੈ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਬਿਹਤਰ ਅਨੁਭਵ ਲਿਆ ਸਕਦੀ ਹੈ।

ਸੰਖੇਪ ਵਿੱਚ, Mistral Medium 3 ਦੀ ਰਿਲੀਜ਼ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਯੂਰਪ ਦੀ ਸਰਗਰਮ ਖੋਜ ਅਤੇ ਨਵੀਨਤਾਕਾਰੀ ਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਭਾਵੇਂ ਅਸਲ ਕਾਰਗੁਜ਼ਾਰੀ ਉਮੀਦਾਂ ਤੋਂ ਘੱਟ ਹੈ, ਪਰ Mistral ਅਜੇ ਵੀ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ, ਅਤੇ ਇਸਦਾ ਭਵਿੱਖੀ ਵਿਕਾਸ ਉਮੀਦ ਭਰਿਆ ਹੈ।

ਤੇ ਅੱਪਡੇਟ ਕੀਤਾ ਗਿਆ 2025-05-09

# LLM # Llama # Mistral