மிஸ்ட்ரல் மீடியம் 3: ஐரோப்பாவின் AI கனவு

பிரெஞ்சு ஸ்டார்ட்அப் நிறுவனமான மிஸ்ட்ரல் AI சமீபத்தில் அதன் புதிய பல-மாதிரி மாடல் Mistral Medium 3 ஐ வெளியிட்டது, இது தொழில்துறையில் பரவலான கவனத்தை ஈர்த்துள்ளது. இந்த மாடல் Claude Sonnet 3.7 இன் 90% செயல்திறனை விட அதிகமாக இருக்கும் என்றும் DeepSeek V3 ஐ விட குறைவான செலவில் கிடைக்கும் என்றும் Mistral கூறுகிறது. இருப்பினும், உண்மையான சோதனை முடிவுகள் அதிகாரப்பூர்வ விளம்பரங்களுக்கு இடையே சில வேறுபாடுகளைக் காட்டுகின்றன, இது மாடலின் செயல்திறன் பற்றிய விவாதங்களைத் தூண்டியுள்ளது.

Mistral Medium 3 இன் முக்கிய சிறப்பம்சங்கள்

Mistral அதன் அதிகாரப்பூர்வ வலைப்பதிவில் Mistral Medium 3 இன் சில முக்கிய சிறப்பம்சங்களை பட்டியலிட்டுள்ளது:

  • செயல்திறன் மற்றும் செலவு சமநிலை: Mistral Medium 3 ஆனது சிறந்த செயல்திறனை வழங்கும் அதே நேரத்தில், செலவுகளை எட்டில் ஒரு பங்காகக் குறைத்து, நிறுவன பயன்பாடுகளை விரைவுபடுத்தும் வகையில் உருவாக்கப்பட்டுள்ளது.
  • தொழில்முறை பயன்பாடுகளில் சிறப்பான செயல்பாடு: இந்த மாடல் கோடிங் மற்றும் பல-மாதிரி புரிதல் போன்ற தொழில்முறை பயன்பாடுகளில் சிறப்பாக செயல்படுகிறது.
  • நிறுவன அளவிலான அம்சங்கள்: Mistral Medium 3 ஆனது ஹைப்ரிட் கிளவுட், லோக்கல் மற்றும் VPC உள் கட்டமைப்பில் நிறுவுதல், கஸ்டமைஸ் பயிற்சி மற்றும் நிறுவன கருவிகள் மற்றும் அமைப்புகளில் ஒருங்கிணைப்பு உள்ளிட்ட பல நிறுவன அளவிலான அம்சங்களை வழங்குகிறது.

Mistral Medium 3 API இப்போது Mistral La Plateforme மற்றும் Amazon Sagemaker இல் கிடைக்கிறது, மேலும் விரைவில் IBM WatsonX, NVIDIA NIM, Azure AI Foundry மற்றும் Google Cloud Vertex ஆகியவற்றிலும் கிடைக்கும்.

செயல்திறன் மற்றும் செலவு சமநிலை

Mistral Medium 3 இன் முக்கிய விற்பனை புள்ளிகளில் ஒன்று, இது சிறந்த செயல்திறனை வழங்கும் அதே நேரத்தில் செலவுகளைக் கணிசமாகக் குறைக்கிறது. அதிகாரப்பூர்வ தரவுகளின்படி, Mistral Medium 3 பல்வேறு அளவுகோல் சோதனைகளில் Claude Sonnet 3.7 இன் 90% செயல்திறனை எட்டியுள்ளது அல்லது அதைவிட அதிகமாக உள்ளது, ஆனால் செலவுகள் கணிசமாகக் குறைந்துள்ளன (ஒரு மில்லியன் டோக்கன்களுக்கு உள்ளீட்டுச் செலவு $0.4 மற்றும் வெளியீட்டுச் செலவு $2).

கூடுதலாக, Mistral Medium 3 Llama 4 Maverick மற்றும் Cohere Command A போன்ற முன்னணி ஓப்பன் சோர்ஸ் மாடல்களையும் விட சிறந்தது. API அல்லது சுயமாக நிறுவுதல் என எதுவாக இருந்தாலும், Mistral Medium 3 இன் செலவு DeepSeek V3 ஐ விடக் குறைவு.

Mistral Medium 3 நான்கு GPU கள் மற்றும் அதற்கு மேற்பட்ட சுய-ஹோஸ்டிங் சூழல்கள் உட்பட எந்த கிளவுடிலும் நிறுவப்படலாம், இது நிறுவனங்களுக்கு அதிக நெகிழ்வுத்தன்மையை வழங்குகிறது.

சிறந்த செயல்திறனுக்கான முயற்சி

Mistral Medium 3 கோடிங் மற்றும் STEM பணிகளில் சிறந்து விளங்க வேண்டும் என்றும், பெரிய மற்றும் மெதுவான போட்டியாளர்களை விட சிறந்த செயல்திறனை வழங்க வேண்டும் என்றும் Mistral கூறுகிறது.

Mistral வழங்கிய அட்டவணை Mistral Medium 3 இன் செயல்திறன் Llama 4 Maverick மற்றும் GPT-4o ஆகியவற்றை விட அதிகமாக உள்ளது, மேலும் Claude Sonnet 3.7 மற்றும் DeepSeek 3.1 இன் நிலையை நெருங்குகிறது என்பதைக் காட்டுகிறது. இருப்பினும், இந்தத் தரவு பெரும்பாலும் கல்வி அளவுகோல் சோதனைகளிலிருந்து வருகிறது, இது உண்மையான பயன்பாடுகளில் மாடலின் செயல்திறனை முழுமையாக பிரதிபலிக்காது.

மனித மதிப்பீட்டின் நிரப்பு

Mistral Medium 3 இன் செயல்திறனை முழுமையாக மதிப்பிடுவதற்கு, Mistral மூன்றாம் தரப்பு மனித மதிப்பீட்டு முடிவுகளையும் வெளியிட்டுள்ளது. மனித மதிப்பீடு உண்மையான பயன்பாட்டு நிகழ்வுகளை பிரதிபலிக்கிறது மற்றும் கல்வி அளவுகோல் சோதனைகளின் குறைபாடுகளை ஈடுசெய்ய முடியும்.

மனித மதிப்பீட்டு முடிவுகளின்படி, Mistral Medium 3 கோடிங் துறையில் சிறப்பாக செயல்படுகிறது, மேலும் மற்ற போட்டியாளர்களை விட சிறந்த செயல்திறனை வழங்குகிறது. இது Mistral Medium 3 உண்மையான பயன்பாடுகளில் சில நன்மைகளைக் கொண்டிருக்கலாம் என்பதைக் காட்டுகிறது.

நிறுவன பயன்பாடுகளுக்கான வடிவமைப்பு

Mistral Medium 3 மற்ற SOTA மாடல்களை விட நிறுவன சூழலுக்கு ஏற்றதாக உள்ளது. நிறுவனங்கள் API மூலம் சரிசெய்தல் அல்லது புதிதாக மாடல்களை உருவாக்கி, அவற்றை தங்கள் அமைப்புகளில் ஒருங்கிணைக்கும் கடினமான தேர்வை எதிர்கொள்ளும் போது, Mistral Medium 3 நிறுவன அமைப்புகளில் அறிவை முழுமையாக ஒருங்கிணைக்க ஒரு வழியை வழங்குகிறது.

நிறுவன தேவைகளை மேலும் பூர்த்தி செய்ய, Mistral Mistral Medium 3 மாடல் மூலம் இயக்கப்படும் Le Chat Enterprise ஐ அறிமுகப்படுத்தியுள்ளது, இது நிறுவனங்களுக்கான சாட்போட் சேவையாகும். Le Chat Enterprise ஆனது AI ஏஜென்ட் உருவாக்கும் கருவியை வழங்குகிறது மற்றும் Mistral இன் மாடல்களை Gmail, Google Drive மற்றும் SharePoint போன்ற மூன்றாம் தரப்பு சேவைகளுடன் ஒருங்கிணைக்கிறது, இது கருவிகளின் துண்டு துண்டான தன்மை, பாதுகாப்பற்ற அறிவு ஒருங்கிணைப்பு, விறைப்பான மாடல்கள் மற்றும் மெதுவான முதலீட்டு வருவாய் போன்ற நிறுவனங்கள் எதிர்கொள்ளும் AI சவால்களைத் தீர்க்கும் நோக்கம் கொண்டது.

Le Chat Enterprise விரைவில் MCP நெறிமுறையை ஆதரிக்கும், இது AI மற்றும் தரவு அமைப்புகள் மற்றும் மென்பொருளை இணைக்க Anthropic முன்மொழிந்த ஒரு தரமாகும்.

மிஸ்ட்ரலின் எதிர்கால பார்வை

Mistral தனது வலைப்பதிவில் Mistral Small மற்றும் Mistral Medium வெளியிடப்பட்டிருந்தாலும், அடுத்த சில வாரங்களில் Mistral Large என்ற "பெரிய" திட்டம் இருப்பதாக தெரிவித்துள்ளது. புதிதாக வெளியிடப்பட்ட Mistral Medium ஆனது Llama 4 Maverick போன்ற சிறந்த ஓப்பன் சோர்ஸ் மாடல்களை விட சிறப்பாக செயல்படுகிறது என்றும், Mistral Large இன் செயல்திறன் மிகவும் எதிர்பார்க்கத்தக்கது என்றும் அவர்கள் கூறுகின்றனர்.

Mistral Large இன் வெளியீடு AI துறையில் Mistral இன் போட்டியிடும் திறனை மேலும் அதிகரிக்கும் மற்றும் பயனர்களுக்கு அதிக தேர்வுகளை வழங்கும்.

உண்மையான சோதனை பின்னடைவு

Mistral Medium 3 இன் செயல்திறன் Claude Sonnet 3.7 இன் 90% ஐ விட அதிகமாக உள்ளது என்று Mistral உறுதியாகக் கூறினாலும், உண்மையான சோதனை முடிவுகள் சில சிக்கல்களை வெளிப்படுத்தியுள்ளன.

ஊடகங்கள் மற்றும் இணையவாசிகள் Mistral Medium 3 ஐ விரைவாக சோதனை செய்தனர், ஆனால் முடிவுகள் ஏமாற்றமளித்தன. நியூயார்க் டைம்ஸ் Connections பத்தி சொல் வகைப்பாடு கேள்விகளின் அடிப்படையில் மதிப்பீட்டில், Medium 3 கடைசி இடத்தில் இருந்தது. புதிய 100 கேள்வி மதிப்பீட்டில், அது முன்னணி மாடல்களில் இடம் பெறவில்லை.

Medium 3 ஐ சோதித்த பயனர்கள் அதன் எழுதும் திறன் அப்படியே உள்ளது என்றும் குறிப்பிடத்தக்க முன்னேற்றம் எதுவும் இல்லை என்றும் தெரிவித்தனர். இருப்பினும், LLM மதிப்பீட்டில் இது பரேட்டோ முன்னணியில் இருந்தது.

Zhu Liang இன் சோதனை முடிவுகள் Mistral Medium 3 கோடிங் மற்றும் உரை உருவாக்கம் இரண்டிலும் நன்றாக செயல்படுகிறது என்பதைக் காட்டுகின்றன, மேலும் இந்த இரண்டு மதிப்பீடுகளிலும் முதல் ஐந்து இடங்களில் உள்ளது.

எளிய கோடிங் பணிகளில் (Next.js TODO பயன்பாடு):

  • இது தெளிவான பதில்களை உருவாக்கியது
  • மதிப்பீடு Gemini 2.5 Pro, Claude 3.5 Sonnet க்கு அருகில் இருந்தது
  • DeepSeek V3 (புதியது) மற்றும் GPT-4.1 ஐ விடக் குறைவு

சிக்கலான கோடிங் பணிகளில் (அடிப்படை சோதனை காட்சிப்படுத்தல்):

  • Gemini 2.5 Pro மற்றும் DeepSeek V3 (புதியது) க்கு ஒத்த சராசரி முடிவுகளை உருவாக்கியது.
  • GPT-4.1, o3 மற்றும் Claude 3.7 Sonnet ஐ விடக் குறைவு

எழுதுவதில்:

  • இது பெரும்பாலான முக்கிய புள்ளிகளை உள்ளடக்கியது, ஆனால் வடிவம் சரியில்லை
  • மதிப்பீடு DeepSeek V3 (புதியது) மற்றும் Claude 3.7 Sonnet க்கு அருகில் இருந்தது.
  • GPT-4.1 மற்றும் Gemini 2.5 Pro ஐ விடக் குறைவு

பிரபலமான “karminski-பல் மருத்துவர்” சோதனைக்குப் பிறகு, Mistral Medium 3 இன் செயல்திறன் அதிகாரப்பூர்வமாக விளம்பரப்படுத்தப்பட்ட அளவுக்கு சக்தி வாய்ந்ததாக இல்லை என்றும், பயனர்கள் அதை பதிவிறக்கம் செய்ய வேண்டாம் என்றும், இல்லையெனில் ட்ராஃபிக் மற்றும் வன் தட்டு இடத்தை வீணடிக்கலாம் என்றும் பரிந்துரைத்தார்.

முடிவு

Mistral Medium 3 ஐரோப்பிய AI துறையில் ஒரு புதுமையான முயற்சி ஆகும், இது செயல்திறன் மற்றும் செலவு ஆகியவற்றுக்கு இடையே சமநிலையை நாடுகிறது, மேலும் நிறுவன பயன்பாடுகளுக்கு உகந்ததாக உள்ளது. இருப்பினும், உண்மையான சோதனை முடிவுகள் அதிகாரப்பூர்வ விளம்பரங்களுக்கு இடையே சில வேறுபாடுகளைக் காட்டுகின்றன, இது மாடல் செயல்திறன் குறித்து Mistral மிகைப்படுத்தப்பட்ட விளம்பரம் செய்திருக்கலாம் என்பதைக் குறிக்கிறது.

இருப்பினும், Mistral Medium 3 இன்னும் சில திறன்களைக் கொண்டுள்ளது, குறிப்பாக கோடிங் மற்றும் உரை உருவாக்கம் போன்ற துறைகளில். எதிர்காலத்தில் Mistral மாடல் செயல்திறனை மேலும் மேம்படுத்த வேண்டும் மற்றும் பயனர்களின் நம்பிக்கையைப் பெற உண்மையான பயன்பாட்டு சோதனைகளை வலுப்படுத்த வேண்டும். அதே நேரத்தில் Mistral Large வெளியீடும் எதிர்பார்க்கத்தக்கது, இது Mistral Medium 3 இன் குறைபாடுகளை ஈடுசெய்து பயனர்களுக்கு சிறந்த அனுபவத்தை அளிக்கும்.

மொத்தத்தில் Mistral Medium 3 இன் வெளியீடு ஐரோப்பிய AI துறையில் தீவிரமான ஆய்வு மற்றும் புதுமை உணர்வைக் காட்டுகிறது. உண்மையான செயல்திறன் எதிர்பார்ப்புகளுக்கு ஏற்றதாக இல்லாவிட்டாலும், Mistral இன்னும் கவனிக்கத்தக்கது, மேலும் அதன் எதிர்கால வளர்ச்சி எதிர்பார்க்கத்தக்கது.