फ्रेंच स्टार्टअप मिस्ट्रल एआय (Mistral AI) ने नुकतेच आपले नवीन मल्टीमॉडल मॉडेल मिस्ट्रल मीडियम 3 (Mistral Medium 3) लाँच केले आहे, ज्यामुळे उद्योगात बरीच चर्चा सुरू झाली आहे. मिस्ट्रलचा दावा आहे की या मॉडेलची कार्यक्षमता Claude Sonnet 3.7 च्या 90% पर्यंत आहे आणि DeepSeek V3 पेक्षा कमी खर्चिक आहे. त्यामुळे हे मॉडेल उत्तम पर्याय आहे, असा दावा करण्यात आला आहे. तथापि, प्रत्यक्ष चाचणीचे निकाल आणि कंपनीच्या दाव्यांमध्ये काही फरक आढळला आहे, ज्यामुळे मॉडेलच्या वास्तविक कार्यक्षमतेबद्दल प्रश्न निर्माण झाले आहेत.
मिस्ट्रल मीडियम 3 ची मुख्य वैशिष्ट्ये
मिस्ट्रलने आपल्या अधिकृत ब्लॉगमध्ये मिस्ट्रल मीडियम 3 ची काही मुख्य वैशिष्ट्ये नमूद केली आहेत:
- कार्यक्षमता आणि खर्चात संतुलन: मिस्ट्रल मीडियम 3 चा उद्देश उच्च कार्यक्षमता प्रदान करणे आणि त्याच वेळी खर्च आठपट कमी करणे आहे. तसेच, ते वापरण्याची प्रक्रिया सोपी करणे, ज्यामुळे कॉर्पोरेट ॲप्लिकेशन्सचा वेग वाढेल.
- व्यावसायिक उपयोगात उत्कृष्ट: हे मॉडेल कोडिंग (coding) आणि मल्टीमॉडल आकलन (multimodal understanding) यांसारख्या व्यावसायिक उपयोगांमध्ये प्रभावी आहे.
- एंटरप्राइझ-स्तरीय वैशिष्ट्ये: मिस्ट्रल मीडियम 3 अनेक एंटरप्राइझ-स्तरीय वैशिष्ट्ये पुरवते, ज्यात हायब्रिड क्लाउड (hybrid cloud)Deployment, लोकल (local) Deployment आणि VPC अंतर्गत Deployment, कस्टमाइज्ड (customized) पोस्ट-ट्रेनिंग (post-training), आणि एंटरप्राइझ टूल्स (enterprise tools) आणि सिस्टीममध्ये इंटिग्रेशन (integration) यांचा समावेश आहे.
मिस्ट्रल मीडियम 3 API आता मिस्ट्रल ला प्लॅटफॉर्म (Mistral La Plateforme) आणि ॲमेझॉन सेजमेकर (Amazon Sagemaker) वर उपलब्ध आहे आणि लवकरच IBM वॉटसनएक्स (IBM WatsonX), NVIDIA NIM, Azure AI Foundry आणि Google Cloud Vertex वर देखील उपलब्ध होईल.
कार्यक्षमता आणि खर्चाचा ताळमेळ
मिस्ट्रल मीडियम 3 चा महत्त्वाचा मुद्दा म्हणजे ते आधुनिक कार्यक्षमता देताना खर्चात मोठी कपात करते. अधिकृत आकडेवारीनुसार, मिस्ट्रल मीडियम 3 ची कार्यक्षमता Claude Sonnet 3.7 च्या 90% पर्यंत आहे किंवा त्याहून अधिक आहे, परंतु खर्च लक्षणीयरीत्या कमी आहे (प्रति दशलक्ष टोकन (token) इनपुट (input) खर्च $0.4 आणि आउटपुट (output) खर्च $2 आहे).
याव्यतिरिक्त, मिस्ट्रल मीडियम 3 ची कार्यक्षमता Llama 4 Maverick आणि Cohere Command A सारख्या आघाडीच्या ओपन-सोर्स मॉडेलपेक्षा (open-source model) जास्त आहे. API किंवा सेल्फ-डिप्लॉयमेंट (self-deployment) दोन्हीमध्ये मिस्ट्रल मीडियम 3 चा खर्च DeepSeek V3 पेक्षा कमी आहे.
मिस्ट्रल मीडियम 3 कोणत्याही क्लाउडवर (cloud) डिप्लॉय (deploy) केले जाऊ शकते, ज्यात चार GPU किंवा त्याहून अधिक असलेले सेल्फ-होस्टेड (self-hosted) वातावरण समाविष्ट आहे, जे कंपन्यांना अधिक लवचिकता प्रदान करते.
उत्कृष्ट कार्यक्षमतेचा ध्यास
मिस्ट्रलचा दावा आहे की मिस्ट्रल मीडियम 3 चे उद्दिष्ट सर्वोत्तम कार्यक्षमतेचे मॉडेल बनणे आहे, विशेषतः कोडिंग (coding) आणि STEM (विज्ञान, तंत्रज्ञान, अभियांत्रिकी आणि गणित) कार्यांमध्ये ते उत्कृष्ट आहे. तसेच, ते मोठ्या आणि धीम्या प्रतिस्पर्धकांना टक्कर देते.
मिस्ट्रलने दिलेल्या माहितीनुसार, मिस्ट्रल मीडियम 3 ची कार्यक्षमता Llama 4 Maverick आणि GPT-4o पेक्षा अधिक आहे आणि Claude Sonnet 3.7 आणि DeepSeek 3.1 च्या जवळपास आहे. तथापि, ही आकडेवारी शैक्षणिक बेंचमार्क चाचण्यांवर आधारित आहे, जी मॉडेलच्या प्रत्यक्ष वापराचे पूर्णपणे प्रतिनिधित्व करत नाही.
मानवी मूल्यांकनाची जोड
मिस्ट्रल मीडियम 3 च्या कार्यक्षमतेचे अधिक व्यापक मूल्यांकन करण्यासाठी, मिस्ट्रलने तृतीय-पक्षाच्या मानवी मूल्यांकनाचे निकाल देखील प्रकाशित केले. मानवी मूल्यांकन वास्तविक जगातील वापराचे अधिक चांगले प्रतिनिधित्व करते आणि शैक्षणिक बेंचमार्क चाचण्यांमधील त्रुटी सुधारते.
मानवी मूल्यांकनाच्या निकालांवरून असे दिसून येते की मिस्ट्रल मीडियम 3 कोडिंगमध्ये उत्कृष्ट आहे आणि इतर प्रतिस्पर्धकांच्या तुलनेत चांगली कार्यक्षमता देते. हे दर्शवते की मिस्ट्रल मीडियम 3 मध्ये प्रत्यक्ष उपयोगात काही प्रमाणात फायदा होण्याची शक्यता आहे.
एंटरप्राइझ ॲप्लिकेशन्ससाठी डिझाइन
मिस्ट्रल मीडियम 3 मध्ये इतर SOTA (State of the Art) मॉडेलच्या तुलनेत एंटरप्राइझ वातावरणाशी जुळवून घेण्याची क्षमता अधिक आहे. API द्वारे फाइन-ट्यूनिंग (fine-tuning) करणे किंवा सुरवातीपासून मॉडेल तयार करणे आणि त्याचे वर्तन सानुकूलित करणे यांसारख्या कठीण परिस्थितीत, मिस्ट्रल मीडियम 3 कंपन्यांना त्यांच्या सिस्टीममध्ये बुद्धिमत्ता एकत्रित करण्याचा एक सोपा मार्ग प्रदान करते.
कंपन्यांच्या गरजा पूर्ण करण्यासाठी, मिस्ट्रलने मिस्ट्रल मीडियम 3 मॉडेलवर आधारित Le Chat Enterprise देखील लाँच केले आहे, जे एक एंटरप्राइझ चॅटबॉट (chatbot) सेवा आहे. Le Chat Enterprise एक AI इंटेलिजेंट (intelligent) एजंट (agent) तयार करण्याचे साधन पुरवते आणि मिस्ट्रलच्या मॉडेलला Gmail, Google Drive आणि SharePoint सारख्या थर्ड-पार्टी (third-party) सेवांमध्ये एकत्रित करते. याचा उद्देश कंपन्यांसमोरील AI संबंधित समस्या जसे की साधनांचे विभाजन, असुरक्षित ज्ञान एकत्रीकरण, कठोर मॉडेल आणि कमी गुंतवणुकीवरील परतावा (return on investment) इत्यादींवर उपाय शोधणे आहे. हे सर्व प्रकारच्या संस्थात्मक कामासाठी एक unified AI प्लॅटफॉर्म (unified AI platform) प्रदान करते.
Le Chat Enterprise लवकरच MCP प्रोटोकॉलला (protocol) सपोर्ट (support) करेल, जो Anthropic ने AI ला डेटा सिस्टीम (data system) आणि सॉफ्टवेअरशी (software) जोडण्यासाठी प्रस्तावित केलेला स्टँडर्ड (standard) आहे.
मिस्ट्रलची भविष्यातील योजना
मिस्ट्रलने ब्लॉगमध्ये सांगितले की, मिस्ट्रल स्मॉल (Mistral Small) आणि मिस्ट्रल मीडियम (Mistral Medium) लाँच झाल्यानंतर, पुढील काही आठवड्यांत त्यांची “मोठी” योजना आहे, म्हणजेच मिस्ट्रल लार्ज (Mistral Large). त्यांनी म्हटले आहे की नुकतेच लाँच झालेले मिस्ट्रल मीडियम Llama 4 Maverick सारख्या उत्कृष्ट ओपन-सोर्स मॉडेलपेक्षा खूपच चांगले आहे आणि मिस्ट्रल लार्जची कार्यक्षमता अधिक चांगली असण्याची शक्यता आहे.
मिस्ट्रल लार्जच्या लाँचिंगमुळे मिस्ट्रलची AI क्षेत्रातील स्पर्धात्मकता वाढेल आणि वापरकर्त्यांना अधिक पर्याय मिळतील.
प्रत्यक्ष चाचणीतील निराशा
मिस्ट्रलला मिस्ट्रल मीडियम 3 च्या कार्यक्षमतेवर पूर्ण विश्वास आहे आणि त्यांनी दावा केला आहे की ते Claude Sonnet 3.7 च्या 90% पेक्षा अधिक चांगले आहे, परंतु प्रत्यक्ष चाचणीच्या निकालांमध्ये काही समस्या समोर आल्या आहेत.
मीडिया (media) आणि युजर्सनी (users) मिस्ट्रल मीडियम 3 ची त्वरित चाचणी सुरू केली, परंतु निकाल निराशाजनक होते. न्यूयॉर्क टाइम्सच्या (New York Times) कनेक्शन (Connections)मधील शब्द वर्गीकरण (word classification) प्रश्नांवर आधारित मूल्यांकनात, मीडियम 3 शेवटच्या स्थानावर होते. नवीन 100 प्रश्नांच्या चाचणीत, ते पहिल्या फळीतील मॉडेलमध्येही दिसले नाही.
एका युजरने (user) मीडियम 3 ची चाचणी केल्यानंतर सांगितले की, त्याची लेखन क्षमता पूर्वीसारखीच आहे आणि त्यात कोणताही विशेष सुधारणा झालेली नाही. तथापि, LLM (Large Language Model) मूल्यांकनात ते पॅरेटो फ्रंटियरवर (Pareto Frontier) आहे.
Zhu Liang यांच्या चाचणी निकालांनुसार, मिस्ट्रल मीडियम 3 कोडिंग (coding) आणि टेक्स्ट जनरेशनमध्ये (text generation) चांगले आहे आणि या दोन्ही मूल्यांकनांमध्ये ते पहिल्या पाचमध्ये आहे.
सोप्या कोडिंग (coding) टास्कमध्ये (Next.js TODO ॲप):
- त्याने स्पष्ट आणि संक्षिप्त उत्तरे दिली.
- Gemini 2.5 Pro आणि Claude 3.5 Sonnet प्रमाणेच रेटिंग (rating) मिळाली.
- DeepSeek V3 (नवीन) आणि GPT-4.1 पेक्षा कमी रेटिंग (rating) मिळाली.
जटिल कोडिंग (coding) टास्कमध्ये (बेंचमार्क व्हिज्युअलायझेशन (benchmark visualization)):
- Gemini 2.5 Pro आणि DeepSeek V3 (नवीन) प्रमाणेच सरासरी निकाल मिळाले.
- GPT-4.1, o3 आणि Claude 3.7 Sonnet पेक्षा कमी रेटिंग (rating) मिळाली.
लेखनामध्ये:
- त्यात बहुतेक मुद्दे समाविष्ट होते, परंतु स्वरूपण (formatting) बरोबर नव्हते.
- DeepSeek V3 (नवीन) आणि Claude 3.7 Sonnet प्रमाणेच रेटिंग (rating) मिळाली.
- GPT-4.1 आणि Gemini 2.5 Pro पेक्षा कमी रेटिंग (rating) मिळाली.
प्रसिद्ध व्यक्ती “karminski-दंतचिकित्सक” यांनी चाचणी केल्यानंतर सांगितले की, मिस्ट्रल मीडियम 3 ची कार्यक्षमता कंपनीने सांगितल्याइतकी चांगली नाही. त्यांनी युजर्सना (users) ते डाउनलोड (download) न करण्याचा सल्ला दिला, जेणेकरून त्यांचा डेटा (data) आणि हार्ड डिस्क स्पेस (hard disk space) वाया जाणार नाही.
निष्कर्ष
मिस्ट्रल मीडियम 3 हे युरोपियन AI क्षेत्रातील एक नवीन प्रयत्न आहे, जे कार्यक्षमता आणि खर्चामध्ये संतुलन साधण्याचा प्रयत्न करते आणि एंटरप्राइझ ॲप्लिकेशन्ससाठी ऑप्टिमाइझ (optimize) केलेले आहे. तथापि, प्रत्यक्ष चाचणीचे निकाल आणि कंपनीच्या दाव्यांमध्ये काही फरक आहे, जो दर्शवितो की मिस्ट्रलने मॉडेलच्या कार्यक्षमतेबद्दल जास्त दावे केले आहेत.
असे असले तरी, मिस्ट्रल मीडियम 3 मध्ये अजूनही क्षमता आहे, विशेषतः कोडिंग (coding) आणि टेक्स्ट जनरेशन (text generation) यांसारख्या क्षेत्रांमध्ये. भविष्यात, मिस्ट्रलला मॉडेलची कार्यक्षमता सुधारण्याची आणि प्रत्यक्ष ॲप्लिकेशन चाचणी वाढवण्याची आवश्यकता आहे, जेणेकरून युजर्सचा (users) विश्वास जिंकता येईल. तसेच, मिस्ट्रल लार्जचे (Mistral Large) प्रकाशन देखील महत्त्वाचे आहे, जे मिस्ट्रल मीडियम 3 मधील त्रुटी भरून काढू शकेल आणि युजर्सना (users) चांगला अनुभव देऊ शकेल.
एकंदरीत, मिस्ट्रल मीडियम 3 चे प्रकाशन AI क्षेत्रात युरोपच्या सक्रिय शोध आणि नविनतेचे प्रतीक आहे. जरी प्रत्यक्ष कार्यक्षमता अपेक्षेप्रमाणे नसली तरी, मिस्ट्रल अजूनही लक्ष देण्यासारखे आहे आणि त्याचे भविष्य आशादायक आहे.