फ्रान्समधील मिस्ट्रल एआय (Mistral AI) या स्टार्टअप कंपनीने नुकतेच मिस्ट्रल मीडियम 3 (Mistral Medium 3) हे मल्टीमॉडल मॉडेल (multimodal model) सादर केले आहे. या मॉडेलची कार्यक्षमता क्लाउड सोनेट 3.7 (Claude Sonnet 3.7) च्या बरोबरीची असून डीपसीक व्ही3 (DeepSeek V3) पेक्षा कमी खर्चात उपलब्ध असल्याचा दावा कंपनीने केला आहे. या घोषणेनंतर तंत्रज्ञान क्षेत्रात एकच खळबळ उडाली. मात्र, प्रत्यक्ष चाचणी घेतल्यानंतर वापरकर्त्यांना असे आढळले की, कंपनीने केलेले दावे आणि मॉडेलची प्रत्यक्ष कामगिरी यात मोठा फरक आहे. काहींनी तर हे मॉडेल डाउनलोड करण्यात वेळ आणि संसाधने वाया घालवू नका, असा सल्ला दिला आहे.
मिस्ट्रल मीडियम 3 ची अधिकृत जाहिरात
मिस्ट्रल एआयने आपल्या अधिकृत ब्लॉगमध्ये मिस्ट्रल मीडियम 3 च्या काही प्रमुख वैशिष्ट्यांवर जोर दिला आहे:
- कार्यक्षमता आणि खर्चाचा समतोल: मिस्ट्रल मीडियम 3 चा उद्देश उत्तम कार्यक्षमतेसोबतच खर्च आठपट कमी करणे आहे, ज्यामुळे व्यावसायिक उपयोजनांना गती मिळेल.
- व्यावसायिक उपयोजनांमध्ये फायदा: हे मॉडेल कोडिंग (coding) आणि मल्टीमॉडल आकलन (multimodal understanding) यांसारख्या क्षेत्रांमध्ये उत्कृष्ट आहे.
- एंटरप्राइज-ग्रेड (enterprise-grade) वैशिष्ट्ये: मिस्ट्रल मीडियम 3 मध्ये हायब्रिड क्लाउड (hybrid cloud) आणि लोकल (local) तसेच व्हीपीसी (VPC) अंतर्गत डिप्लॉयमेंट (deployment) चा सपोर्ट (support) आहे. यासोबतच, कस्टमाइज्ड (customized) पोस्ट-ट्रेनिंग (post-training) आणि एंटरप्राइज टूल्स (enterprise tools) आणि सिस्टीममध्ये (system) इंटिग्रेशन (integration) करण्याची सुविधा आहे.
मिस्ट्रल मीडियम 3 एपीआय (API) मिस्ट्रल ला प्लॅटफॉर्म (Mistral La Plateforme) आणि ऍमेझॉन सेजमेकर (Amazon Sagemaker) वर उपलब्ध आहे. लवकरच ते आयबीएम वॉटसनएक्स (IBM WatsonX), एनव्हिडिया एनआयएम (NVIDIA NIM), Azure AI Foundry आणि गुगल क्लाउड व्हर्टेक्स (Google Cloud Vertex) वरदेखील उपलब्ध होणार आहे.
कार्यक्षमतेच्या मापदंडांची तुलना
मिस्ट्रल एआयने असा दावा केला आहे की, मिस्ट्रल मीडियम 3 ची कार्यक्षमता क्लाउड सोनेट 3.7 च्या 90% पर्यंत आहे, परंतु खर्च लक्षणीयरीत्या कमी आहे. मिस्ट्रल मीडियम 3 साठी प्रति दशलक्ष टोकन इनपुट (token input) किंमत 0.4 यूएस डॉलर (US dollar) आणि आउटपुट (output) किंमत 2 यूएस डॉलर आहे.
याव्यतिरिक्त, मिस्ट्रल मीडियम 3 ची कार्यक्षमता Llama 4 Maverick आणि Cohere Command A यांसारख्या आघाडीच्या ओपन-सोर्स (open-source) मॉडेलपेक्षा जास्त असल्याचा दावा करण्यात आला आहे. एपीआय किंवा सेल्फ-डिप्लॉयमेंटद्वारे (self-deployment) मिस्ट्रल मीडियम 3 चा खर्च डीपसीक व्ही3 पेक्षा कमी आहे. हे मॉडेल चार किंवा अधिक जीपीयू (GPU) असलेल्या कोणत्याही क्लाउडवर (cloud) डिप्लॉय (deploy) केले जाऊ शकते.
एंटरप्राइज ऍप्लिकेशन्सवर लक्ष केंद्रित
मिस्ट्रल एआयने या गोष्टीवर जोर दिला आहे की, मिस्ट्रल मीडियम 3 हे एक उत्कृष्ट मॉडेल बनवण्याचा त्यांचा उद्देश आहे. विशेषतः कोडिंग (coding) आणि एसटईएम (STEM) कार्यांमध्ये ते अधिक प्रभावी आहे.
अधिकृत आकडेवारीनुसार, मिस्ट्रल मीडियम 3 ची कार्यक्षमता Llama 4 Maverick आणि GPT-4o पेक्षा जास्त आहे आणि Claude Sonnet 3.7 आणि DeepSeek 3.1 च्या जवळपास आहे.
मॉडेलच्या कार्यक्षमतेची पडताळणी करण्यासाठी मिस्ट्रल एआयने थर्ड-पार्टी (third-party) मूल्यांकनाचे निकाल देखील जाहीर केले, जे वास्तविक जगातील वापराचे अधिक चांगले प्रतिनिधित्व करतात. या निकालांनुसार, मिस्ट्रल मीडियम 3 कोडिंगमध्ये उत्कृष्ट आहे आणि इतर प्रतिस्पर्धकांच्या तुलनेत चांगली कामगिरी करते.
मिस्ट्रल मीडियम 3 मध्ये एंटरप्राइज (enterprise) वातावरणाशी जुळवून घेण्याची क्षमता इतर एसओटीए (SOTA) मॉडेल्सपेक्षा चांगली आहे. हे एपीआय ऍडजस्टमेंट (API adjustment) आणि मॉडेल कस्टमायझेशनमधील (model customization) समस्यांचे निराकरण करते आणि एंटरप्राइज सिस्टीममध्ये (enterprise system) बुद्धिमत्ता एकत्रित करण्याचा मार्ग प्रदान करते.
ले चॅट एंटरप्राइज (Le Chat Enterprise)
मिस्ट्रल एआयने मिस्ट्रल मीडियम 3 मॉडेलवर आधारित ले चॅट एंटरप्राइज देखील लाँच (launch) केले आहे, जे एंटरप्राइजसाठी (enterprise) चॅटबॉट (chatbot) सेवा आहे. हे एआय (AI) इंटेलिजेंट (intelligent) एजंट (agent) तयार करण्याचे साधन पुरवते आणि मिस्ट्रलचे मॉडेल जीमेल (Gmail), गुगल ड्राइव्ह (Google Drive) आणि शेअरपॉईंट (SharePoint) सारख्या थर्ड-पार्टी (third-party) सेवांमध्ये एकत्रित करते.
ले चॅट एंटरप्राइजचा उद्देश एआय संबंधित समस्या जसे की, साधनांचे विभाजन, असुरक्षित माहिती एकत्रीकरण, कठोर मॉडेल आणि गुंतवणुकीवरील कमी परतावा (return on investment) इत्यादींवर उपाय शोधणे आहे. हे सर्व प्रकारच्या संस्थात्मक कामांसाठी एक एकीकृत एआय प्लॅटफॉर्म (AI platform) प्रदान करते.
ले चॅट एंटरप्राइज लवकरच एमसीपी (MCP) प्रोटोकॉलला (protocol) सपोर्ट (support) करेल, जे अँथ्रोपिकने (Anthropic) प्रस्तावित केलेले एआय (AI) आणि डेटा सिस्टीम (data system) आणि सॉफ्टवेअर (software) कनेक्ट (connect) करण्याचे एक मानक आहे.
मिस्ट्रल लार्ज (Mistral Large) ची展望
मिस्ट्रल एआयने ब्लॉगमध्ये (blog) असेही सांगितले आहे की, मिस्ट्रल स्मॉल (Mistral Small) आणि मिस्ट्रल मीडियम (Mistral Medium) लाँच (launch) झाले असले तरी, आगामी काही आठवड्यांत मिस्ट्रल लार्ज (Mistral Large) लाँच (launch) करण्याची त्यांची योजना आहे. त्यांनी असे म्हटले आहे की, नुकतेच लाँच (launch) झालेले मिस्ट्रल मीडियम Llama 4 Maverick सारख्या उत्कृष्ट ओपन-सोर्स (open-source) मॉडेलपेक्षा खूप चांगले आहे, त्यामुळे मिस्ट्रल लार्जकडून (Mistral Large) अधिक अपेक्षा आहेत.
वापरकर्त्यांच्या चाचणीतील सत्यता
मिस्ट्रल एआयने मिस्ट्रल मीडियम 3 च्या शक्तिशाली कार्यक्षमतेची जाहिरात केल्यानंतर, माध्यमांनी आणि वापरकर्त्यांनी त्वरित चाचणी सुरू केली, परंतु निकाल निराशाजनक होते.
कार्यक्षमतेतील फरक
न्यूयॉर्क टाइम्सच्या (New York Times) कनेक्शन (Connections) नावाच्या शब्द वर्गीकरण क्विझमध्ये (quiz) मिस्ट्रल मीडियम 3 ची कामगिरी निराशाजनक होती. नवीन 100 प्रश्नांच्या चाचणीमध्ये, ते पहिल्या क्रमांकाच्या मॉडेलमध्ये देखील नव्हते.
काही वापरकर्त्यांनी चाचणी केल्यानंतर सांगितले की, मिस्ट्रल मीडियम 3 च्या लेखन कौशल्यात विशेष सुधारणा झालेली नाही. तथापि, एलएलएम (LLM) मूल्यांकनामध्ये ते पॅरेटो फ्रंटियरवर (Pareto frontier) आहे.
झू लियांगच्या (Zhu Liang) चाचणीत असे दिसून आले की, मिस्ट्रल मीडियम 3 कोडिंग (coding) आणि टेक्स्ट जनरेशनमध्ये (text generation) चांगले आहे आणि या दोन्ही चाचण्यांमध्ये ते पहिल्या पाचमध्ये आहे.
कोडिंग कार्यांमधील कामगिरी
एका साध्या कोडिंग कार्यात (Next.js TODO application) मिस्ट्रल मीडियम 3 ने स्वच्छ आणि स्पष्ट प्रतिसाद तयार केला. या कार्यात त्याची रेटिंग (rating) Gemini 2.5 Pro आणि Claude 3.5 Sonnet च्या जवळपास होती, परंतु DeepSeek V3 (नवीन) आणि GPT-4.1 पेक्षा कमी होती.
जटिल कोडिंग कार्यात (benchmark visualization), मिस्ट्रल मीडियम 3 चा सरासरी निकाल Gemini 2.5 Pro आणि DeepSeek V3 (नवीन) यांच्यासारखाच होता, परंतु GPT-4.1, o3 आणि Claude 3.7 Sonnet पेक्षा कमी होता.
लेखन क्षमता मूल्यांकन
लेखन कौशल्याच्या बाबतीत, मिस्ट्रल मीडियम 3 ने बहुतेक मुद्दे समाविष्ट केले, परंतु त्याचे स्वरूप योग्य नव्हते. या कार्यात त्याची रेटिंग DeepSeek V3 (नवीन) आणि Claude 3.7 Sonnet च्या जवळपास होती, परंतु GPT-4.1 आणि Gemini 2.5 Pro पेक्षा कमी होती.
प्रसिद्ध व्यक्ती "कर्मिन्स्की-दंतवैद्य" यांनी चाचणी केल्यानंतर असे सांगितले की, मिस्ट्रल मीडियम 3 ची कार्यक्षमता कंपनीने सांगितल्याइतकी प्रभावी नाही. त्यामुळे वापरकर्त्यांनी ते डाउनलोड करून डेटा (data) आणि हार्ड डिस्क स्पेस (hard disk space) वाया घालवू नये.
तुलना आणि चिंतन
मिस्ट्रल मीडियम 3 च्या उदाहरणावरून हे पुन्हा एकदा स्पष्ट होते की, एआय (AI) मॉडेलच्या कार्यक्षमतेचे मूल्यांकन करताना केवळ अधिकृत जाहिराती आणि बेंचमार्क (benchmark) चाचणीच्या निकालांवर अवलंबून राहू नये, तर वापरकर्त्यांचा प्रत्यक्ष अनुभव आणि थर्ड-पार्टी (third-party) मूल्यांकनाला अधिक महत्त्व दिले पाहिजे.
अधिकृत जाहिरातींमध्ये मॉडेलचे फायदे निवडकपणे दर्शविले जातात आणि त्रुटींकडे दुर्लक्ष केले जाते. बेंचमार्क चाचणी काही प्रमाणात उपयुक्त असली तरी, ती मॉडेलची वास्तविक जगातील कामगिरी पूर्णपणे दर्शवू शकत नाही. वापरकर्त्यांचा प्रत्यक्ष अनुभव आणि थर्ड-पार्टी (third-party) मूल्यांकन अधिक वस्तुनिष्ठ आणि व्यापक असते, ज्यामुळे मॉडेलचे फायदे आणि तोटे अधिक अचूकपणे समजण्यास मदत होते.
याव्यतिरिक्त, एआय (AI) मॉडेलची कार्यक्षमता प्रशिक्षण डेटा (training data), मॉडेल आर्किटेक्चर (model architecture), ऑप्टिमायझेशन अल्गोरिदम (optimization algorithm) यांसारख्या अनेक घटकांवर अवलंबून असते. त्यामुळे, एआय (AI) मॉडेल निवडताना विशिष्ट ऍप्लिकेशन (application) आणि गरजेनुसार विचार करणे आवश्यक आहे.
मिस्ट्रल मीडियम 3 च्या लाँचिंग (launching) आणि वापरकर्त्यांच्या चाचणी निकालांमधील मोठ्या फरकामुळे एआय (AI) मॉडेल मूल्यांकन मानकांवर प्रश्नचिन्ह निर्माण झाले आहे. अधिक वैज्ञानिक, वस्तुनिष्ठ आणि व्यापक एआय (AI) मॉडेल मूल्यांकन प्रणाली कशी तयार करावी, हा एक विचार करण्यासारखा प्रश्न आहे.
उद्योगावरील प्रभाव
मिस्ट्रल मीडियम 3 च्या घटनेचा एआय (AI) उद्योगावरही काही प्रमाणात परिणाम झाला आहे. एकीकडे, या घटनेने एआय (AI) कंपन्यांना वापरकर्त्यांच्या अनुभवावर अधिक लक्ष केंद्रित करण्यास आणि अतिशयोक्तीपूर्ण जाहिराती टाळण्यास सांगितले आहे. दुसरीकडे, एआय (AI) क्षेत्रातील लोकांना एआय (AI) मॉडेल मूल्यांकन मानके तयार करण्यावर आणि सुधारण्यावर अधिक लक्ष केंद्रित करण्यास प्रवृत्त केले आहे.
भविष्यात, एआय (AI) तंत्रज्ञानाचा विकास होत असताना, एआय (AI) मॉडेलची कार्यक्षमता वाढत जाईल आणि ऍप्लिकेशनची (application) व्याप्ती देखील वाढत जाईल. एआय (AI) तंत्रज्ञानाकडे अधिक तर्कसंगत आणि वस्तुनिष्ठ दृष्टिकोन ठेवण्याची गरज आहे. त्याची प्रचंड क्षमता आणि मर्यादा दोन्ही समजून घेतल्या पाहिजेत. तरच आपण एआय (AI) तंत्रज्ञानाचा उपयोग मानवी समाजासाठी मूल्य निर्माण करण्यासाठी चांगल्या प्रकारे करू शकतो.
थोडक्यात, मिस्ट्रल मीडियम 3 चा अनुभव एक সতর্কतेचा इशारा आहे. एआय (AI) मॉडेलचे मूल्यांकन करताना, आपण अधिक गंभीरपणे विचार केला पाहिजे. अधिकृत जाहिरातींवर आंधळेपणाने विश्वास ठेवू नये, तर प्रत्यक्ष अनुभव आणि थर्ड-पार्टी (third-party) मूल्यांकनावर आधारित तर्कसंगत निर्णय घ्यावा.