Mistral Medium 3: Прорыв или рекламный трюк?

Mistral Medium 3: Разрыв между рекламой и реальностью

Французский стартап в области искусственного интеллекта Mistral AI недавно представил свою новейшую мультимодальную модель Mistral Medium 3, утверждая, что ее производительность приближается к Claude Sonnet 3.7 от Anthropic или даже превосходит ее, при этом затраты ниже, чем у китайской DeepSeek V3. Эта новость, несомненно, вызвала большой ажиотаж в мире ИИ, и многие надеются, что эта европейская модель ИИ сможет сломить монополию американских компаний в этой области.

Однако, мечты часто разбиваются о реальность. После выпуска Mistral Medium 3 многие СМИ и пользователи провели ее практические тесты, результаты которых оказались весьма разочаровывающими. Производительность этой многообещающей модели в реальных приложениях оказалась далеко не такой впечатляющей, как было заявлено в официальных заявлениях, и некоторые даже прямо заявили, что ее производительность “разочаровывает”, и рекомендовали пользователям “не тратить время и ресурсы на загрузку”.

Mistral AI широко рекламировала Mistral Medium 3 при ее выпуске, утверждая, что она достигает более 90% производительности Claude Sonnet 3.7 во многих эталонных тестах и демонстрирует отличную производительность в специализированных приложениях, таких как написание кода и мультимодальное понимание. Кроме того, Mistral AI подчеркнула ценовые преимущества Mistral Medium 3, заявив, что стоимость ввода составляет всего 0,4 доллара США за миллион токенов, а стоимость вывода - 2 доллара США, что значительно ниже, чем у DeepSeek V3.

Однако фактические результаты тестов показали, что между производительностью Mistral Medium 3 и Claude Sonnet 3.7 существует заметный разрыв. В некоторых обзорах Mistral Medium 3 даже показала себя хуже, чем некоторые модели с открытым исходным кодом. Например, в оценке на основе словарных задач из раздела Connections в «New York Times» Mistral Medium 3 оказалась в самом низу рейтинга, и ее практически невозможно было найти.

Еще более разочаровывающим было то, что некоторые пользователи обнаружили, что после использования Mistral Medium 3 ее навыки письма не улучшились заметно, и остались некоторые общие проблемы, такие как нечеткая логика и несвязное выражение. Кроме того, Mistral Medium 3 также оказалась неспособной справляться со сложными задачами, не в состоянии дать удовлетворительные ответы.

Сильные стороны Mistral Medium 3

Несмотря на то, что общая производительность Mistral Medium 3 разочаровывает, она не совсем бесполезна. В некоторых конкретных областях Mistral Medium 3 по-прежнему демонстрирует определенные преимущества. Например, с точки зрения написания кода, Mistral Medium 3 показывает относительно стабильную производительность, может генерировать краткий и понятный код и демонстрирует отличную производительность в некоторых простых задачах кодирования.

Кроме того, Mistral Medium 3 также имеет некоторые функции корпоративного класса, такие как поддержка гибридного облачного развертывания, локального развертывания и развертывания внутри VPC, настраиваемого обучения, интеграции с корпоративными инструментами и системами. Эти функции позволяют Mistral Medium 3 лучше удовлетворять фактические потребности предприятий, предоставляя им более гибкие и настраиваемые решения ИИ.

“Большой” план Mistral: Mistral Large

Несмотря на то, что производительность Mistral Medium 3 оказалась ниже ожидаемой, Mistral AI не потеряла духа. Одновременно с выпуском Mistral Medium 3 компания Mistral AI также сообщила, что разрабатывает более мощную модель под названием Mistral Large, и заявила, что производительность Mistral Large значительно превзойдет Mistral Medium 3 и даже может превзойти самые передовые модели ИИ в настоящее время.

Этот шаг Mistral AI, несомненно, вызвал новые ожидания у людей. Если Mistral Large действительно сможет достичь заявленного Mistral AI уровня производительности, то она, вероятно, станет новой звездой в области ИИ и придаст новый импульс развитию Европы в этой области.

Корпоративный сервис чат-ботов: Le Chat Enterprise

Помимо Mistral Medium 3 и Mistral Large, Mistral AI также запустила корпоративный сервис чат-ботов под названием Le Chat Enterprise. Le Chat Enterprise, работающий на модели Mistral Medium 3, предназначен для предоставления предприятиям унифицированной платформы ИИ для решения проблем ИИ, с которыми сталкиваются предприятия, таких как фрагментация инструментов, небезопасная интеграция знаний, негибкие модели и медленная окупаемость инвестиций.

Le Chat Enterprise предоставляет инструмент для создания интеллектуальных агентов ИИ, который может интегрировать модели Mistral со сторонними сервисами, такими как Gmail, Google Drive и SharePoint. Кроме того, Le Chat Enterprise также будет поддерживать протокол MCP, который был предложен Anthropic для подключения ИИ к системам данных и программному обеспечению.

Пользовательские тесты: Mistral Medium 3 показывает плохие результаты

Несмотря на то, что Mistral AI активно рекламировала Mistral Medium 3, многие пользователи обнаружили после фактического тестирования, что ее производительность не так мощна, как утверждалось в официальных заявлениях. Некоторые пользователи даже посоветовали не загружать Mistral Medium 3, чтобы не тратить трафик и место на диске.

Пользователь под ником “karminski-стоматолог” после фактического тестирования заявил, что производительность Mistral Medium 3 “разочаровывает”, и посоветовал пользователям “не тратить время и ресурсы на загрузку”. Другой пользователь заявил, что навыки письма Mistral Medium 3 “не улучшились заметно” и по-прежнему существуют некоторые общие проблемы.

Обзоры в СМИ: Mistral Medium 3 - смешанные чувства

Подобно отзывам пользователей, обзоры Mistral Medium 3 в СМИ также представляют собой смешанную картину. Некоторые СМИ считают, что Mistral Medium 3 хорошо справляется с некоторыми конкретными областями, такими как написание кода. Но другие СМИ считают, что общая производительность Mistral Medium 3 разочаровывает, и между ней и Claude Sonnet 3.7 существует заметный разрыв.

Например, The Verge в статье с обзором отметила, что Mistral Medium 3 оказывается неспособной справляться со сложными задачами, не в состоянии дать удовлетворительные ответы. TechCrunch в статье с обзором заявила, что навыки письма Mistral Medium 3 “не улучшились заметно” и по-прежнему существуют некоторые общие проблемы.

Ограничения Mistral Medium 3

В целом, ограничения Mistral Medium 3 в основном отражаются в следующих аспектах:

  • Недостаточная производительность: Между производительностью Mistral Medium 3 и Claude Sonnet 3.7 существует заметный разрыв, и ее трудно использовать в некоторых сценариях приложений, требующих высокой производительности.
  • Ограниченные навыки письма: Навыки письма Mistral Medium 3 не улучшились заметно, и по-прежнему существуют некоторые общие проблемы, такие как нечеткая логика и несвязное выражение.
  • Недостаточная способность решать сложные задачи: Mistral Medium 3 оказывается неспособной справляться со сложными задачами, не в состоянии дать удовлетворительные ответы.

Потенциальные сценарии применения Mistral Medium 3

Несмотря на некоторые ограничения, Mistral Medium 3 по-прежнему имеет некоторые потенциальные сценарии применения, такие как:

  • Написание кода: Mistral Medium 3 показывает относительно стабильную производительность в написании кода и может использоваться для генерации краткого и понятного кода.
  • Корпоративные приложения: Mistral Medium 3 имеет некоторые функции корпоративного класса, такие как поддержка гибридного облачного развертывания, локального развертывания и развертывания внутри VPC, настраиваемого обучения, интеграции с корпоративными инструментами и системами, и может использоваться для удовлетворения фактических потребностей предприятий.
  • Чат-боты: Mistral Medium 3 можно использовать для управления чат-ботами, предоставляя пользователям интеллектуальные диалоговые услуги.

Ценовая стратегия Mistral Medium 3

Mistral AI применила более низкую ценовую стратегию для Mistral Medium 3, чтобы привлечь больше пользователей. Стоимость ввода Mistral Medium 3 составляет всего 0,4 доллара США за миллион токенов, а стоимость вывода - 2 доллара США, что значительно ниже, чем у DeepSeek V3.

Более низкая ценовая стратегия делает Mistral Medium 3 более конкурентоспособной и может получить определенную долю на рынке.

Способы развертывания Mistral Medium 3

Mistral Medium 3 поддерживает различные способы развертывания, в том числе:

  • API: Mistral Medium 3 API уже запущен на Mistral La Plateforme и Amazon Sagemaker и вскоре появится на IBM WatsonX, NVIDIA NIM, Azure AI Foundry и Google Cloud Vertex.
  • Автономное развертывание: Mistral Medium 3 можно развернуть в любом облаке, включая саморазмещенную среду с четырьмя или более графическими процессорами.

Различные способы развертывания позволяют Mistral Medium 3 лучше удовлетворять потребности различных пользователей, предоставляя пользователям более гибкие и удобные решения для развертывания.

Mistral Medium 3: Надежда европейского ИИ?

Выпуск Mistral Medium 3, несомненно, вселил новые надежды в европейский ИИ. Подъем Mistral AI как европейского стартапа в области ИИ, вероятно, сломает монополию американских компаний в области ИИ и придаст новый импульс развитию Европы в этой области.

Однако производительность Mistral Medium 3 разочаровывает, и между ней и Claude Sonnet 3.7 существует заметный разрыв. Это показывает, что европейскому ИИ по-прежнему необходимо постоянно прилагать усилия в технологическом плане, чтобы действительно догнать лидирующий уровень Америки.

Mistral Large: Может ли это принести сюрприз?

Несмотря на то, что производительность Mistral Medium 3 оказалась ниже ожидаемой, Mistral AI не потеряла духа, а продолжила разрабатывать более мощную модель Mistral Large. Стоит ожидать, сможет ли Mistral Large принести сюрприз и стать новой звездой в области ИИ.

Заключение

Выпуск Mistral Medium 3 вызвал широкое внимание в области ИИ, но ее фактическая производительность отличается от официальной рекламы. Хотя в определенных областях Mistral Medium 3 продемонстрировала определенные преимущества, ее общую производительность все еще необходимо улучшить. Будущее развитие Mistral AI и то, сможет ли Mistral Large принести сюрприз, будут заслуживающими внимания.

Резюме

Выпуск Mistral Medium 3 является важной вехой в развитии европейского ИИ, но ее производительность также напоминает нам о том, что европейскому ИИ все еще необходимо постоянно прилагать усилия в технологическом плане. Мы надеемся, что Mistral Large сможет принести сюрприз и придать новый импульс развитию европейского ИИ.