Mistral Medium 3: Bintang AI Eropa atau Gimmick? | id

Mistral AI, perusahaan startup kecerdasan buatan (AI) asal Prancis, baru-baru ini meluncurkan model multimodal terbarunya, Mistral Medium 3. Mereka mengklaim bahwa performa model ini mendekati atau bahkan melampaui Claude Sonnet 3.7 milik Anthropic, namun dengan biaya yang lebih rendah daripada DeepSeek V3 dari Tiongkok. Berita ini tentu saja menimbulkan kehebohan di dunia AI, dengan banyak pihak berharap bahwa model AI asli Eropa ini dapat memecah dominasi perusahaan-perusahaan Amerika di bidang AI.

Namun, kenyataan tidak seindah harapan. Setelah peluncuran Mistral Medium 3, banyak media dan warganet yang melakukan pengujian praktis, dan hasilnya sangat mengecewakan. Model yang diharapkan ini, dalam aplikasi praktis, ternyata tidak seunggul yang dipromosikan secara resmi. Bahkan, ada yang secara terus terang menyatakan bahwa kinerjanya “mengecewakan” dan menyarankan pengguna untuk “tidak membuang waktu dan sumber daya untuk mengunduhnya.”

Mistral Medium 3: Kesenjangan Antara Promosi dan Realita

Mistral AI, saat meluncurkan Mistral Medium 3, secara besar-besaran mempromosikan kinerjanya, mengklaim bahwa model ini mencapai lebih dari 90% dari Claude Sonnet 3.7 di berbagai tolok ukur pengujian, dan menunjukkan kinerja yang luar biasa dalam aplikasi profesional seperti penulisan kode dan pemahaman multimodal. Selain itu, Mistral AI juga menekankan keunggulan biaya Mistral Medium 3, dengan menyatakan bahwa biaya input per juta token hanya $0,4, dan biaya output adalah $2, jauh lebih rendah daripada DeepSeek V3.

Namun, hasil pengujian aktual menunjukkan bahwa terdapat kesenjangan yang jelas antara kinerja Mistral Medium 3 dan Claude Sonnet 3.7. Dalam beberapa evaluasi, Mistral Medium 3 bahkan berkinerja lebih buruk daripada beberapa model sumber terbuka. Misalnya, dalam evaluasi berdasarkan soal klasifikasi kosakata dari rubrik Connections di The New York Times, Mistral Medium 3 berada di urutan terbawah, hampir tidak terlihat.

Lebih mengecewakan lagi, beberapa pengguna setelah menggunakan Mistral Medium 3 menemukan bahwa kemampuan menulisnya tidak mengalami peningkatan yang signifikan, dan masih terdapat beberapa masalah umum, seperti logika yang tidak jelas dan ekspresi yang tidak lancar. Selain itu, Mistral Medium 3 juga tampak kewalahan saat menangani tugas-tugas kompleks, sehingga sulit untuk memberikan jawaban yang memuaskan.

Sorotan Mistral Medium 3

Meskipun kinerja keseluruhan Mistral Medium 3 mengecewakan, namun model ini bukannya tanpa kelebihan. Dalam beberapa bidang tertentu, Mistral Medium 3 masih menunjukkan keunggulan tertentu. Misalnya, dalam hal penulisan kode, kinerja Mistral Medium 3 relatif stabil, mampu menghasilkan kode yang ringkas dan jelas, dan menunjukkan kinerja yang luar biasa dalam beberapa tugas pengkodean sederhana.

Selain itu, Mistral Medium 3 juga memiliki beberapa fitur tingkat perusahaan, seperti dukungan untuk penerapan cloud hibrida, penerapan lokal, dan penerapan di dalam VPC, pelatihan pasca-kustomisasi, serta integrasi ke dalam alat dan sistem perusahaan. Fitur-fitur ini memungkinkan Mistral Medium 3 untuk lebih memenuhi kebutuhan aktual perusahaan, serta memberikan solusi AI yang lebih fleksibel dan dapat disesuaikan.

Rencana “Besar” Mistral: Mistral Large

Meskipun kinerja Mistral Medium 3 tidak sesuai harapan, namun Mistral AI tidak patah semangat. Bersamaan dengan peluncuran Mistral Medium 3, Mistral AI juga mengungkapkan bahwa mereka sedang mengembangkan model yang lebih kuat bernama Mistral Large, dan mengklaim bahwa kinerja Mistral Large akan jauh melampaui Mistral Medium 3, bahkan berpotensi melampaui model AI tercanggih saat ini.

Langkah Mistral AI ini tentu saja membawa harapan baru bagi banyak pihak. Jika Mistral Large benar-benar dapat mencapai tingkat kinerja yang diklaim oleh Mistral AI, maka model ini berpotensi menjadi bintang baru di bidang AI, dan memberikan dorongan baru bagi pengembangan AI di Eropa.

Layanan Chatbot Tingkat Perusahaan: Le Chat Enterprise

Selain Mistral Medium 3 dan Mistral Large, Mistral AI juga meluncurkan layanan chatbot tingkat perusahaan bernama Le Chat Enterprise. Le Chat Enterprise didukung oleh model Mistral Medium 3, dan bertujuan untuk menyediakan platform AI terpadu bagi perusahaan, untuk mengatasi tantangan AI yang dihadapi perusahaan, seperti fragmentasi alat, integrasi pengetahuan yang tidak aman, model yang kaku, dan pengembalian investasi yang lambat.

Le Chat Enterprise menyediakan alat pembuatan agen AI yang cerdas, yang dapat mengintegrasikan model Mistral dengan layanan pihak ketiga seperti Gmail, Google Drive, dan SharePoint. Selain itu, Le Chat Enterprise juga akan mendukung protokol MCP, yang merupakan standar yang diajukan oleh Anthropic untuk menghubungkan AI dengan sistem data dan perangkat lunak.

Uji Coba Warganet: Kinerja Mistral Medium 3 Kurang Memuaskan

Meskipun Mistral AI telah melakukan promosi besar-besaran untuk Mistral Medium 3, namun banyak warganet yang setelah melakukan pengujian praktis menemukan bahwa kinerjanya tidak sekuat yang dibesar-besarkan secara resmi. Beberapa warganet bahkan menyarankan untuk tidak mengunduh Mistral Medium 3, agar tidak membuang kuota internet dan ruang penyimpanan hard drive.

Seorang warganet bernama “karminski-牙医” setelah melakukan uji coba menyatakan bahwa kinerja Mistral Medium 3 “mengecewakan,” dan menyarankan pengguna untuk “tidak membuang waktu dan sumber daya untuk mengunduhnya.” Warganet lain menyatakan bahwa kemampuan menulis Mistral Medium 3 “tidak mengalami peningkatan yang signifikan,” dan masih terdapat beberapa masalah umum.

Ulasan Media: Mistral Medium 3 Campur Aduk

Serupa dengan evaluasi warganet, ulasan media terhadap Mistral Medium 3 juga menunjukkan situasi yang campur aduk. Beberapa media berpendapat bahwa Mistral Medium 3 menunjukkan kinerja yang luar biasa dalam beberapa bidang tertentu, seperti penulisan kode. Namun, media lain berpendapat bahwa kinerja keseluruhan Mistral Medium 3 mengecewakan, dan terdapat kesenjangan yang jelas dengan Claude Sonnet 3.7.

Misalnya, The Verge dalam artikel ulasannya menunjukkan bahwa Mistral Medium 3 tampak kewalahan saat menangani tugas-tugas kompleks, sehingga sulit untuk memberikan jawaban yang memuaskan. TechCrunch dalam artikel ulasannya menyatakan bahwa kemampuan menulis Mistral Medium 3 “tidak mengalami peningkatan yang signifikan,” dan masih terdapat beberapa masalah umum.

Keterbatasan Mistral Medium 3

Secara komprehensif, keterbatasan Mistral Medium 3 terutama tercermin dalam beberapa aspek berikut:

Kinerja yang Tidak Memadai: Kinerja Mistral Medium 3 terdapat kesenjangan yang jelas dengan Claude Sonnet 3.7, sehingga sulit untuk memenuhi beberapa skenario aplikasi yang membutuhkan kinerja tinggi.
Kemampuan Menulis yang Terbatas: Kemampuan menulis Mistral Medium 3 tidak mengalami peningkatan yang signifikan, dan masih terdapat beberapa masalah umum, seperti logika yang tidak jelas dan ekspresi yang tidak lancar.
Kemampuan yang Tidak Memadai untuk Menangani Tugas Kompleks: Mistral Medium 3 tampak kewalahan saat menangani tugas-tugas kompleks, sehingga sulit untuk memberikan jawaban yang memuaskan.

Skenario Aplikasi Potensial Mistral Medium 3

Meskipun terdapat beberapa keterbatasan, namun Mistral Medium 3 masih memiliki beberapa skenario aplikasi potensial, misalnya:

Penulisan Kode: Mistral Medium 3 menunjukkan kinerja yang relatif stabil dalam hal penulisan kode, dan dapat digunakan untuk menghasilkan kode yang ringkas dan jelas.
Aplikasi Tingkat Perusahaan: Mistral Medium 3 memiliki beberapa fitur tingkat perusahaan, seperti dukungan untuk penerapan cloud hibrida, penerapan lokal, dan penerapan di dalam VPC, pelatihan pasca-kustomisasi, serta integrasi ke dalam alat dan sistem perusahaan, yang dapat digunakan untuk memenuhi kebutuhan aktual perusahaan.
Chatbot: Mistral Medium 3 dapat digunakan untuk mendukung chatbot, dan menyediakan layanan percakapan cerdas bagi pengguna.

Strategi Penetapan Harga Mistral Medium 3

Mistral AI menerapkan strategi penetapan harga yang rendah untuk Mistral Medium 3, yang bertujuan untuk menarik lebih banyak pengguna. Biaya input per juta token Mistral Medium 3 hanya $0,4, dan biaya output adalah $2, jauh lebih rendah daripada DeepSeek V3.

Strategi penetapan harga yang rendah membuat Mistral Medium 3 lebih kompetitif, dan berpotensi memperoleh pangsa pasar tertentu.

Metode Penerapan Mistral Medium 3

Mistral Medium 3 mendukung berbagai metode penerapan, termasuk:

API: Mistral Medium 3 API telah diluncurkan di Mistral La Plateforme dan Amazon Sagemaker, dan akan segera hadir di IBM WatsonX, NVIDIA NIM, Azure AI Foundry, dan Google Cloud Vertex.
Penerapan Mandiri: Mistral Medium 3 dapat diterapkan di cloud mana pun, termasuk lingkungan self-hosted dengan empat GPU atau lebih.

Berbagai metode penerapan memungkinkan Mistral Medium 3 untuk lebih memenuhi kebutuhan berbagai pengguna, dan menyediakan solusi penerapan yang lebih fleksibel dan nyaman bagi pengguna.

Mistral Medium 3: Harapan AI Eropa?

Peluncuran Mistral Medium 3 tentu saja membawa harapan baru bagi AI Eropa. Sebagai perusahaan startup AI asli Eropa, kebangkitan Mistral AI berpotensi memecah dominasi perusahaan-perusahaan Amerika di bidang AI, dan memberikan dorongan baru bagi pengembangan AI di Eropa.

Namun, kinerja Mistral Medium 3 mengecewakan, dan terdapat kesenjangan yang jelas dengan Claude Sonnet 3.7. Hal ini menunjukkan bahwa AI Eropa masih perlu terus berupaya dalam hal teknologi, agar benar-benar dapat mengejar ketertinggalan dari tingkat terdepan Amerika.

Mistral Large: Bisakah Membawa Kejutan?

Meskipun kinerja Mistral Medium 3 tidak sesuai harapan, namun Mistral AI tidak patah semangat, melainkan terus mengembangkan model yang lebih kuat, Mistral Large. Apakah Mistral Large dapat membawa kejutan, dan menjadi bintang baru di bidang AI, masih layak untuk dinantikan.

Kesimpulan

Peluncuran Mistral Medium 3 telah menarik perhatian luas di bidang AI, namun kinerja aktualnya berbeda dengan promosi resmi. Meskipun dalam bidang tertentu, Mistral Medium 3 menunjukkan keunggulan tertentu, namun kinerja keseluruhannya masih perlu ditingkatkan. Perkembangan Mistral AI di masa depan, dan apakah Mistral Large dapat membawa kejutan, akan menjadi fokus yang layak untuk diperhatikan.

Ringkasan

Peluncuran Mistral Medium 3 merupakan tonggak penting dalam perkembangan AI Eropa, namun kinerjanya juga mengingatkan kita bahwa AI Eropa masih perlu terus berupaya dalam hal teknologi. Kami berharap Mistral Large dapat membawa kejutan, dan memberikan dorongan baru bagi perkembangan AI Eropa.

diperbarui pada 2025-05-10

# Chatbot # Claude # Mistral