Qwen3 Alibaba: Gelombang Baru Aplikasi AI

Lanskap AI terus berkembang dengan model dan kemajuan baru yang muncul dengan cepat. Di antara perkembangan terkini, rilis open-source Alibaba dari model Tongyi Qianwen generasi berikutnya, Qwen3, telah menarik perhatian yang signifikan. Dengan ukuran parameter yang lebih kecil, biaya yang lebih rendah, dan peningkatan kinerja dibandingkan dengan model terkemuka lainnya, Qwen3 telah memposisikan dirinya sebagai pesaing kuat di arena AI global.

Qwen3 menonjol sebagai model penalaran hibrida perintis di Tiongkok, menawarkan kombinasi menarik antara peningkatan kinerja dan pengurangan biaya. Dengan total 235 miliar parameter, ia membutuhkan sumber daya yang jauh lebih sedikit untuk digunakan dibandingkan dengan model lain dengan kemampuan serupa. Efektivitas biaya ini menjadikan Qwen3 sebagai pilihan yang menarik bagi organisasi yang ingin memanfaatkan kekuatan model bahasa besar tanpa menguras kantong.

Memberdayakan Agen dan Aplikasi AI

Salah satu sorotan utama Qwen3 adalah potensinya untuk mempercepat pengembangan dan penerapan agen AI dan aplikasi model bahasa besar. Dalam evaluasi kemampuan agen model, Qwen3 telah mencapai skor yang mengesankan, melampaui model tingkat atas lainnya. Ini menunjukkan bahwa Qwen3 dapat menurunkan hambatan masuk untuk mengembangkan dan menerapkan agen AI, yang berpotensi menyebabkan lonjakan aplikasi inovatif.

Meningkatnya Permintaan untuk Kemampuan Pemanggilan Alat di Agen AI

Agen AI semakin banyak digunakan untuk mengotomatiskan tugas-tugas kompleks dan berinteraksi dengan dunia nyata. Kemampuan yang dibutuhkan dari agen AI bergantung pada kompleksitas dan otonomi tugas yang dirancang untuk dilakukannya.

Sistem agen AI yang kuat biasanya membutuhkan kemampuan berikut dari model yang mendasarinya:

  • Pemahaman dan pembuatan bahasa dasar: Kemampuan untuk menafsirkan instruksi secara akurat, memahami konteks, dan menghasilkan respons bahasa alami.

  • Penggunaan dan pemanggilan alat: Kemampuan untuk memahami dan memanfaatkan alat eksternal, termasuk API, untuk menyelesaikan tugas-tugas tertentu.

  • Penalaran dan perencanaan: Kemampuan untuk memecah tujuan kompleks menjadi sub-tugas yang lebih kecil dan menjalankannya dalam urutan logis.

Qwen3 menjawab kebutuhan penting untuk meningkatkan kemampuan pemanggilan alat di agen AI. Ia dapat mengintegrasikan alat eksternal dengan presisi, baik dalam mode berpikir maupun non-berpikir, menjadikannya model open-source terkemuka untuk tugas-tugas berbasis agen yang kompleks.

Dalam evaluasi kemampuan agen model, Qwen3 telah mencapai skor tinggi, melampaui model tingkat atas lainnya. Ini menandakan pengurangan signifikan dalam hambatan masuk untuk mengembangkan dan menerapkan agen AI.

Qwen3 secara asli mendukung protokol MCP dan memiliki kemampuan pemanggilan alat yang kuat. Dikombinasikan dengan kerangka kerja Qwen-Agent, yang merangkum templat dan pengurai pemanggilan alat, ia menyederhanakan proses pengembangan dan memungkinkan operasi agen yang efisien pada perangkat seluler dan komputer. Pengembang dapat menentukan alat yang tersedia berdasarkan file konfigurasi MCP dan mengintegrasikannya menggunakan kerangka kerja Qwen-Agent atau alat khusus lainnya. Hal ini memungkinkan pengembangan cepat agen cerdas dengan basis pengetahuan dan kemampuan penggunaan alat.

Selain itu, Qwen3 menunjukkan kinerja yang kuat dalam pemahaman dan pembuatan bahasa dasar, serta kemampuan penalaran.

Ini berarti bahwa, dengan kemampuan model yang setara, biaya memanggil model untuk agen dan industri aplikasi AI lebih rendah, dan panggilan lebih nyaman, yang pasti akan mempromosikan munculnya lebih banyak agen dan aplikasi AI baru.

Komitmen terhadap Open Source

Alibaba telah menegaskan kembali komitmennya kepada komunitas open-source dengan menawarkan beragam model Qwen3. Ini termasuk dua model Mixture-of-Experts (MoE) dengan 30 miliar dan 235 miliar parameter, serta enam model padat dengan berbagai ukuran.

Model MoE 30 miliar parameter mencapai peningkatan kinerja yang signifikan, memberikan kinerja yang sebanding dengan model Qwen2.5-32B generasi sebelumnya. Model padat juga menunjukkan peningkatan kinerja, bahkan model yang lebih kecil pun mencapai hasil yang mengesankan.

Karena semua model Qwen3 adalah model penalaran hibrida, API dapat diatur sesuai kebutuhan untuk mengatur ‘anggaran berpikir’ (yaitu, jumlah token maksimum yang diharapkan untuk pemikiran mendalam) untuk melakukan berbagai tingkat pemikiran dan secara fleksibel memenuhi beragam kebutuhan aplikasi AI dan skenario yang berbeda untuk kinerja dan biaya. Perusahaan kecil dan menengah serta pengembang AI dapat secara fleksibel memilih model sesuai dengan kebutuhan mereka, yang pasti akan mengurangi ambang batas dan biaya penggunaan model besar. Tim-tim dengan dana dan personel yang sangat terbatas ini dapat menempatkan lebih banyak sumber daya dan energi ke pasar dan penggalian kebutuhan dan titik nyeri pengguna sehingga mereka dapat mengembangkan aplikasi yang lebih inovatif.

Fondasi Teknologi Alibaba

Setelah 16 tahun pengembangan, Alibaba telah secara komprehensif merekonstruksi sistem arsitektur teknologi full-stack dari perangkat keras yang mendasari hingga komputasi, penyimpanan, jaringan, pemrosesan data, pelatihan model, dan platform penalaran, menjadikannya platform komputasi awan terkemuka di kawasan Asia-Pasifik. Alibaba juga merupakan salah satu perusahaan teknologi pertama di dunia yang berinvestasi dalam penelitian model besar.

Sebelumnya, Zhou Jingren menyatakan dalam sebuah wawancara dengan media bahwa pengembangan model besar tidak terlepas dari dukungan sistem cloud. Baik itu pelatihan atau penalaran, setiap terobosan dalam model besar, di permukaan, adalah evolusi kemampuan model, tetapi di baliknya adalah kerja sama komprehensif dan peningkatan seluruh platform komputasi awan dan data dan teknik. Multimodalitas juga merupakan cara penting untuk AGI.

Pengakuan Internasional

Rilis Qwen3 telah menarik perhatian skala global. Menyusul rilis Qwen 3 Alibaba, Elon Musk menyatakan di platform media sosial X bahwa versi beta awal Grok 3.5 akan dirilis ke pelanggan SuperGrok minggu depan, mengklaim itu adalah AI pertama yang dapat menjawab pertanyaan secara akurat tentang mesin roket atau teknologi elektrokimia.

Mendorong Inovasi dan Aksesibilitas

Sun Maosong, Wakil Presiden Eksekutif Institut Kecerdasan Buatan di Universitas Tsinghua dan Akademisi Asing Akademi Humaniora dan Ilmu Pengetahuan Alam Eropa, menyatakan bahwa dalam beberapa tahun terakhir, Tiongkok telah memberikan kontribusi yang kuat terhadap pengembangan kecerdasan buatan, khususnya di bidang model besar. Munculnya DeepSeek dan serangkaian produk open-source dari Tongyi Qianwen telah sangat mempromosikan rute open-source dari model besar domestik, yang tidak diragukan lagi sangat penting untuk mengurangi monopoli teknologi, mempromosikan ekuitas teknologi, dan meningkatkan inklusivitas kecerdasan buatan.

Saat ini, jumlah model turunan Qwen di komunitas open-source di dalam dan luar negeri telah melebihi 100.000, melampaui seri model turunan Llama, dan Tongyi Qianwen Qwen menempati peringkat sebagai grup model bahasa generatif terbesar di dunia. Menurut daftar model besar open-source global terbaru Huggingface pada 10 Februari 2025, sepuluh model besar open-source teratas semuanya merupakan model turunan berdasarkan model open-source Tongyi Qianwen Qwen.

Sun Maosong percaya bahwa ini berarti bahwa budaya model besar Tiongkok telah diakui secara internasional, yang merupakan perubahan budaya. Ini sangat berharga dan mewakili pengakuan atas pengembangan dan teknologi model besar Tiongkok.