Qwen3 Alibaba: AI Baharu, Kos Rendah, Prestasi Tinggi

Lanskap AI sentiasa berkembang, dengan model dan kemajuan baharu muncul dengan pantas. Antara perkembangan terbaharu, pelepasan sumber terbuka Alibaba bagi model Tongyi Qianwen generasi seterusnya, Qwen3, telah mendapat perhatian yang signifikan. Dengan saiz parameter yang lebih kecil, kos yang dikurangkan, dan prestasi yang dipertingkatkan berbanding model terkemuka yang lain, Qwen3 telah meletakkan dirinya sebagai pesaing yang kuat dalam arena AI global.

Qwen3 menonjol sebagai model penaakulan hibrid perintis di China, menawarkan gabungan yang menarik antara prestasi yang dipertingkatkan dan kos yang dikurangkan. Dengan jumlah 235 bilion parameter, ia memerlukan sumber yang jauh lebih sedikit untuk digunakan berbanding model lain dengan keupayaan yang serupa. Keberkesanan kos ini menjadikan Qwen3 sebagai pilihan yang menarik bagi organisasi yang ingin memanfaatkan kuasa model bahasa yang besar tanpa menjejaskan kewangan.

Memperkasakan Ejen dan Aplikasi AI

Salah satu sorotan utama Qwen3 ialah potensinya untuk mempercepatkan pembangunan dan penggunaan ejen AI dan aplikasi model bahasa yang besar. Dalam penilaian keupayaan ejen model, Qwen3 telah mencapai skor yang mengagumkan, melebihi model peringkat atasan yang lain. Ini mencadangkan bahawa Qwen3 boleh merendahkan halangan kemasukan untuk membangunkan dan menggunakan ejen AI, yang berpotensi membawa kepada lonjakan dalam aplikasi inovatif.

Permintaan yang Meningkat untuk Keupayaan Memanggil Alat dalam Ejen AI

Ejen AI semakin digunakan untuk mengautomasikan tugas yang kompleks dan berinteraksi dengan dunia nyata. Keupayaan yang diperlukan daripada ejen AI bergantung pada kerumitan dan autonomi tugas yang direka untuk dilaksanakan.

Sistem ejen AI yang teguh biasanya memerlukan keupayaan berikut daripada model asas:

  • Pemahaman dan penjanaan bahasa asas: Keupayaan untuk mentafsir arahan dengan tepat, memahami konteks, dan menjana respons bahasa semula jadi.

  • Penggunaan dan panggilan alat: Keupayaan untuk memahami dan menggunakan alat luaran, termasuk API, untuk mencapai tugas tertentu.

  • Penaakulan dan perancangan: Keupayaan untuk memecahkan matlamat yang kompleks kepada sub-tugas yang lebih kecil dan melaksanakannya dalam urutan yang logik.

Qwen3 menangani keperluan kritikal untuk keupayaan memanggil alat yang dipertingkatkan dalam ejen AI. Ia boleh menyepadukan alat luaran dengan ketepatan, dalam mod berfikir dan tidak berfikir, menjadikannya model sumber terbuka terkemuka untuk tugas berasaskan ejen yang kompleks.

Dalam penilaian keupayaan ejen model, Qwen3 telah mencapai skor yang tinggi, melebihi model peringkat atasan yang lain. Ini menandakan pengurangan yang ketara dalam halangan kemasukan untuk membangunkan dan menggunakan ejen AI.

Qwen3 secara natif menyokong protokol MCP dan mempunyai keupayaan memanggil alat yang teguh. Digabungkan dengan rangka kerja Qwen-Agent, yang merangkumi templat dan penghurai panggilan alat, ia memudahkan proses pembangunan dan membolehkan operasi ejen yang cekap pada peranti mudah alih dan komputer. Pembangun boleh mentakrifkan alat yang tersedia berdasarkan fail konfigurasi MCP dan menyepadukannya menggunakan rangka kerja Qwen-Agent atau alat tersuai yang lain. Ini membolehkan pembangunan pesat ejen pintar dengan pangkalan pengetahuan dan keupayaan menggunakan alat.

Tambahan pula, Qwen3 mempamerkan prestasi yang kukuh dalam pemahaman dan penjanaan bahasa asas, serta keupayaan penaakulan.

Ini bermakna, dengan keupayaan model yang setara, kos memanggil model untuk ejen dan industri aplikasi AI adalah lebih rendah, dan panggilan adalah lebih mudah, yang pasti akan menggalakkan kemunculan lebih banyak ejen dan aplikasi AI baharu.

Komitmen kepada Sumber Terbuka

Alibaba telah mengesahkan komitmennya terhadap komuniti sumber terbuka dengan menawarkan pelbagai model Qwen3. Ini termasuk dua model Mixture-of-Experts (MoE) dengan 30 bilion dan 235 bilion parameter, serta enam model tumpat dengan saiz yang berbeza-beza.

Model MoE 30 bilion parameter mencapai peningkatan prestasi yang ketara, memberikan prestasi yang setanding dengan model Qwen2.5-32B generasi sebelumnya. Model tumpat juga menunjukkan prestasi yang dipertingkatkan, dengan model yang lebih kecil pun mencapai hasil yang mengagumkan.

Kerana semua model Qwen3 ialah model penaakulan hibrid, API boleh disediakan seperti yang diperlukan untuk menetapkan ‘anggaran pemikiran’ (iaitu, bilangan token maksimum yang dijangkakan untuk pemikiran mendalam) untuk melaksanakan pelbagai tahap pemikiran dan memenuhi secara fleksibel keperluan pelbagai aplikasi AI dan senario yang berbeza untuk prestasi dan kos. Perusahaan kecil dan sederhana serta pembangun AI boleh memilih model secara fleksibel mengikut keperluan mereka, yang pasti akan mengurangkan ambang dan kos penggunaan model yang besar. Pasukan ini dengan dana dan kakitangan yang sangat terhad boleh meletakkan lebih banyak sumber dan tenaga ke dalam pasaran dan penggalian keperluan dan titik kesakitan pengguna supaya mereka boleh membangunkan aplikasi yang lebih inovatif.

Asas Teknologi Alibaba

Selepas 16 tahun pembangunan, Alibaba telah membina semula secara komprehensif sistem seni bina teknologi tindanan penuh daripada perkakasan asas kepada pengkomputeran, storan, rangkaian, pemprosesan data, latihan model dan platform penaakulan, menjadikannya platform pengkomputeran awan terkemuka di rantau Asia-Pasifik. Alibaba juga merupakan salah satu syarikat teknologi pertama di dunia yang melabur dalam penyelidikan model yang besar.

Sebelum ini, Zhou Jingren menyatakan dalam temu bual dengan media bahawa pembangunan model yang besar tidak dapat dipisahkan daripada sokongan sistem awan. Sama ada latihan atau penaakulan, setiap kejayaan dalam model yang besar, pada zahirnya, ialah evolusi keupayaan model, tetapi di sebaliknya ialah kerjasama dan peningkatan komprehensif seluruh pengkomputeran awan dan platform data dan kejuruteraan. Multimodaliti juga merupakan cara penting untuk AGI.

Pengiktirafan Antarabangsa

Pelepasan Qwen3 telah mendapat perhatian di peringkat global. Berikutan pelepasan Qwen 3 Alibaba, Elon Musk menyatakan di platform media sosial X bahawa versi beta awal Grok 3.5 akan dikeluarkan kepada pelanggan SuperGrok minggu depan, mendakwa ia adalah AI pertama yang boleh menjawab soalan tentang enjin roket atau teknologi elektrokimia dengan tepat.

Memacu Inovasi dan Kebolehaksesan

Sun Maosong, Naib Presiden Eksekutif Institut Kecerdasan Buatan di Universiti Tsinghua dan Akademik Asing Akademi Kemanusiaan dan Sains Semula Jadi Eropah, menyatakan bahawa dalam beberapa tahun kebelakangan ini, China telah memberikan sumbangan yang besar kepada pembangunan kecerdasan buatan, terutamanya dalam bidang model yang besar. Kemunculan DeepSeek dan siri produk sumber terbuka daripada Tongyi Qianwen telah menggalakkan laluan sumber terbuka model domestik yang besar, yang sudah pasti sangat penting untuk mengurangkan monopoli teknologi, menggalakkan ekuiti teknologi, dan meningkatkan keterangkuman kecerdasan buatan.

Pada masa ini, bilangan model terbitan Qwen dalam komuniti sumber terbuka di dalam dan luar negara telah melebihi 100,000, melebihi siri model terbitan Llama, dan Tongyi Qianwen Qwen berada di kedudukan sebagai kumpulan model bahasa generatif terbesar di dunia. Menurut senarai model besar sumber terbuka global Huggingface yang terkini pada 10 Februari 2025, sepuluh model besar sumber terbuka teratas adalah semua model terbitan berdasarkan model sumber terbuka Tongyi Qianwen Qwen.

Sun Maosong percaya bahawa ini bermakna budaya model besar China telah diiktiraf di peringkat antarabangsa, yang merupakan perubahan budaya. Ini sangat berharga dan mewakili pengiktirafan pembangunan dan teknologi model besar China.