Qwen3 Alibaba: Model AI 'Hibrid' Baharu

Alibaba, gergasi teknologi dari China, baru-baru ini memperkenalkan inovasi terbaharu mereka dalam bidang kecerdasan buatan: keluarga model AI Qwen3. Menurut syarikat itu, model-model ini bukan sahaja menyaingi tetapi, dalam keadaan tertentu, melampaui keupayaan model AI terkemuka dari syarikat terkenal seperti Google dan OpenAI.

Model-model ini, yang berbeza saiz dari 0.6 bilion parameter yang kompak hingga 235 bilion parameter yang besar, sebahagian besarnya boleh diakses untuk dimuat turun di bawah lesen sumber terbuka daripada platform pembangunan AI popular seperti Hugging Face dan GitHub. Bilangan parameter dalam model secara kasar berkorelasi dengan kemampuannya untuk menangani masalah yang kompleks; secara amnya, model dengan lebih banyak parameter mempamerkan prestasi yang lebih baik berbanding dengan yang lebih sedikit.

Kemunculan siri model seperti Qwen, yang berasal dari China, telah meningkatkan tekanan ke atas makmal penyelidikan AI Amerika seperti OpenAI untuk berinovasi dan menyampaikan teknologi AI yang lebih canggih. Perkembangan ini juga telah mendorong penggubal dasar untuk mengenakan sekatan yang bertujuan untuk mengehadkan akses syarikat AI China kepada cip canggih yang diperlukan untuk melatih model yang kompleks ini.

Memahami Qwen3: Pendekatan Hibrid untuk Penaakulan AI

Alibaba menyifatkan model Qwen3 sebagai ‘hibrid’ kerana keupayaan mereka untuk bertindak balas dengan cepat terhadap permintaan mudah dan secara metodikal ‘berfikir’ melalui masalah yang lebih kompleks. Keupayaan penaakulan ini membolehkan model melakukan pemeriksaan kendiri dengan berkesan, serupa dengan model seperti o3 OpenAI, walaupun dengan pertukaran dari segi kependaman yang lebih tinggi.

Dalam catatan blog, pasukan Qwen menjelaskan pendekatan mereka: ‘Kami telah menyepadukan dengan lancar mod berfikir dan tidak berfikir, menawarkan pengguna fleksibiliti untuk mengawal belanjawan pemikiran. Reka bentuk ini membolehkan pengguna mengkonfigurasi belanjawan khusus tugas dengan lebih mudah.’ Ini bermakna pengguna boleh melaraskan jumlah ‘pemikiran’ yang dilakukan AI berdasarkan tugas yang ada, mengoptimumkan sama ada kelajuan atau ketepatan.

Beberapa model Qwen3 juga menggunakan seni bina Mixture of Experts (MoE). Seni bina ini meningkatkan kecekapan pengiraan dengan memecahkan tugas kompleks kepada subtugas yang lebih kecil dan mewakilkannya kepada model ‘pakar’ khusus. Ini membolehkan pengagihan sumber pengiraan yang lebih cekap, yang membawa kepada hasil yang lebih cepat dan lebih tepat.

Keupayaan Pelbagai Bahasa dan Data Latihan

Model Qwen3 menawarkan sokongan untuk 119 bahasa yang mengagumkan, yang mencerminkan komitmen Alibaba terhadap kebolehcapaian global. Model-model ini dilatih pada set data yang luas yang terdiri daripada hampir 36 trilion token. Token ialah unit asas data yang diproses oleh model AI; kira-kira 1 juta token adalah bersamaan dengan kira-kira 750,000 perkataan. Alibaba telah mendedahkan bahawa set data latihan untuk Qwen3 termasuk pelbagai sumber, seperti buku teks, pasangan soalan-jawapan, coretan kod, dan juga data yang dijana AI.

Penambahbaikan ini, digabungkan dengan penambahbaikan lain, telah meningkatkan dengan ketara keupayaan Qwen3 berbanding pendahulunya, Qwen2, menurut Alibaba. Walaupun tiada model Qwen3 yang secara pasti mengatasi model peringkat atasan seperti o3 dan o4-mini OpenAI, mereka tetap menjadi pesaing yang kuat dalam landskap AI.

Penanda Aras Prestasi dan Perbandingan

Di Codeforces, platform popular untuk pertandingan pengaturcaraan, model Qwen3 terbesar, Qwen-3-235B-A22B, sedikit mengatasi o3-mini OpenAI dan Gemini 2.5 Pro Google. Tambahan pula, Qwen-3-235B-A22B juga mengatasi o3-mini pada versi terbaharu AIME, penanda aras matematik yang mencabar, serta BFCL, ujian yang direka untuk menilai keupayaan model untuk menaakul melalui masalah.

Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa Qwen-3-235B-A22B belum tersedia untuk umum.

Model Qwen3 yang tersedia untuk umum terbesar, Qwen3-32B, kekal berdaya saing dengan pelbagai model AI proprietari dan sumber terbuka, termasuk R1 daripada makmal AI China DeepSeek. Terutamanya, Qwen3-32B mengatasi model o1 OpenAI pada beberapa penanda aras, termasuk penanda aras pengekodan LiveCodeBench.

Keupayaan Panggilan Alat dan Ketersediaan

Alibaba menekankan bahawa Qwen3 ‘cemerlang’ dalam keupayaan panggilan alat, serta dalam mengikuti arahan dan mereplikasi format data tertentu. Serba boleh ini menjadikannya aset berharga dalam pelbagai aplikasi. Selain tersedia untuk dimuat turun, Qwen3 juga boleh diakses melalui penyedia awan seperti Fireworks AI dan Hyperbolic.

Perspektif Industri

Tuhin Srivastava, pengasas bersama dan Ketua Pegawai Eksekutif hos awan AI Baseten, melihat Qwen3 sebagai satu lagi penunjuk trend model sumber terbuka yang seiring dengan sistem sumber tertutup seperti yang daripada OpenAI.

Beliau memberitahu TechCrunch, ‘AS menggandakan sekatan penjualan cip ke China dan pembelian dari China, tetapi model seperti Qwen 3 yang canggih dan terbuka … pasti akan digunakan di dalam negara. Ia mencerminkan realiti bahawa perniagaan membina alat mereka sendiri [serta] membeli dari rak melalui syarikat model tertutup seperti Anthropic dan OpenAI.’ Ini mencadangkan trend yang semakin meningkat syarikat memanfaatkan kedua-dua alat AI yang dibangunkan secara dalaman dan penyelesaian yang tersedia secara komersial untuk memenuhi keperluan khusus mereka.

Menyelami Lebih Dalam Seni Bina dan Kefungsian Qwen3

Seni bina Qwen3 mewakili langkah penting ke hadapan dalam reka bentuk model AI, terutamanya dalam pendekatan ‘hibrid’nya terhadap penaakulan. Dengan mengintegrasikan kedua-dua mod tidak berfikir yang pantas dengan proses penaakulan yang lebih teliti, Qwen3 boleh menyesuaikan keamatan pengiraannya berdasarkan kerumitan tugas. Ini membolehkan pengendalian yang cekap bagi pelbagai permintaan, daripada pertanyaan mudah kepada senario penyelesaian masalah yang rumit.

Keupayaan untuk mengawal ‘belanjawan pemikiran,’ seperti yang diterangkan oleh pasukan Qwen, menyediakan pengguna dengan fleksibiliti yang belum pernah terjadi sebelumnya dalam mengkonfigurasi model untuk tugas tertentu. Kawalan berbutir ini membolehkan pengoptimuman untuk sama ada kelajuan atau ketepatan, bergantung pada keperluan aplikasi.

Tambahan pula, pelaksanaan seni bina Mixture of Experts (MoE) dalam beberapa model Qwen3 meningkatkan kecekapan pengiraan dengan mengagihkan tugas merentasi sub-model khusus. Pendekatan modular ini bukan sahaja mempercepatkan pemprosesan tetapi juga membolehkan peruntukan sumber yang lebih disasarkan, meningkatkan prestasi keseluruhan.

Kepentingan Data Latihan dalam Pembangunan Qwen3

Set data yang luas yang digunakan untuk melatih Qwen3 memainkan peranan penting dalam membentuk keupayaannya. Dengan hampir 36 trilion token, set data itu merangkumi pelbagai sumber, termasuk buku teks, pasangan soalan-jawapan, coretan kod, dan data yang dijana AI. Regimen latihan yang komprehensif ini mendedahkan model kepada spektrum pengetahuan dan kemahiran yang luas, membolehkannya cemerlang dalam pelbagai domain.

Kemasukan buku teks dalam data latihan menyediakan Qwen3 dengan asas yang kukuh bagi pengetahuan faktual dan konsep akademik. Pasangan soalan-jawapan meningkatkan keupayaan model untuk memahami dan bertindak balas kepada pertanyaan dengan berkesan. Coretan kod melengkapkannya dengan kemahiran pengaturcaraan, membolehkannya menjana dan memahami kod. Dan penyertaan data yang dijana AI mendedahkannya kepada maklumat novel dan sintetik, seterusnya mengembangkan asas pengetahuannya.

Skala set data latihan yang besar, digabungkan dengan kandungan yang pelbagai, menyumbang dengan ketara kepada keupayaan Qwen3 untuk berprestasi baik merentasi pelbagai tugas dan bahasa.

Tinjauan Lebih Dekat Prestasi Qwen3 pada Penanda Aras

Prestasi Qwen3 pada pelbagai penanda aras memberikan pandangan berharga tentang kekuatan dan kelemahannya. Di Codeforces, model Qwen3 terbesar, Qwen-3-235B-A22B, menunjukkan prestasi yang kompetitif terhadap model terkemuka seperti o3-mini OpenAI dan Gemini 2.5 Pro Google dalam pertandingan pengaturcaraan. Ini mencadangkan bahawa Qwen3 mempunyai kemahiran pengekodan yang kuat dan kebolehan menyelesaikan masalah.

Tambahan pula, prestasi Qwen-3-235B-A22B pada AIME, penanda aras matematik yang mencabar, dan BFCL, ujian untuk menilai kebolehan penaakulan, menonjolkan bakatnya untuk masalah matematik yang kompleks dan penaakulan logik. Keputusan ini menunjukkan bahawa Qwen3 bukan sahaja mampu memproses maklumat tetapi juga mengaplikasikannya untuk menyelesaikan masalah yang rumit.

Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa model Qwen3 terbesar belum tersedia untuk umum, mengehadkan kebolehcapaian keupayaan penuhnya.

Model Qwen3-32B yang tersedia untuk umum kekal berdaya saing dengan model AI proprietari dan sumber terbuka yang lain, menunjukkan potensinya sebagai alternatif yang berdaya maju kepada penyelesaian sedia ada. Prestasi yang lebih baik daripada model o1 OpenAI pada penanda aras pengekodan LiveCodeBench seterusnya menggariskan kehebatan pengekodannya.

Keupayaan Panggilan Alat Qwen3: Pembeda Utama

Penekanan Alibaba pada keupayaan panggilan alat Qwen3 menyoroti bidang pembezaan utama. Panggilan alat merujuk kepada keupayaan model AI untuk berinteraksi dengan alat dan API luaran untuk melaksanakan tugas tertentu, seperti mengakses maklumat, melaksanakan arahan atau mengawal peranti. Keupayaan ini membolehkan Qwen3 melanjutkan fungsinya melangkaui pengetahuan dalaman dan kebolehan pemprosesannya.

Dengan menyepadukan dengan lancar dengan alat luaran, Qwen3 boleh mengautomasikan aliran kerja yang kompleks, mengakses data masa nyata dan berinteraksi dengan dunia fizikal. Ini menjadikannya aset berharga dalam pelbagai aplikasi, seperti perkhidmatan pelanggan, analisis data dan robotik.

Kecekapan Qwen3 dalam mengikuti arahan dan mereplikasi format data tertentu seterusnya meningkatkan kebolehgunaan dan kebolehsuaiannya. Ini membolehkan pengguna menyesuaikan model dengan mudah untuk memenuhi keperluan khusus mereka dan menyepadukannya ke dalam sistem sedia ada.

Kesan Qwen3 ke atas Landskap AI

Kemunculan Qwen3 mempunyai implikasi yang ketara untuk landskap AI yang lebih luas. Sebagai model sumber terbuka, ia mendemokrasikan akses kepada teknologi AI termaju, memperkasakan penyelidik, pembangun dan perniagaan untuk berinovasi dan membina aplikasi baharu. Prestasi kompetitifnya berbanding model proprietari terkemuka mencabar penguasaan pemain yang telah bertapak dan memupuk pasaran yang lebih kompetitif.

Tambahan pula, pembangunan Qwen3 mencerminkan keupayaan syarikat AI China yang semakin meningkat dan sumbangan mereka yang semakin meningkat kepada ekosistem AI global. Trend ini berkemungkinan akan berterusan pada tahun-tahun akan datang, kerana China melabur banyak dalam penyelidikan dan pembangunan AI.

Ketersediaan Qwen3 melalui penyedia awan seperti Fireworks AI dan Hyperbolic seterusnya meluaskan jangkauan dan kebolehcapaiannya, menjadikannya lebih mudah untuk pengguna menggunakan dan menskalakan aplikasi AI.

Konteks Geopolitik Pembangunan Qwen3

Pembangunan Qwen3 juga berlaku dalam konteks geopolitik yang kompleks. Amerika Syarikat telah mengenakan sekatan ke atas penjualan cip canggih ke China, yang bertujuan untuk mengehadkan keupayaan negara itu untuk membangunkan dan melatih model AI termaju. Walau bagaimanapun, seperti yang dinyatakan oleh Tuhin Srivastava, model seperti Qwen3, yang canggih dan sumber terbuka, pasti akan digunakan di dalam negara di China.

Ini menonjolkan cabaran mengawal penyebaran teknologi AI dalam dunia global. Walaupun sekatan mungkin melambatkan kemajuan dalam bidang tertentu, ia tidak mungkin menghalang sepenuhnya pembangunan keupayaan AI termaju di China.

Persaingan antara Amerika Syarikat dan China dalam bidang AI berkemungkinan akan meningkat pada tahun-tahun akan datang, kerana kedua-dua negara mengiktiraf kepentingan strategik teknologi ini. Persaingan ini akan memacu inovasi dan pelaburan, tetapi ia juga akan menimbulkan kebimbangan tentang keselamatan, privasi dan pertimbangan etika.