Ekosistem AI China yang Berkembang
‘Keluaran ini menggariskan daya saing yang lebih luas bagi ekosistem AI termaju China,’ kata Scott Singer, seorang sarjana pelawat dalam Program Teknologi dan Hal Ehwal Antarabangsa di Carnegie Endowment for International Peace. Ekosistem ini merupakan landskap yang bertenaga yang didiami oleh pemain seperti DeepSeek dengan model R1nya dan Tencent dengan model Hunyuannya. Terutama, pengasas bersama Anthropic, Jack Clark telah mengakui Hunyuan sebagai ‘bertaraf dunia’ dalam aspek tertentu. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa penilaian model terkini Alibaba masih di peringkat awal. Kesukaran yang wujud dalam mengukur keupayaan model, ditambah pula dengan fakta bahawa QwQ-32B hanya dinilai secara dalaman oleh Alibaba, bermakna ‘persekitaran maklumat tidak begitu kaya sekarang,’ seperti yang dinyatakan oleh Singer.
Kemunculan model R1 DeepSeek pada bulan Januari telah pun menghantar riak melalui pasaran saham global, mendorong ekosistem teknologi China ke dalam tumpuan antarabangsa. Perhatian ini diperkuatkan lagi oleh persepsi yang semakin meningkat di A.S. tentang perlumbaan menentang China untuk mencapai kecerdasan am buatan (AGI). AGI mewakili tahap kecanggihan AI hipotesis di mana sistem mempunyai keupayaan untuk melaksanakan pelbagai tugas kognitif, daripada reka bentuk grafik kepada penyelidikan pembelajaran mesin, pada tahap yang setanding atau melebihi keupayaan manusia.
Implikasi Strategik AGI
Pembangunan AGI dijangka secara meluas akan memberikan kelebihan ketenteraan dan strategik yang ketara kepada mana-mana entiti – sama ada syarikat atau kerajaan – yang mencapainya terlebih dahulu. Potensi aplikasi sistem sedemikian adalah luas dan transformatif, daripada keupayaan peperangan siber termaju kepada penciptaan senjata pemusnah besar-besaran yang baru.
‘Kami yakin bahawa menggabungkan model asas yang lebih kukuh dengan pembelajaran pengukuhan yang dikuasakan oleh sumber pengiraan berskala akan mendorong kami lebih dekat untuk mencapai AGI,’ kata pasukan yang bertanggungjawab untuk model terkini Alibaba. Usaha mengejar AGI ini adalah benang merah yang berjalan melalui kebanyakan makmal AI terkemuka. Objektif yang dinyatakan DeepSeek adalah untuk ‘membongkar misteri AGI dengan rasa ingin tahu.’ Begitu juga, misi OpenAI adalah untuk ‘memastikan bahawa kecerdasan am buatan—sistem AI yang secara amnya lebih pintar daripada manusia—memberi manfaat kepada semua manusia.’ Ketua Pegawai Eksekutif AI yang terkemuka telah menyatakan jangkaan bahawa sistem seperti AGI boleh muncul dalam tempoh semasa Presiden Trump.
Kemunculan Semula Jack Ma dan Landskap Teknologi China
Kejayaan AI terkini Alibaba datang sejurus selepas kemunculan awam yang ketara oleh pengasas bersama syarikat itu, Jack Ma. Beliau duduk dengan jelas di barisan hadapan semasa pertemuan antara Presiden Xi Jinping dan tokoh perniagaan terkemuka China. Ini menandakan perubahan ketara bagi Ma, yang sebahagian besarnya telah berundur daripada pandangan umum sejak 2020. Kritikan beliau sebelum ini terhadap pengawal selia negeri dan bank milik kerajaan kerana menghalang inovasi dan beroperasi dengan ‘mentaliti kedai pajak gadai’ nampaknya telah membawa kepada tempoh penglihatan yang berkurangan.
Semasa ketiadaan Ma daripada perhatian umum, kerajaan China melaksanakan beberapa siri langkah yang menyasarkan industri teknologi. Peraturan yang lebih ketat telah dikenakan ke atas cara syarikat boleh menggunakan data dan terlibat dalam persaingan pasaran. Pada masa yang sama, kerajaan menggunakan kawalan yang lebih besar ke atas platform digital utama.
Peralihan Keutamaan: Daripada Tindakan Keras Teknologi kepada Pemulihan Ekonomi
Menjelang 2022, peralihan yang ketara dalam tumpuan kerajaan muncul. Ancaman yang dirasakan oleh industri teknologi nampaknya berkurangan berbanding dengan cabaran genangan ekonomi yang semakin meningkat. ‘Kisah genangan ekonomi itu, dan percubaan untuk membalikkannya, benar-benar membentuk begitu banyak dasar sejak 18 bulan lalu,’ jelas Singer. China kini secara aktif mengejar penggunaan teknologi canggih. Laporan menunjukkan bahawa sekurang-kurangnya 13 kerajaan bandar dan 10 syarikat tenaga milik kerajaan telah pun menyepadukan model DeepSeek ke dalam sistem operasi mereka.
Trend Peningkatan Kecekapan AI
Model Alibaba menunjukkan contoh trend yang berterusan dalam bidang AI: peningkatan prestasi sistem yang konsisten di samping pengurangan kos operasi. Epoch AI, sebuah organisasi penyelidikan bukan untung, menganggarkan bahawa kuasa pengkomputeran yang diperlukan untuk melatih sistem AI telah meningkat pada kadar melebihi 4x setiap tahun. Walau bagaimanapun, kemajuan serentak dalam reka bentuk algoritma telah membawa kepada peningkatan tiga kali ganda dalam kecekapan kuasa pengkomputeran itu setiap tahun. Secara praktikal, ini bermakna sistem AI yang mungkin memerlukan 10,000 cip komputer termaju untuk latihan tahun lepas boleh dilatih dengan hanya satu pertiga daripada jumlah itu tahun ini.
Peranan Penting Cip Pengkomputeran Atasan
Walaupun peningkatan kecekapan yang mengagumkan ini, Singer memberi amaran bahawa cip pengkomputeran atasan kekal amat diperlukan untuk pembangunan AI termaju. Realiti ini menggariskan cabaran berterusan yang ditimbulkan oleh kawalan eksport A.S. ke atas cip ini untuk syarikat AI China seperti Alibaba dan DeepSeek. Ketua Pegawai Eksekutif DeepSeek telah mengenal pasti secara khusus akses kepada cip, dan bukannya sumber kewangan atau bakat, sebagai kesesakan utama mereka.
Paradigma Baharu: ‘Model Penaakulan’
QwQ mewakili tambahan terkini kepada generasi sistem AI yang semakin berkembang yang dikategorikan sebagai ‘model penaakulan.’ Sesetengah pakar melihat ini sebagai anjakan paradigma dalam bidang AI. Sebelum ini, sistem AI bertambah baik melalui gabungan meningkatkan kuasa pengkomputeran yang digunakan untuk latihan dan meningkatkan kuantiti dan kualiti data latihan.
Paradigma baharu ini menekankan pendekatan yang berbeza. Ia melibatkan pengambilan model yang telah pun menjalani latihan awal – dalam kes ini, Qwen 2.5-32B – dan kemudian meningkatkan sumber pengkomputeran yang diperuntukkan kepada sistem dengan ketara apabila ia bertindak balas kepada pertanyaan tertentu. Seperti yang dinyatakan oleh pasukan Qwen, ‘apabila diberi masa untuk merenung, menyoal, dan merenung, pemahaman model tentang matematik dan pengaturcaraan berkembang seperti bunga yang mekar ke arah matahari.’ Pemerhatian ini sejajar dengan trend yang dilihat dalam model Barat, di mana teknik yang membolehkan masa ‘berfikir’ yang dilanjutkan telah menghasilkan peningkatan prestasi yang ketara pada tugas analitikal yang kompleks.
Keluaran ‘Open-Weight’ dan Dinamik Pasaran
QwQ Alibaba telah dikeluarkan di bawah model ‘open weight’. Ini bermakna pemberat, yang pada asasnya membentuk model dan boleh diakses sebagai fail komputer, boleh dimuat turun dan dijalankan secara setempat, walaupun pada komputer riba mewah. Menariknya, pratonton model yang dikeluarkan pada bulan November tahun sebelumnya mendapat perhatian yang jauh lebih sedikit. Singer menyatakan bahawa ‘pasaran saham secara amnya reaktif terhadap keluaran model dan bukan kepada trajektori teknologi,’ yang dijangka meneruskan kemajuannya yang pesat di kedua-dua belah Pasifik. Beliau seterusnya menekankan, ‘Ekosistem China mempunyai sekumpulan pemain di dalamnya, yang kesemuanya mengeluarkan model yang sangat berkuasa dan menarik, dan tidak jelas siapa yang akan muncul, apabila semuanya dikatakan dan dilakukan, sebagai mempunyai model terbaik.’
Pemeriksaan Terperinci Seni Bina QwQ-32B
Model QwQ-32B, walaupun dibina di atas asas Qwen 2.5-32B, menggabungkan beberapa pengubahsuaian seni bina utama dan peningkatan latihan yang menyumbang kepada keupayaan penaakulannya yang lebih baik. Peningkatan ini boleh dikategorikan secara meluas kepada:
Pengembangan Tetingkap Konteks: Tetingkap konteks, yang menentukan jumlah teks yang boleh dipertimbangkan oleh model sekaligus, mungkin telah diperluaskan dengan ketara. Ini membolehkan QwQ-32B memproses dan memahami petikan teks yang lebih panjang dan lebih kompleks, yang membawa kepada pemahaman yang lebih baik dan respons yang lebih bernuansa.
Mekanisme Perhatian yang Dipertingkatkan: Mekanisme perhatian, komponen teras model berasaskan transformer seperti QwQ-32B, mungkin telah diperhalusi. Ini boleh melibatkan teknik seperti perhatian berbilang kepala atau perhatian jarang, yang membolehkan model memfokus dengan lebih berkesan pada maklumat yang berkaitan dalam teks input dan menapis hingar.
Pembelajaran Pengukuhan daripada Maklum Balas Manusia (RLHF): Walaupun tidak dinyatakan secara eksplisit, kemungkinan besar QwQ-32B telah diperhalusi menggunakan RLHF. Teknik ini melibatkan latihan model untuk menjana output yang diutamakan oleh penilai manusia, yang membawa kepada peningkatan dalam bidang seperti koheren, membantu dan tidak berbahaya.
Penalaan Arahan: QwQ-32B mungkin telah menjalani penalaan arahan yang meluas, satu proses di mana model dilatih pada set arahan dan output yang sepadan yang pelbagai. Ini membantu model menjana lebih baik kepada tugas baharu dan mengikut arahan dengan lebih tepat.
Chain-of-Thought Prompting: Model ini direka bentuk secara eksplisit untuk memanfaatkan chain-of-thought prompting, teknik di mana model digalakkan untuk menjana satu siri langkah penaakulan perantaraan sebelum mencapai jawapan akhir. Ini menggalakkan penaakulan yang lebih sengaja dan logik.
Implikasi untuk Industri Tertentu
Kemajuan yang terkandung dalam QwQ-32B dan model AI China yang lain mempunyai implikasi yang ketara untuk pelbagai industri, baik di China mahupun di peringkat global. Beberapa sektor utama yang mungkin terjejas termasuk:
E-dagang: Perniagaan teras Alibaba, e-dagang, bersedia untuk mendapat manfaat yang ketara daripada keupayaan AI yang dipertingkatkan. Ini termasuk bidang seperti pengesyoran diperibadikan, chatbot perkhidmatan pelanggan, pengesanan penipuan dan pengoptimuman rantaian bekalan.
Kewangan: Model AI boleh digunakan untuk tugas seperti penilaian risiko, pengesanan penipuan, perdagangan algoritma dan pengurusan perhubungan pelanggan. Keupayaan penaakulan yang meningkat bagi model seperti QwQ-32B boleh membawa kepada ramalan kewangan yang lebih tepat dan pembuatan keputusan yang lebih baik.
Penjagaan Kesihatan: AI boleh membantu dalam penemuan ubat, diagnosis penyakit, perubatan diperibadikan dan pemantauan pesakit. Model penaakulan yang lebih berkuasa boleh menganalisis data perubatan yang kompleks dan memberikan pandangan yang sebelum ini tidak dapat diakses.
Pembuatan: Automasi berkuasa AI, kawalan kualiti dan penyelenggaraan ramalan boleh meningkatkan kecekapan dan mengurangkan kos dalam proses pembuatan.
Pengangkutan: Kenderaan pandu sendiri, sistem pengurusan trafik dan pengoptimuman logistik sangat bergantung pada AI. Kemajuan dalam penaakulan AI boleh menyumbang kepada rangkaian pengangkutan yang lebih selamat dan cekap.
Pendidikan: Model AI semakin banyak diguna pakai untuk memberikan sokongan yang lebih baik kepada pelajar, malah tunjuk ajar yang diperibadikan.
Masa Depan Persaingan dan Kerjasama AI
Kemajuan pesat model AI China seperti QwQ-32B menimbulkan persoalan penting tentang masa depan persaingan dan kerjasama AI pada skala global. Walaupun dinamik persaingan sudah pasti wujud, terutamanya antara A.S. dan China, terdapat juga potensi manfaat untuk kerjasama dan perkongsian pengetahuan.
Sumber Terbuka lwn. Sumber Tertutup: Keputusan oleh Alibaba untuk mengeluarkan QwQ-32B sebagai model ‘open-weight’ adalah penting. Ia berbeza dengan pendekatan yang diambil oleh beberapa syarikat AI Barat yang mengekalkan model mereka sebagai sistem proprietari, sumber tertutup. Model sumber terbuka boleh memupuk kerjasama yang lebih besar dan mempercepatkan inovasi dengan membenarkan penyelidik dan pembangun di seluruh dunia membina kerja sedia ada.
Perkongsian Data dan Penyeragaman: Pembangunan sistem AI yang teguh dan boleh dipercayai memerlukan sejumlah besar data. Kerjasama antarabangsa mengenai perkongsian data dan penubuhan piawaian bersama boleh memberi manfaat kepada seluruh komuniti AI.
Pertimbangan Etika: Apabila sistem AI menjadi lebih berkuasa, pertimbangan etika menjadi semakin penting. Dialog dan kerjasama global adalah penting untuk memastikan AI dibangunkan dan digunakan secara bertanggungjawab, dengan perlindungan yang sesuai untuk mengurangkan potensi risiko.
Pertukaran Bakat: Bidang AI mendapat manfaat daripada kumpulan bakat yang pelbagai dan diedarkan secara global. Memudahkan pertukaran penyelidik dan jurutera antara negara boleh menggalakkan pemindahan pengetahuan dan mempercepatkan kemajuan.
Kemunculan QwQ-32B dan model AI China termaju yang lain mewakili peristiwa penting dalam evolusi kecerdasan buatan yang berterusan. Ia menyerlahkan keupayaan yang semakin meningkat bagi ekosistem teknologi China dan menggariskan implikasi global kemajuan AI. Tahun-tahun akan datang mungkin akan menyaksikan kemajuan pesat yang berterusan, persaingan yang sengit, dan peningkatan seruan untuk kerjasama antarabangsa untuk memastikan AI memberi manfaat kepada manusia secara keseluruhan.