Melangkaui DeepSeek: AI Sumber Terbuka China | ms

Gerakan sumber terbuka China berkembang pesat dan menjadi kuasa yang perlu diperhitungkan. Dengan model asas seperti DeepSeek dan Qwen Alibaba menerajui perubahan, menetapkan penanda aras baharu untuk keupayaan sumber terbuka China, semakin banyak perusahaan kecil dan sederhana (PKS) memanfaatkan kemajuan ini untuk membangunkan model vertikal yang lebih kecil tetapi lebih berkuasa. Lonjakan inovasi ini telah mempercepatkan kadar kemas kini model besar di China, secara konsisten memberikan perkembangan baharu dan menarik. Berbeza dengan pendekatan sumber tertutup yang lazim di Amerika Syarikat, syarikat-syarikat China menerima sumber terbuka, mempamerkan keyakinan teknologi mereka dan mempelopori laluan baharu ke arah keterangkuman teknologi dan kerjasama global, terus berkembang ke pasaran luar negara dan mengalihkan landskap AI global daripada ‘hegemoni unipolar’ kepada ‘kewujudan bersama berbilang kutub’.

Konvergensi Sumber Terbuka China

Pada awal Februari, apabila model besar sumber terbuka China DeepSeek mendahului carta muat turun pasaran aplikasi di 140 negara dan wilayah di seluruh dunia, OpenAI secara terbuka menuduh DeepSeek menggunakan data sulingan daripada ChatGPT tanpa kebenaran.

Daripada menyelamatkan reputasi OpenAI, tuduhan ini disambut dengan ejekan meluas daripada penyelidik di seluruh dunia.

Kini, satu lagi pencabar, yang menerima sepenuhnya ‘buff’ penyulingan, telah muncul.

Pada 13 April, Kunlun Wanwei melancarkan model siri Skywork-OR1 (Open Reasoner 1), yang mengatasi Qwen-32B Alibaba dalam skala yang sama dan sejajar dengan DeepSeek-R1.

Bagaimanakah Kunlun Wanwei, sebuah syarikat dengan sumber kewangan yang terhad, mencipta model besar peringkat SOTA? Penjelasan rasmi ialah model mereka adalah berdasarkan DeepSeek-R1-Distill-Qwen-7B dan DeepSeek-R1-Distill-Qwen-32B.

Seperti yang dicadangkan oleh nama-nama tersebut, model DeepSeek menyulingkan model siri Qwen Alibaba.

Sambil memanfaatkan model sumber terbuka yang cemerlang, Kunlun Wanwei juga menyumbang kepada komuniti sumber terbuka. Tidak seperti DeepSeek, yang hanya membuka berat model sumber, Kunlun Wanwei juga telah membuka set data dan kod latihannya, sejajar lebih rapat dengan konsep ‘sumber terbuka sebenar’. Ini bermakna mana-mana pengguna boleh cuba untuk meniru proses latihan model mereka.

Pencapaian Kunlun Wanwei menunjukkan aspek yang paling penting dari sumber terbuka: ia bukan sahaja menyediakan pengguna dengan produk percuma dan sedia ada tetapi juga membolehkan lebih ramai pembangun untuk berdiri di atas bahu pendahulu, dengan cepat dan kos efektif memajukan teknologi.

Malah, di tengah-tengah perbincangan industri tahun lepas tentang kesesakan dalam latihan pra-model besar, kadar lelaran model besar China telah dipercepatkan tahun ini, dengan semakin banyak syarikat melabur dalam sumber terbuka.

Tongyi Qianwen Alibaba Cloud membuka model visual baharunya Qwen2.5-VL pada Malam Tahun Baharu Cina dan mengeluarkan serta membuka model penaakulan baharunya QwQ-32B pada awal Mac, mendahului senarai arah aliran komuniti sumber terbuka AI arus perdana global Hugging Face pada hari ia dibuka sumber.

Stepwise kemudian membuka tiga model besar multimodal dalam tempoh kira-kira sebulan, yang terbaharu ialah model imej-ke-video Step-Video-TI2V, yang menyokong penjanaan video dengan amplitud gerakan terkawal dan pergerakan lensa, dan juga dilengkapi dengan keupayaan penjanaan kesan khas tertentu.

Zhipu mengumumkan pada bulan April bahawa ia akan membuka sumber model siri GLM 32B/9B, meliputi model asas, penaakulan dan kontemplatif, semuanya di bawah perjanjian lesen MIT.

Malah Baidu, yang dahulunya sumber tertutup, mengumumkan bahawa ia akan membuka sepenuhnya model besar Wenxin pada 30 Jun.

Berbanding dengan kemakmuran ekosistem sumber terbuka domestik yang semakin meningkat, syarikat model besar Amerika masih memberi tumpuan terutamanya pada sumber tertutup, yang telah memberi model besar China peluang yang jarang berlaku untuk pergi ke luar negara. DeepSeek telah membenarkan syarikat pendidikan Indonesia Ruangguru untuk mengoptimumkan model pengajarannya pada kos yang rendah; Syarikat teknologi pelancongan B2B Singapura Atlas telah menyepadukan Qwen ke dalam sistem perkhidmatan pelanggannya yang pintar untuk mencapai sokongan berbilang bahasa 24/7.

Mengapa Sumber Tertutup di AS, Sumber Terbuka di China?

Kecenderungan ke arah sumber tertutup dalam industri AI AS dan peningkatan keterbukaan AI China adalah hasil yang tidak dapat dielakkan daripada persekitaran pembangunan AI yang berbeza di kedua-dua negara.

Industri AI AS terutamanya dipimpin oleh gergasi teknologi dan VC (pemodal teroka), yang mempunyai jangkaan yang besar untuk pulangan modal daripada AI. Oleh itu, syarikat model AI AS secara amnya mempunyai kepercayaan yang kuat dalam teknologi, iaitu, untuk mengejar kepimpinan teknologi, mencapai tahap monopoli pasaran tertentu, dan kemudian mewujudkan keuntungan yang besar, dan ekosistem mereka secara semula jadi cenderung kepada sumber tertutup.

Mengambil sejarah pembangunan OpenAI sebagai contoh, ia bermula sebagai entiti bukan untung semasa penubuhannya, tetapi sejak itu menjadi semakin tertutup. GPT-1 dibuka sepenuhnya sumber, GPT-2 dibuka sebahagiannya sumber dan menghadapi tentangan sebelum dibuka sepenuhnya sumber, GPT-3 secara rasmi menjadi sumber tertutup, dan kemudian GPT-4 mengukuhkan lagi strategi sumber tertutup, dengan seni bina model dan data latihan yang benar-benar sulit, dan bahkan menyekat kekerapan panggilan API pengguna korporat.

Walaupun OpenAI berkata bahawa menutup sumber adalah berdasarkan pematuhan dan mengawal penyalahgunaan teknologi, pasaran secara amnya percaya bahawa peristiwa penting peralihan OpenAI kepada sumber tertutup adalah mencapai kerjasama seratus bilion dolar dengan Microsoft, membenamkan GPT-3 ke dalam perkhidmatan awan Azure untuk membentuk gelung tertutup ‘teknologi-modal’.

Apabila Microsoft mula-mula mendedahkan pelaburannya dalam OpenAI dalam laporan kewangannya pada bulan Oktober tahun lepas, ia berkata: ‘Kami telah melabur dalam OpenAIGlobal, LLC, dengan jumlah komitmen pelaburan sebanyak $13 bilion, dan pelaburan itu diambil kira menggunakan kaedah ekuiti.’

Kaedah ekuiti yang dipanggil juga boleh difahami sebagai pelaburan Microsoft dalam OpenAI bertujuan untuk mendapatkan pulangan dan bukannya penyelidikan amal semata-mata. Jelas sekali, API jualan harga tinggi OpenAI melalui ekosistem sumber tertutup adalah sumber pendapatan terbesarnya pada masa ini, dan telah menjadi halangan terbesar kepada keengganan OpenAI untuk membuka sumber.

Anthropic, yang diasaskan daripada ‘perpecahan’ OpenAI, telah bertekad untuk mengambil laluan sumber tertutup dari awal, dan produk model besarnya Claude telah menggunakan sepenuhnya model sumber tertutup.

Malah Llama META, satu-satunya peneraju sumber terbuka di Amerika Syarikat, menambah dua klausa anti-rakan apabila membuka sumber:

Model sumber terbuka tidak boleh digunakan untuk produk dan perkhidmatan dengan lebih daripada 700 juta pengguna aktif bulanan sebelum META meluluskannya.
Kandungan output model Llama tidak boleh digunakan untuk melatih dan menambah baik model bahasa yang besar yang lain.

Dapat dilihat bahawa walaupun untuk model sumber terbuka, tujuan utama Meta masih membina ekosistem AInya sendiri dan bukannya keterangkuman teknikal.

Amerika Syarikat telah memilih strategi AI berdasarkan sumber tertutup dengan sumber terbuka sebagai tambahan di peringkat modal, yang boleh dikatakan sebagai pertimbangan komersial semata-mata. Sebaliknya, reka bentuk peringkat atasan dari atas ke bawah China telah melampirkan kepentingan kepada sumber terbuka dari awal, mencerminkan laluan pertama industri di bawah konsep kawalan bebas.

Seawal 2017, kerajaan China mengeluarkan ‘Pelan Pembangunan Kecerdasan Buatan Generasi Baharu,’ yang jelas mencadangkan untuk mempercepatkan penyepaduan mendalam AI dengan ekonomi dan masyarakat, dan menggunakan untuk membina kelebihan penggerak pertama pembangunan AI. Pada tahun 2021, kandungan berkaitan sumber terbuka telah dimasukkan secara eksplisit dalam ‘Rancangan Lima Tahun ke-14’ China, yang mencetuskan promosi aktif inovasi teknologi oleh kerajaan tempatan.

Mei Hong, seorang ahli akademik Akademi Sains China, pernah berkata bahawa pembangunan model bahasa masa depan mesti bergantung pada platform sumber terbuka. Hanya dalam persekitaran terbuka keselamatan dan kepercayaan muat naik data dan penyepaduan perniagaan untuk pengguna dalam pelbagai industri dapat dipastikan.

‘Pelan Tindakan Khas untuk Pemerkasaan Digital Perusahaan Kecil dan Sederhana (2025-2027)’ yang dikeluarkan oleh Kementerian Perindustrian dan Teknologi Maklumat dan empat jabatan lain pada Disember tahun lepas dengan jelas menyokong Yayasan Sumber Terbuka Atom Terbuka untuk menubuhkan ‘Projek Khas Sumber Terbuka AI Perusahaan Kecil dan Sederhana’ untuk menyediakan rangka kerja latihan yang boleh diterbitkan semula dan mudah dipromosikan, alat ujian dan sumber lain untuk menurunkan ambang teknikal untuk perusahaan.

Masalah yang lebih realistik ialah disebabkan oleh potensi sekatan teknologi oleh Amerika Syarikat, China tidak boleh hanya menjadi pengikut dalam bidang AI, tetapi mesti membina ekosistem domestik yang bebas. Membina satu lagi ekosistem sumber tertutup di bawah ekosistem yang telah dibina oleh Amerika Syarikat dengan sumber tertutup sebagai fokus utama adalah bersamaan dengan membina kereta di belakang pintu tertutup. Hanya ekosistem sumber terbuka yang boleh membantu pembangunan industri AI dengan cepat.

Sebagai tambahan kepada sokongan peringkat atasan, pelbagai kerajaan tempatan juga telah membuat pelaburan wang sebenar dalam ekosistem sumber terbuka.

Dana Z, yang ditubuhkan bersama oleh Zhipu dan Aset Milik Negara Beijing, yang memfokuskan pada pelaburan ekosistem model besar, mengumumkan bahawa ia akan melabur 300 juta yuan untuk menyokong pembangunan komuniti sumber terbuka AI di seluruh dunia. Mana-mana projek permulaan berdasarkan model sumber terbuka (tidak terhad kepada model sumber terbuka Zhipu) boleh memohon.

Perbezaan antara China dan Amerika Syarikat dalam strategi sumber terbuka dan sumber tertutup mereka untuk industri AI pada dasarnya adalah perbezaan asas dalam logik pembangunan. Amerika Syarikat didorong oleh modal, dan tuntutan mencari keuntungan gergasi teknologi dan VC telah melahirkan ekosistem sumber tertutup ‘monopoli teknologi-realisasi harga tinggi.’ Walaupun Meta cuba membuka sumber, sukar untuk melepaskan diri daripada belenggu halangan komersial. China bergantung pada reka bentuk peringkat atasan, dengan ‘ekuiti teknologi + kerjasama industri’ sebagai konsep terasnya, dan membina ekosistem terbuka melalui pemerkasaan dasar, menjadikan sumber terbuka sebagai infrastruktur asas untuk menurunkan ambang teknikal dan mempromosikan penyepaduan ekonomi sebenar. Pilihan strategik ini bukan sahaja membentuk laluan yang berbeza bagi industri AI di kedua-dua negara tetapi juga menandakan pecutan ekosistem AI global daripada ‘persaingan monopoli’ kepada ‘terbuka dan menang-menang’.

Cukup Baik Sudah Cukup Baik

Ekosistem sumber terbuka AI China bukan sahaja mempercepatkan pembangunan perindustrian AI di China dan dunia tetapi juga meletakkan kepercayaan Amerika Syarikat dalam teknologi terlebih dahulu ke dalam perangkap yang janggal.

Berdepan dengan tekanan yang semakin meningkat yang dibawa oleh kesan DeepSeek, Meta mengeluarkan Llama4 pada 5 April, mendakwa ia sebagai model besar multimodal terkuat dalam sejarah.

Walau bagaimanapun, selepas ujian sebenar, ini adalah model yang mengecewakan. Panjang konteks 10m token selalunya salah, ujian bola awal sukar diselesaikan, dan ralat saiz perbandingan 9.11 > 9.9 berlaku. Dalam beberapa hari selepas pelancaran model itu, skandal seperti perletakan jawatan eksekutif dan penipuan ujian juga disahkan oleh pekerja dalaman.

Lebih banyak berita membuktikan bahawa Llama4 boleh dikatakan sebagai produk yang tergesa-gesa diletakkan oleh Zuckerberg di rak. Jadi soalannya ialah, mengapa Zuckerberg terpaksa melancarkannya pada bulan April?

Seperti yang dinyatakan sebelum ini, industri AI AS mempunyai kepercayaan yang mengelirukan dalam teknologi, mempercayai bahawa produk mereka mesti menjadi yang terkuat dan paling maju, jadi mereka telah memulakan perlumbaan senjata. Walau bagaimanapun, kesan marginal yang semakin berkurangan dalam latihan AI telah menyebabkan pengeluar besar menghabiskan sejumlah besar kos, dan bukan sahaja ambang teknikal tidak dibina, tetapi mereka telah jatuh ke dalam paya kesesakan kuasa pengkomputeran.

Selepas OpenAI mengeluarkan fungsi penjanaan imej GPT-4o, Altman menulis di Twitter beberapa hari kemudian bahawa GPU mereka ‘terbakar.’ Kurang daripada seminggu selepas Gemini2.5 dikeluarkan, ketua GoogleAIStudio berkata bahawa mereka masih dibelenggu oleh ‘had kadar,’ dan pembangun hanya boleh menghantar 20 permintaan setiap minit. Nampaknya tiada syarikat yang dapat mengatasi keperluan inferens model super besar.

Malah, Amerika Syarikat jatuh ke dalam salah faham. Orang yang bertanggungjawab ke atas Institut Penyelidikan Zhiyuan berkata: ‘Jika model baharu menggunakan 100 kali ganda kos untuk mencapai peningkatan skor penanda aras 10 mata, maka model baharu ini tidak bermakna untuk lebih daripada 80% senario aplikasi kerana tidak ada prestasi kos.’

Syarikat model besar China mempercepatkan ekosistem sumber terbuka. Mereka nampaknya tidak lagi bersaing untuk tempat teratas, tetapi sebaliknya telah memenangi lebih ramai pelanggan, terutamanya pelanggan perindustrian, dengan pendekatan ‘cukup baik’ mereka.

Berbanding dengan puluhan juta belanjawan untuk pelanggan kerajaan dan perusahaan, banyak syarikat dan institusi mempunyai keperluan AI yang mendesak tetapi tidak mempunyai begitu banyak penyelesaian sedia ada. Menggunakan model sumber terbuka untuk membangunkan penyelesaian mereka sendiri hampir menjadi satu-satunya pilihan mereka:

Baosteel menggunakan ‘model besar + model kecil’ untuk proses kejuruteraan metalurgi utama untuk amaran awal pintar peralatan pengeluaran.
‘Model Besar Penjaga Sains Arang Batu ChinamjGPT’ China Coal Science and Industry Group mengurangkan masa henti peralatan dan kos penyelenggaraan masing-masing sebanyak 30% dan 20%.
Shanghai Mengbo Intelligent Internet of Things Technology telah mencipta platform aplikasi pengesanan tepi dan pengoptimuman proses relau penyepuhlindapan berterusan berdasarkan model besar ringan.
Mifei Technology telah merealisasikan ramalan, penyelenggaraan dan pengurusan pintar sistem pengendalian bahan automatik dalam fabs wafer semikonduktor berdasarkan teknologi model besar.

Ini semua adalah kes perwakilan model sumber terbuka yang dilaksanakan dalam senario perindustrian.

Sebagai tambahan kepada kegunaan perindustrian, ekosistem sumber terbuka juga boleh membantu lebih banyak usaha kebajikan awam.

Pusat Pemuliharaan Alam Semula Jadi Shanshui komited untuk melindungi harimau bintang salji dan ekosistem dataran tinggi. Kamera inframerah yang ditubuhkannya mengambil sebilangan besar foto atau video setiap suku tahun. Adalah sangat tidak cekap dan memakan masa untuk bergantung pada pengenalan manual kesan harimau bintang salji. Huawei Ascend bekerjasama dengan Pusat Pemuliharaan Alam Semula Jadi Shanshui untuk mengenal pasti kesan harimau bintang salji. Huawei telah membuka sumber model dan alatan yang berkaitan untuk pengecaman spesies imej inframerah di Sanjiangyuan, menurunkan ambang untuk mengambil bahagian dalam pembangunan AI dan membenarkan lebih banyak institusi penyelidikan dan perlindungan menggunakan model untuk mendapat manfaat. Orang ramai boleh bekerjasama untuk mengoptimumkan model dari segi set data, pemprosesan data dan pembersihan data.

Kesan ‘Bazaar’ Sumber Terbuka

Eric Raymond, pembawa bendera gerakan perisian sumber terbuka, mencadangkan metafora dalam bukunya pada tahun 1999 ‘The Cathedral and the Bazaar’: Model pembangunan perisian sumber tertutup tradisional adalah seperti membina sebuah katedral. Perisian ini direka dan dibina dengan teliti oleh beberapa pakar (arkitek) dalam persekitaran yang terpencil dan hanya dikeluarkan kepada pengguna selepas ia akhirnya selesai; Model pembangunan sumber terbuka adalah seperti bazaar yang sibuk, kelihatan huru-hara tetapi bertenaga. Pembangunan perisian adalah terbuka, terpencar dan evolusi.

Buku itu percaya bahawa untuk banyak jenis projek perisian, terutamanya perisian peringkat sistem yang kompleks (seperti kernel sistem pengendalian), model pembangunan ‘bazaar’ yang terbuka, kolaboratif dan terpencar, walaupun ia mungkin kelihatan huru-hara, sebenarnya lebih cekap, menghasilkan perisian yang berkualiti tinggi dan lebih mantap daripada model ‘katedral’ tradisional, tertutup dan berpusat. Ia boleh menemui dan membetulkan ralat dengan lebih cepat dan lebih baik menyerap maklum balas pengguna dan sumbangan komuniti melalui mekanisme seperti ‘keluaran awal, keluaran kerap’ dan memanfaatkan semakan rakan sebaya berskala besar (‘bola mata yang mencukupi’), dengan itu menggalakkan lelaran dan inovasi perisian yang pesat.

Kejayaan besar projek sumber terbuka seperti Linux telah mengesahkan pandangan Raymond.

Gerakan sumber terbuka telah membawa Amerika Syarikat dan dunia nilai yang besar yang jauh melebihi pelaburannya sendiri. Laporan penyelidikan 2024 dari Universiti Harvard menyatakan: ‘Sumber terbuka melabur $4.15 bilion dan mencipta nilai $8.8 trilion untuk syarikat (iaitu, setiap $1 yang dilaburkan mencipta nilai $2,000). Tanpa sumber terbuka, perbelanjaan korporat untuk perisian akan menjadi 3.5 kali ganda daripada sekarang.’

Hari ini, syarikat-syarikat China telah mempelajari ini. Syarikat AI Amerika nampaknya telah melupakannya.

Malah, untuk syarikat model besar China, walaupun mereka tidak mempertimbangkan faedah sosial, memilih untuk menerima ekosistem sumber terbuka bukanlah tidak menguntungkan bagi syarikat itu sendiri.

Banyak syarikat model besar telah memberitahu Observer.com bahawa sumber terbuka tidak bermakna melepaskan pengkomersialan. Sumber terbuka masih mempunyai logik keuntungan sumber terbuka. Berbanding dengan sama ada ia sumber terbuka atau tidak, cara untuk melayani pelanggan dengan lebih baik secara teknikal adalah isu utama.

Mengambil Zhipu AI sebagai contoh, ia mendakwa sebagai satu-satunya syarikat di China yang sepenuhnya menanda aras OpenAI, tetapi berbanding dengan strategi sumber tertutup OpenAI, ia adalah salah satu pengamal strategi sumber terbuka yang paling berazam dalam industri.

Zhipu menerajui dalam membuka sumber model besar Chat ChatGLM-6B pertama China pada tahun 2023. Sejak penubuhannya hampir enam tahun lalu, Zhipu telah membuka sumber lebih daripada 55 model, dengan jumlah muat turun kumulatif hampir 40 juta kali dalam komuniti sumber terbuka antarabangsa.

Zhipu memberitahu Observer.com bahawa Zhipu berharap strategi sumber terbukanya akan menyumbang kepada pembinaan Beijing menjadi ‘ibu kota sumber terbuka global’ untuk kecerdasan buatan.

Khususnya, di peringkat komersial, Zhipu memilih untuk menarik ekosistem pembangun melalui sumber terbuka dan menyediakan penyelesaian tersuai berbayar kepada pelanggan B-end dan G-end.

Sebagai tambahan kepada penyelesaian jualan, API jualan juga merupakan pautan keuntungan penting.

Mengambil DeepSeek sebagai contoh, perniagaan pertama model sumber terbuka ialah penjualan API berprestasi tinggi. Walaupun perkhidmatan asas adalah percuma, syarikat boleh menyediakan perkhidmatan API berprestasi tinggi dan mengenakan bayaran berdasarkan penggunaan. Harga API untuk DeepSeek-R1 ialah 1 yuan setiap juta token input dan 16 yuan setiap juta token output. Jika kuota token percuma telah digunakan atau API asas tidak dapat memenuhi keperluan, pengguna cenderung untuk menggunakan versi berbayar untuk mengekalkan kestabilan proses perniagaan.

Berbanding dengan syarikat yang hanya mempunyai perkhidmatan model, Alibaba telah memilih model pengewangan sumber terbuka yang lain: pembundelan ekosistem.

Siri Qwen Alibaba, sebagai perintis sumber terbuka, menarik pembangun untuk menggunakan pengkomputeran awan dan infrastruktur lain melalui sumber terbuka penuh modal, membentuk senario gelung tertutup. Model mereka hanyalah pengenalan di peringkat awal, dan barangan dengan harga yang ditanda sebenarnya adalah perkhidmatan awan.

Aplikasi globalisasi model besar sumber terbuka China telah beralih daripada ‘mengikuti teknologi’ kepada ‘dominasi ekosistem.’ Apabila Amerika Syarikat terperangkap dalam dilema ‘monopoli sumber tertutup’ dan ‘sumber terbuka di luar kawalan,’ China sedang membina semula logik asas ekosistem sumber terbuka AI global melalui ‘inovasi perjanjian + penanaman senario.’ Medan perang utama permainan ini bukan dalam persaingan skala parameter tetapi dalam pasaran trilion dolar integrasi mendalam teknologi AI dan ekonomi sebenar.

dikemaskinikan pada 2025-04-28

# AIGC # DeepSeek # Qwen