DeepSeek Naik Taraf Model AI, Hampiri OpenAI | ms

DeepSeek, sebuah syarikat permulaan kecerdasan buatan (AI) dari China, telah mengumumkan peningkatan ketara kepada model penaakulan R1 mereka. Model yang dikemas kini, yang dinamakan R1-0528, dilaporkan sepadan dengan prestasi model AI terkemuka daripada gergasi teknologi global seperti OpenAI dan Google. Perkembangan ini menggariskan kemajuan pesat dalam keupayaan AI China dan persaingan yang semakin sengit dalam landskap AI global.

Keupayaan yang Dipertingkatkan bagi Model R1-0528

Syarikat itu menekankan peningkatan dalam keupayaan penaakulan dan penulisan kreatif R1-0528. Menurut DeepSeek, model yang dinaik taraf kini lebih mahir dalam menghasilkan esei yang meyakinkan, fiksyen kreatif dan prosa yang canggih, meniru gaya penulisan manusia dengan rapat. Selain meningkatkan keupayaan bahasa, DeepSeek juga telah menumpukan pada peningkatan kecekapan pengekodan model tersebut.

Salah satu peningkatan paling ketara yang disebut oleh DeepSeek ialah pengurangan sebanyak 50% dalam “halusinasi.” Halusinasi merujuk kepada contoh di mana model AI menjana maklumat yang mengelirukan atau tidak betul dari segi fakta. Mengurangkan ketidaktepatan ini adalah penting untuk membina kepercayaan dan kebolehpercayaan dalam aplikasi AI.

DeepSeek mengaitkan peningkatan ini dengan pelaburan strategik dalam sumber pengkomputeran semasa fasa pasca latihan. Fasa ini melibatkan penalaan halus dan memperhalusi model selepas proses latihan awal untuk mengoptimumkan prestasi, keselamatan dan ketepatan.

Penanda Arasan R1-0528 Terhadap Pesaing

Menurut ujian penanda aras dalaman DeepSeek, model R1 yang dikemas kini cemerlang dalam kalangan model AI domestik dalam pelbagai bidang kritikal, termasuk matematik, pengekodan dan logik am. Syarikat itu selanjutnya menegaskan bahawa R1-0528 berprestasi setanding dengan model global terkemuka seperti O3 OpenAI dan Gemini 2.5-Pro Google. Khususnya, data DeepSeek mencadangkan bahawa R1-0528 melampaui model Qwen3 AI Alibaba.

Perlumbaan untuk Ketuanan AI di China

Pelancaran R1-0528 menyusuli tempoh persaingan sengit dalam kalangan syarikat teknologi China yang bersaing untuk kepimpinan dalam sektor AI. Pada akhir April, Qwen3 Alibaba secara ringkasnya mengatasi model R1 yang asal dalam ranking LiveBench untuk sistem AI sumber terbuka. Pelancaran R1-0528 menandakan kebangkitan semula DeepSeek dan keazamannya untuk mengekalkan kedudukannya sebagai peneraju inovasi AI.

Kedudukan DeepSeek dalam Landskap AI Global

Perundingan AI Artificial Analysis mencirikan kemajuan DeepSeek baru-baru ini sebagai "lompatan mengatasi xAI, Meta [Platforms] dan Anthropic." Penilaian perundingan itu meletakkan DeepSeek dalam kedudukan seri untuk makmal AI kedua terbaik di dunia, menonjolkan peningkatan pesat syarikat permulaan itu dalam arena AI global. Artificial Analysis selanjutnya menekankan kemunculan DeepSeek sebagai peneraju dalam model sumber terbuka, dengan menyatakan jurang prestasi yang semakin mengecil antara model AI terbuka dan tertutup.

Dalam Indeks Kecerdasan Artificial Analysis, yang menilai model AI berdasarkan kemahiran mereka dalam matematik, pengekodan, pengetahuan domain dan pemahaman bahasa, R1-0528 DeepSeek hanya mengekori o4-mini (Tinggi) dan o3 OpenAI dalam kalangan model sumber terbuka.

Penerimaan dan Integrasi Industri

Pelancaran itu telah menjana minat yang besar dalam kalangan komuniti teknologi China dan antarabangsa. Penerimaan pantas model baharu itu mencerminkan keseronokan di sekitar pelancaran R1 yang asal, yang mendapat pujian kerana prestasi tinggi dan keberkesanan kosnya.
Beberapa syarikat teknologi utama China, termasuk Tencent Holdings, Baidu dan ByteDance, telah mengumumkan rancangan untuk menyepadukan model R1-0528 ke dalam platform pengkomputeran awan mereka. Integrasi ini akan menyediakan pembangun dan pelanggan korporat dengan akses kepada keupayaan AI termaju DeepSeek.

Di peringkat global, syarikat permulaan infrastruktur dan latihan AI seperti Fireworks AI dan Hyperbolics juga telah memasukkan model baharu DeepSeek ke dalam platform mereka. Penerimaan meluas ini menunjukkan pengiktirafan yang semakin meningkat terhadap teknologi DeepSeek dan potensinya untuk memperkasakan pelbagai aplikasi AI.

Penyulingan Pengetahuan: Mencipta Model yang Lebih Kecil dan Cekap

Selain menaik taraf model R1 utamanya, DeepSeek juga telah mendedahkan penyulingan pengetahuan yang berjaya daripada R1-0528 ke dalam model yang lebih kecil, yang dinamakan DeepSeek-R1-0528-Qwen3-8B. Hebatnya, model yang lebih kecil ini dilaporkan sepadan dengan prestasi Qwen3-235B Alibaba, walaupun mempunyai saiz parameter yang jauh lebih kecil (hampir 30 kali lebih kecil).

Penyulingan pengetahuan melibatkan pemindahan maklumat yang dipelajari daripada sistem AI yang lebih besar dan lebih kompleks ke dalam model yang lebih kecil dan lebih cekap. Proses ini boleh membawa kepada penciptaan sistem AI yang diperkemas yang mengekalkan keupayaan yang ketara sambil memerlukan lebih sedikit sumber pengkomputeran. DeepSeek percaya bahawa eksperimen penyulingan pengetahuan ini menjanjikan untuk memajukan penyelidikan akademik ke dalam model penaakulan dan membolehkan pembangunan komersial sistem AI yang lebih ringan dan lebih mudah diakses.

Implikasi

Model DeepSeek yang dinaik taraf dan usaha penyulingan pengetahuan mempunyai implikasi yang ketara untuk landskap AI:

Persaingan yang Meningkat: Kemajuan DeepSeek meningkatkan persaingan dalam sektor AI, terutamanya antara syarikat AS dan China.
Inovasi dalam Model Sumber Terbuka: Kemajuan siri R1 menonjolkan keupayaan model AI sumber terbuka yang semakin meningkat, yang berpotensi mendemokrasikan akses kepada teknologi AI termaju.
Kecekapan dan Kebolehcapaian: Penyulingan pengetahuan boleh membuka jalan untuk mencipta model AI yang lebih kecil dan lebih cekap sumber, menjadikannya lebih mudah diakses dan digunakan pada pelbagai jenis peranti.
Kemajuan dalam AI Kreatif dan Penaakulan: Peningkatan dalam keupayaan penaakulan dan penulisan kreatif R1-0528 menyumbang kepada pembangunan sistem AI yang lebih canggih dan seperti manusia.
Penerimaan AI yang Lebih Luas: Dengan menyepadukan model mereka ke dalam platform awan dan bekerjasama dengan penyedia infrastruktur AI, DeepSeek memudahkan penerimaan teknologi mereka yang lebih luas oleh pembangun dan perniagaan.

Evolusi AI yang Berterusan

Pelancaran model R1-0528 yang dinaik taraf DeepSeek menandakan langkah penting ke hadapan dalam evolusi kecerdasan buatan yang berterusan. Memandangkan teknologi AI terus maju pada kadar yang pesat, persaingan berkemungkinan akan meningkat, yang membawa kepada inovasi dan penemuan baharu. Dengan menumpukan pada peningkatan kebolehan penting seperti penaakulan, kreativiti dan mengurangkan ketidaktepatan, syarikat seperti DeepSeek membantu menyampaikan sistem AI yang lebih berkuasa, boleh dipercayai dan bermanfaat.

Model DeepSeek berfungsi sebagai contoh yang menarik tentang kemajuan yang dicapai dalam pembangunan AI.

dikemaskinikan pada 2025-05-31

# AIGC # DeepSeek # Qwen