Pencabar Baru Muncul: DeepSeek V3 Gegarkan Papan Pendahulu AI

Dalam dunia kecerdasan buatan (AI) yang pantas berubah dan penuh persaingan, takhta untuk model ‘terbaik’ jarang bertahan lama. Gergasi seperti OpenAI, Google, dan Anthropic sentiasa mengatasi satu sama lain dengan kemas kini yang mengagumkan, masing-masing mendakwa prestasi unggul. Namun, laporan terkini daripada kumpulan penanda aras AI, Artificial Analysis, telah memperkenalkan satu kelainan yang mengejutkan, mencadangkan bahawa seorang pemimpin baru telah muncul dalam kategori yang spesifik tetapi penting: DeepSeek V3. Menurut indeks kecerdasan mereka, model ini, yang berasal dari sebuah firma China, kini mengatasi rakan sejawat terkenal seperti GPT-4.5, Grok 3, dan Gemini 2.0 dalam tugas-tugas yang tidak memerlukan penaakulan kompleks. Perkembangan ini bukan sekadar satu lagi anjakan tambahan dalam kedudukan; ia membawa beban yang signifikan kerana DeepSeek V3 beroperasi atas dasar ‘open-weights’, satu kontras yang ketara dengan sifatproprietari pesaing utamanya.

Memahami Penanda Aras dan Perbezaan ‘Bukan Penaakulan’

Untuk menghargai kepentingan pencapaian yang dilaporkan oleh DeepSeek V3, adalah penting untuk memahami konteks spesifiknya. Artificial Analysis menilai model AI merentasi spektrum keupayaan, biasanya termasuk penaakulan, pengetahuan am, kebolehan matematik, dan kecekapan pengekodan. Perincian penting di sini ialah DeepSeek V3 dilaporkan telah mendahului secara khusus di kalangan model AI bukan penaakulan, berdasarkan indeks khusus ini.

Apakah sebenarnya maksud ‘bukan penaakulan’ dalam konteks ini? Fikirkannya sebagai perbezaan antara kalkulator yang sangat khusus dan seorang ahli falsafah. Tugas bukan penaakulan sering melibatkan kelajuan, kecekapan, dan pengecaman corak berbanding deduksi logik berbilang langkah yang kompleks atau penyelesaian masalah kreatif. Model-model ini cemerlang dalam:

  • Pengambilan Maklumat Pantas: Mengakses dan mempersembahkan pengetahuan fakta dengan cepat.
  • Penjanaan dan Ringkasan Teks: Mencipta teks yang koheren berdasarkan gesaan atau meringkaskan dokumen sedia ada dengan cekap.
  • Terjemahan: Menukar teks antara bahasa dengan kelajuan dan ketepatan yang munasabah.
  • Pelengkapan dan Penjanaan Kod: Membantu pengaturcara dengan mencadangkan atau menulis coretan kod berdasarkan corak yang mantap.
  • Pengiraan Matematik: Melakukan operasi matematik yang ditentukan.

Walaupun keupayaan ini mungkin kelihatan kurang glamor berbanding kehebatan ‘penaakulan’ yang sering ditonjolkan dalam demonstrasi AI (seperti menyelesaikan teka-teki logik yang rumit atau membangunkan hipotesis saintifik baru), ia membentuk tulang belakang kepada aplikasi AI praktikal yang tidak terkira banyaknya yang digunakan pada masa ini. Banyak chatbot, alat penciptaan kandungan, antara muka perkhidmatan pelanggan, dan fungsi analisis data sangat bergantung pada kelajuan dan keberkesanan kos yang ditawarkan oleh model bukan penaakulan.

Dominasi DeepSeek V3 yang dilaporkan dalam sfera ini menunjukkan ia telah mencapai keseimbangan prestasi dan kecekapan yang luar biasa untuk tugas-tugas biasa ini. Ia membayangkan model itu boleh menyampaikan output berkualiti tinggi dalam bidang seperti ingatan semula pengetahuan dan bantuan pengekodan dengan lebih pantas atau lebih kos efektif berbanding pesaing sumber tertutupnya, menurut penanda aras khusus ini. Ia tidak semestinya ‘lebih pintar’ dalam erti kecerdasan menyeluruh seperti manusia, tetapi ia kelihatan sangat baik dalam tugas-tugas kerja keras yang menggerakkan sebahagian besar ekonomi AI semasa. Perbezaan ini penting; V3 tidak diletakkan sebagai pesaing kecerdasan am buatan (AGI) tetapi sebagai alat yang sangat dioptimumkan untuk aplikasi spesifik, bervolum tinggi di mana kelajuan dan bajet menjadi kebimbangan utama.

Revolusi ‘Open-Weights’: Satu Jurang Asasi

Mungkin aspek yang paling menarik mengenai kebangkitan DeepSeek V3 ialah sifat ‘open-weights’ nya. Istilah ini menandakan perbezaan asas dalam falsafah dan kebolehcapaian berbanding pemain dominan dalam bidang AI.

  • Apakah ‘Open Weights’? Apabila sebuah model digambarkan sebagai mempunyai ‘open weights’, ia bermakna komponen teras model yang terlatih – tatasusunan besar parameter berangka (pemberat) yang menentukan tingkah lakunya – disediakan secara terbuka kepada umum. Ini sering seiring dengan menjadikan seni bina model (pelan reka bentuk) dan kadangkala kod latihan sebagai sumber terbuka. Pada asasnya, pencipta memberikan ‘otak’ AI, membolehkan sesiapa sahaja yang mempunyai kemahiran teknikal dan sumber pengkomputeran yang diperlukan untuk memuat turun, memeriksa, mengubah suai, dan membina di atasnya. Fikirkannya seperti menerima resipi lengkap dan semua bahan rahsia untuk hidangan gourmet, membolehkan anda meniru atau bahkan mengubahnya di dapur anda sendiri.

  • Kontrasnya: Model Tertutup, Proprietari: Ini berbeza sama sekali dengan pendekatan yang diambil oleh syarikat seperti OpenAI (walaupun namanya mencadangkan keterbukaan), Google, dan Anthropic. Organisasi-organisasi ini biasanya menyimpan model paling maju mereka di bawah kawalan ketat. Walaupun mereka mungkin menawarkan akses melalui API (Antara Muka Pengaturcaraan Aplikasi) atau produk yang menghadap pengguna seperti ChatGPT atau Gemini, pemberat asas, butiran seni bina, dan selalunya spesifik data latihan dan kaedah mereka kekal sebagai rahsia perdagangan yang dijaga rapi. Ini serupa dengan restoran yang menjual hidangan lazat kepada anda tetapi tidak pernah mendedahkan resipi atau membiarkan anda melihat ke dalam dapur.

Implikasi jurang ini adalah mendalam:

  1. Kebolehcapaian dan Inovasi: Model ‘open-weights’ mendemokrasikan akses kepada teknologi AI terkini. Penyelidik, syarikat pemula, pembangun individu, dan juga penggemar boleh bereksperimen, menala halus, dan menggunakan alat berkuasa ini tanpa memerlukan kebenaran atau membayar yuran pelesenan yang tinggi kepada pencipta asal (walaupun kos pengkomputeran untuk menjalankan model masih dikenakan). Ini boleh memupuk ekosistem yang lebih pelbagai dan berkembang pesat, berpotensi mempercepatkan inovasi apabila komuniti yang lebih luas menyumbang penambahbaikan dan mencari aplikasi baru.
  2. Ketelusan dan Penelitian: Keterbukaan membolehkan penelitian yang lebih besar. Penyelidik boleh secara langsung memeriksa pemberat dan seni bina model untuk lebih memahami keupayaan, batasan, dan potensi biasnya. Ketelusan ini penting untuk membina kepercayaan dan menangani kebimbangan etika yang menyelubungi AI. Model tertutup, yang sering digambarkan sebagai ‘kotak hitam’, menjadikan pengesahan bebas sedemikian jauh lebih sukar.
  3. Penyesuaian dan Kawalan: Pengguna boleh menyesuaikan model ‘open-weights’ untuk tugas atau domain tertentu (penalaan halus) dengan cara yang selalunya mustahil dengan model berasaskan API tertutup. Perniagaan boleh menjalankan model ini pada infrastruktur mereka sendiri, menawarkan kawalan yang lebih besar ke atas privasi dan keselamatan data berbanding menghantar maklumat sensitif kepada penyedia pihak ketiga.
  4. Model Perniagaan: Pilihan antara terbuka dan tertutup sering mencerminkan strategi perniagaan yang berbeza. Syarikat sumber tertutup biasanya mengewangkan melalui langganan, yuran penggunaan API, dan lesen perusahaan, memanfaatkan teknologi proprietari mereka sebagai kelebihan daya saing. Penyokong ‘open-weights’ mungkin memberi tumpuan kepada membina perkhidmatan, sokongan, atau versi khusus di sekitar model terbuka teras, serupa dengan model perniagaan yang dilihat dalam dunia perisian sumber terbuka (cth., Red Hat dengan Linux).

Keputusan DeepSeek untuk mengeluarkan V3 dengan ‘open weights’ sambil serentak mencapai skor penanda aras tertinggi menghantar mesej yang kuat: prestasi tinggi dan keterbukaan tidak saling eksklusif. Ia mencabar naratif bahawa hanya pembangunan proprietari yang dikawal ketat boleh menghasilkan keputusan terkini dalam perlumbaan AI.

Trajektori DeepSeek: Lebih Daripada Sekadar Kejayaan Sekali Sahaja

DeepSeek bukanlah nama yang benar-benar baru dalam arena AI, walaupun ia mungkin tidak mempunyai pengiktirafan meluas seperti OpenAI atau Google. Syarikat itu mendapat perhatian signifikan awal tahun ini dengan pelancaran model DeepSeek R1 nya. Apa yang membezakan R1 ialah ia dipersembahkan sebagai model penaakulan peringkat tinggi yang ditawarkan secara percuma.

Model penaakulan, seperti yang disentuh sebelum ini, mewakili kelas AI yang berbeza. Ia direka untuk menangani masalah yang lebih kompleks yang memerlukan pelbagai langkah pemikiran, inferens logik, perancangan, dan juga pembetulan kendiri. Penerangan R1 sebagai menyemak jawapannya secara rekursif sebelum mengeluarkan output mencadangkan proses kognitif yang lebih canggih daripada model bukan penaakulan biasa. Menjadikan keupayaan sedemikian tersedia secara meluas tanpa caj adalah langkah yang ketara, membolehkan akses yang lebih luas kepada teknologi yang sebelum ini terhad kepada makmal yang dibiayai dengan baik atau tawaran komersial yang mahal.

Tambahan pula, DeepSeek R1 mengagumkan pemerhati bukan sahaja dengan keupayaannya tetapi juga dengan kecekapan yang dilaporkan. Ia menunjukkan bahawa penaakulan lanjutan tidak semestinya datang dengan kos pengkomputeran yang melampau, membayangkan inovasi yang telah dibuat oleh DeepSeek dalam mengoptimumkan seni bina model atau proses latihan.

Pelancaran seterusnya dan kejayaan yang dilaporkan oleh DeepSeek V3 dalam kategori bukan penaakulan dibina di atas asas ini. Ia menunjukkan sebuah syarikat yang mampu bersaing di barisan hadapan merentasi pelbagai jenis model AI sambil mengekalkan fokus pada kecekapan dan, yang penting, mengamalkan pendekatan terbuka dengan V3. Trajektori ini mencadangkan strategi yang disengajakan: menunjukkan keupayaan dalam penaakulan kompleks (R1) dan kemudian menyampaikan model yang sangat dioptimumkan, terbuka, dan terkemuka untuk tugas-tugas yang lebih biasa dan bervolum tinggi (V3). Ia meletakkan DeepSeek sebagai pemain yang serba boleh dan hebat dalam landskap AI global.

Peranan Penting Model Bukan Penaakulan dalam AI Hari Ini

Walaupun pencarian untuk kecerdasan am buatan sering menjadi tajuk utama, memberi tumpuan kepada penaakulan kompleks dan pemahaman seperti manusia, impak praktikal AI hari ini banyak didorong oleh model bukan penaakulan. Nilai cadangan mereka terletak pada kelajuan, kebolehskalaan, dan keberkesanan kos.

Pertimbangkan jumlah tugas yang besar di mana tindak balas hampir serta-merta dan pemprosesan yang cekap adalah kritikal:

  • Terjemahan Masa Nyata: Membolehkan komunikasi lancar merentasi halangan bahasa.
  • Penyederhanaan Kandungan: Mengimbas sejumlah besar kandungan janaan pengguna untuk pelanggaran dasar.
  • Syor Diperibadikan: Menganalisis tingkah laku pengguna untuk mencadangkan produk atau kandungan yang relevan serta-merta.
  • Chatbot Sokongan Pelanggan: Mengendalikan pertanyaan biasa dengan cepat dan cekap, 24/7.
  • Bantuan Kod: Menyediakan pembangun dengan cadangan segera dan auto-lengkapan dalam persekitaran pengekodan mereka.
  • Ringkasan Data: Menyaring maklumat penting dengan cepat daripada dokumen atau set data yang besar.

Untuk aplikasi ini, model yang mengambil masa beberapa saat atau minit untuk ‘bernalar’ melalui masalah, walau bagaimanapun tepatnya, selalunya tidak praktikal. Kos pengkomputeran yang berkaitan dengan menjalankan model penaakulan kompleks pada skala besar juga boleh menjadi penghalang bagi banyak perniagaan. Model bukan penaakulan, yang dioptimumkan untuk kelajuan dan kecekapan, mengisi jurang penting ini. Mereka adalah pekerja keras yang menggerakkan sebahagian besar perkhidmatan dipacu AI yang kita berinteraksi setiap hari.

Kepimpinan DeepSeek V3 yang dilaporkan dalam domain ini, menurut indeks Artificial Analysis, oleh itu sangat relevan dari sudut pandangan komersial dan praktikal. Jika ia benar-benar menawarkan prestasi unggul atau kecekapan yang lebih baik untuk tugas-tugas meluas ini, dan melakukannya melalui model ‘open-weights’ yang syarikat berpotensi boleh jalankan dengan lebih murah atau sesuaikan dengan lebih bebas, ia boleh mengganggu dinamik pasaran sedia ada secara signifikan. Ia menawarkan alternatif yang berpotensi kuat dan boleh diakses berbanding bergantung semata-mata pada tawaran API pemain sumber tertutup utama untuk keupayaan AI asas ini.

Riak Geopolitik dan Landskap Persaingan

Kemunculan model AI ‘open-weights’ berprestasi tinggi dari syarikat China seperti DeepSeek tidak dapat dielakkan menghantar riak melalui landskap geopolitik teknologi. Pembangunan AI lanjutan dilihat secara meluas sebagai sempadan kritikal dalam persaingan strategik antara negara, terutamanya Amerika Syarikat dan China.

Selama bertahun-tahun, sebahagian besar naratif berpusat pada dominasi syarikat yang berpangkalan di AS seperti OpenAI, Google, Microsoft (melalui perkongsiannya dengan OpenAI), dan Meta (yang juga memperjuangkan AI sumber terbuka dengan model seperti Llama). Prestasi DeepSeek V3, ditambah dengan sifat terbukanya, mencabar naratif ini di beberapa bidang:

  1. Kesetaraan/Kemajuan Teknologi: Ia menunjukkan bahawa firma China mampu membangunkan model AI yang boleh bersaing dengan, dan dalam penanda aras tertentu berpotensi mengatasi, model dari makmal terkemuka AS. Ini menentang sebarang anggapan tentang kelebihan teknologi AS yang kekal.
  2. Langkah Sumber Terbuka: Dengan menjadikan model terkemuka sebagai ‘open-weights’, DeepSeek berpotensi mempercepatkan penggunaan dan pembangunan AI secara global, termasuk di China dan negara-negara lain. Ini berbeza dengan pendekatan proprietari yang lebih terkawal yang digemari oleh beberapa pemain utama AS, menimbulkan persoalan tentang strategi mana yang akhirnya akan terbukti lebih berkesan dalam memupuk inovasi dan keupayaan meluas. Ia boleh dilihat sebagai langkah strategik untuk membina ekosistem global di sekitar teknologi DeepSeek.
  3. Peningkatan Tekanan Persaingan: Syarikat AI AS kini menghadapi persaingan yang semakin sengit bukan sahaja antara satu sama lain tetapi juga daripada pemain antarabangsa yang semakin berkebolehan yang menawarkan teknologi yang berpotensi lebih mudah diakses. Tekanan ini boleh mempengaruhi segala-galanya daripada strategi penetapan harga kepada kadar inovasi dan keputusan mengenai keterbukaan model.

Tekanan persaingan ini secara eksplisit dikaitkan, dalam konteks pelaporan asal, dengan usaha melobi di Amerika Syarikat. Penyebutan bahawa OpenAI didakwa mendesak kerajaan AS, berpotensi termasuk tokoh yang berkaitan dengan pentadbiran Trump, untuk melonggarkan sekatan ke atas penggunaan bahan berhak cipta untuk latihan AI menonjolkan pertaruhan yang dirasakan. Hujah yang dikemukakan ialah batasan akses kepada set data yang luas, yang berpotensi dikenakan oleh undang-undang hak cipta (batasan ‘fair use’ atau penggunaan saksama), boleh menghalang keupayaan syarikat Amerika untuk bersaing dengan pesaing antarabangsa, terutamanya dari China, yang mungkin beroperasi di bawah rejim kawal selia yang berbeza atau mempunyai akses kepada kumpulan data yang berbeza.

Ini menyentuh isu yang sangat kontroversial: kesahihan dan etika melatih model AI yang berkuasa pada korpus besar kreativiti manusia yang tersedia dalam talian, kebanyakannya dilindungi hak cipta. Syarikat AI berhujah bahawa akses kepada data ini adalah penting untuk membina model yang berkebolehan, berpotensi membingkainya sebagai soal daya saing negara. Pencipta dan pemegang hak cipta, sebaliknya, berhujah bahawa penggunaan karya mereka tanpa kebenaran untuk latihan merupakan pelanggaran dan merendahkan nilai harta intelek mereka. Kejayaan DeepSeek menambah satu lagi lapisan kepada perdebatan ini, berpotensi menyemarakkan hujah bahawa penggunaan data yang agresif adalah kunci untuk kekal di hadapan dalam perlumbaan AI global, tanpa mengira sumbernya.

Kebangkitan DeepSeek V3 menggariskan bahawa perlumbaan AI benar-benar global dan semakin kompleks. Ia melibatkan bukan sahaja kehebatan teknologi tetapi juga pilihan strategik tentang keterbukaan, model perniagaan, dan menavigasi medan undang-undang dan etika yang kompleks, semuanya berlatarbelakangkan persaingan antarabangsa. Fakta bahawa model terkemuka dalam kategori utama kini adalah ‘open-weights’ dan berasal dari luar gergasi teknologi AS tradisional menandakan potensi anjakan yang signifikan dalam evolusi kecerdasan buatan.