Kebangkitan Terancang DeepSeek: Strategi Kuasa AI

Dalam arena kecerdasan buatan (AI) yang penuh persaingan, di mana gergasi bertembung dan penemuan baharu mengubah landskap sekelip mata, pesaing yang agak baharu dari China sedang menarik perhatian global. DeepSeek, sebuah syarikat permulaan AI yang asal usulnya hanya bermula pada tahun 2023, telah pantas bergerak dari ketidakjelasan ke barisan hadapan perbincangan, didorong oleh demonstrasi teknologi yang mengagumkan dan desas-desus berterusan mengenai potensi lonjakan seterusnya. Sementara dunia menantikan pengganti kepada model-modelnya yang sudah dipuji, DeepSeek, dengan kerjasama minda akademik, secara senyap telah memperkenalkan teknik baharu yang canggih bertujuan untuk menangani salah satu cabaran AI yang paling berterusan: penaakulan lanjutan.

Cabaran Rumit Kognisi AI

Generasi semasa Model Bahasa Besar (LLMs) telah memukau dunia dengan keupayaannya untuk menjana teks seperti manusia, menterjemah bahasa, dan juga menulis kod. Walau bagaimanapun, bergerak melangkaui pengecaman corak dan penjanaan teks kebarangkalian ke arah penaakulan tulen – keupayaan untuk memproses maklumat secara logik, membuat inferens, dan menyelesaikan masalah kompleks – kekal sebagai halangan yang signifikan. Ia adalah perbezaan antara AI yang boleh menerangkan papan catur dan AI yang boleh menyusun strategi seperti seorang grandmaster. Mencapai tahap kehebatan kognitif yang lebih mendalam ini adalah matlamat utama bagi banyak makmal penyelidikan, menjanjikan sistem AI yang bukan sahaja petah tetapi benar-benar pintar dan rakan kongsi yang boleh dipercayai dalam tugas-tugas kompleks. Usaha ini memerlukan pendekatan inovatif yang melangkaui sekadar meningkatkan saiz model atau data latihan. Ia menuntut metodologi baharu untuk mengajar minda digital yang rumit ini bagaimana untuk berfikir, bukan hanya apa yang perlu dikatakan.

Merintis Laluan Baharu: Sinergi GRM dan Kritikan Berprinsip

Dengan latar belakang inilah DeepSeek, bekerjasama dengan penyelidik dari Tsinghua University yang berprestij, telah memperkenalkan metodologi yang berpotensi membawa perubahan besar. Pendekatan mereka, yang diperincikan dalam sebuah kertas kerja yang diterbitkan di repositori saintifik arXiv, bukanlah satu penyelesaian tunggal tetapi gabungan dua teknik berbeza yang dibina dengan teliti: Generative Reward Modelling (GRM) dan Self-Principled Critique Tuning.

Mari kita huraikan strategi dwi ini:

  1. Generative Reward Modelling (GRM): Pada terasnya, pemodelan ganjaran dalam AI bertujuan untuk mengemudi tingkah laku model ke arah hasil yang dianggap wajar atau betul oleh manusia. Secara tradisinya, ini mungkin melibatkan manusia menilai respons AI yang berbeza, mewujudkan set data keutamaan yang dipelajari oleh model. GRM nampaknya mewakili evolusi konsep ini, kemungkinan melibatkan kaedah di mana isyarat ganjaran itu sendiri dijana atau diperhalusi dengan cara yang lebih dinamik atau canggih, berpotensi mengurangkan pergantungan pada anotasi manusia yang memenatkan sambil masih menangkap keutamaan manusia yang bernuansa secara berkesan. Matlamatnya adalah untuk menanamkan pemahaman yang lebih baik kepada LLM tentang apa yang membentuk jawapan yang ‘baik’, bukan hanya yang betul dari segi tatabahasa atau berkemungkinan secara statistik. Ia adalah tentang menyelaraskan kompas dalaman AI dengan nilai dan objektif manusia.

  2. Self-Principled Critique Tuning: Komponen ini mencadangkan mekanisme yang menarik untuk penambahbaikan diri. Daripada hanya bergantung pada maklum balas luaran (manusia atau janaan model), LLM berpotensi dilatih untuk menilai proses penaakulannya sendiri berdasarkan satu set prinsip atau peraturan yang telah ditetapkan. Ini boleh melibatkan model belajar untuk mengenal pasti falasi logik, ketidakkonsistenan, atau penyelewengan daripada corak penaakulan yang dikehendaki dalam output yang dijana sendiri. Ia seumpama mengajar AI bukan sahaja jawapannya, tetapi prinsip asas logik dan pemikiran kritis, membolehkannya memperhalusi responsnya secara autonomi. Gelung kritikan dalaman ini boleh meningkatkan keteguhan dan kebolehpercayaan keupayaan penaakulan model dengan ketara.

Para penyelidik menegaskan bahawa model yang menggabungkan teknik gabungan ini, yang digelar DeepSeek-GRM, telah menunjukkan kejayaan yang ketara. Menurut kertas kerja mereka, model-model ini mencapai tahap prestasi yang ‘kompetitif’ dengan model ganjaran awam sedia ada yang berkuasa. Dakwaan ini, jika disahkan melalui ujian dan aplikasi yang lebih luas, mencadangkan satu langkah penting ke hadapan dalam membangunkan LLM yang boleh menaakul dengan lebih berkesan dan cekap, memberikan hasil berkualiti tinggi dengan lebih cepat apabila berhadapan dengan pertanyaan pengguna yang pelbagai. Ia menandakan laluan berpotensi ke arah sistem AI yang bukan sahaja berkuasa tetapi juga lebih selaras dengan jangkaan manusia untuk koheren logik dan ketepatan.

Kalkulus Strategik Keterbukaan

Menambah satu lagi lapisan pada strategi mereka, penyelidik DeepSeek dan Tsinghua University menunjukkan niat untuk menjadikan model DeepSeek-GRM sebagai sumber terbuka. Walaupun garis masa tertentu masih belum didedahkan, langkah ini sejajar dengan trend yang semakin meningkat, walaupun kompleks, dalam industri AI.

Mengapakah sebuah syarikat yang membangunkan teknologi yang berpotensi canggih memilih untuk berkongsinya? Motivasi boleh jadi pelbagai:

  • Penglibatan Komuniti dan Maklum Balas: Melepaskan model ke domain sumber terbuka mengundang penelitian, ujian, dan penambahbaikan daripada komuniti pembangun global. Ini boleh mempercepatkan pembangunan, mendedahkan kelemahan, dan memupuk inovasi jauh melebihi kapasiti satu organisasi.
  • Membina Kepercayaan dan Ketelusan: Dalam bidang yang kadangkala dicirikan oleh ketidakjelasan, sumber terbuka boleh membina muhibah dan menjadikan syarikat sebagai pemain kolaboratif yang komited untuk memajukan teknologi secara kolektif. DeepSeek sendiri sebelum ini menekankan komitmen terhadap ‘kemajuan ikhlas dengan ketelusan penuh’ apabila ia membuka repositori kod sumber terbuka pada awal tahun.
  • Menetapkan Piawaian dan Mendorong Penerimaan: Menjadikan model atau teknik yang berkuasa tersedia secara percuma boleh menggalakkan penerimaannya secara meluas, berpotensi menjadikannya sebagai standard de facto dan membina ekosistem di sekeliling teknologi syarikat.
  • Tarikan Bakat: Sumbangan sumber terbuka sering berfungsi sebagai magnet yang kuat untuk menarik bakat AI terkemuka, yang sering tertarik kepada persekitaran yang menggalakkan keterbukaan dan kerjasama.
  • Dinamik Persaingan: Dalam sesetengah kes, sumber terbuka boleh menjadi langkah strategik untuk menentang penguasaan model proprietari tertutup yang ditawarkan oleh pesaing yang lebih besar, meratakan padang permainan atau mengkomoditikan lapisan tertentu tindanan teknologi.

Niat DeepSeek yang dinyatakan untuk membuka sumber GRM, berikutan pelepasan repositori kodnya sebelum ini, mencadangkan strategi yang disengajakan yang merangkumi aspek keterbukaan tertentu, walaupun ia mengekalkan tahap budi bicara korporat mengenai pelancaran produk masa depan. Ketelusan yang terancang ini boleh terbukti penting dalam membina momentum dan kredibiliti dalam landskap AI global yang sangat kompetitif.

Gema Kejayaan dan Bisikan Langkah Seterusnya

Kertas kerja akademik yang memperincikan metodologi penaakulan baharu tiba di tengah-tengah rasa jangkaan yang ketara mengenai trajektori masa depan DeepSeek. Syarikat itu masih menunggang gelombang pengiktirafan yang dijana oleh keluarannya sebelum ini:

  • DeepSeek-V3: Model asasnya mendapat perhatian yang signifikan, terutamanya selepas naik taraf pada Mac 2024 (DeepSeek-V3-0324) yang disebut-sebut meningkatkan penaakulan, keupayaan pembangunan web yang lebih baik, dan kemahiran menulis Bahasa Cina yang lebih mahir.
  • DeepSeek-R1: Model yang berfokuskan penaakulan ini mencipta gelombang besar, menggegarkan komuniti teknologi global dengan penanda aras prestasinya yang mengagumkan, terutamanya berbanding kos pengkomputerannya. Ia menunjukkan bahawa keupayaan penaakulan peringkat tinggi berpotensi dicapai dengan lebih cekap, mencabar pemimpin yang sedia ada.

Rekod prestasi ini tidak dapat tidak mencetuskan spekulasi mengenai lelaran seterusnya, mungkin DeepSeek-R2. Laporan Reuters pada akhir musim bunga mencadangkan pelancaran R2 mungkin akan berlaku tidak lama lagi, mungkin seawal Jun 2024, menunjukkan cita-cita dalam syarikat untuk memanfaatkan profilnya yang semakin meningkat dengan cepat. Walau bagaimanapun, DeepSeek sendiri telah mengekalkan kesenyapan yang ketara mengenai perkara itu melalui saluran rasminya. Menariknya, media China melaporkan bahawa akaun perkhidmatan pelanggan yang dikaitkan dengan syarikat itu menafikan garis masa pelancaran yang akan berlaku dalam sembang kumpulan peribadi dengan pelanggan perniagaan.

Keengganan ini adalah ciri gaya operasi DeepSeek setakat ini. Walaupun mendapati dirinya berada dalam perhatian global, syarikat permulaan yang berpangkalan di Hangzhou itu, yang ditubuhkan oleh usahawan Liang Wenfeng, sebahagian besarnya telah mengelak daripada pengumuman awam dan gembar-gembur pemasaran. Fokusnya nampaknya tertumpu secara intensif kepada penyelidikan dan pembangunan, membiarkan prestasi modelnya bercakap untuk dirinya sendiri. Pendekatan ‘tunjuk, jangan cerita’ ini, walaupun mungkin mengecewakan bagi pemerhati pasaran yang tidak sabar untuk mendapatkan peta jalan yang pasti, menekankan komitmen terhadap kemajuan teknologi substantif berbanding gembar-gembur pramatang.

Kuasa di Sebalik Tabir: Kepimpinan Berwawasan dan Kekuatan Kewangan

Memahami kebangkitan pesat DeepSeek memerlukan penelitian terhadap pengasas dan sokongan kewangannya. Liang Wenfeng, usahawan berusia 40 tahun di sebalik usaha niaga itu, bukan sahaja seorang wawasan AI tetapi juga pengasas syarikat induk DeepSeek, High-Flyer Quant.

Hubungan ini adalah penting. High-Flyer Quant ialah dana lindung nilai (hedge fund) yang berjaya, dan sumber kewangannya yang besar menyediakan bahan api penting untuk usaha penyelidikan dan pembangunan DeepSeek yang intensif secara pengkomputeran. Melatih LLM terkini memerlukan kuasa pengkomputeran yang besar dan set data yang luas, mewakili halangan kewangan yang signifikan untuk masuk. Sokongan High-Flyer Quant secara berkesan menyediakan DeepSeek dengan sumber kewangan yang mendalam yang diperlukan untuk bersaing secara teknologi, membiayai perkakasan mahal, pemerolehan bakat, dan eksperimen meluas yang diperlukan untuk menolak sempadan AI.

Terdapat juga potensi sinergi antara dunia kewangan kuantitatif dan kecerdasan buatan. Kedua-dua bidang sangat bergantung pada pemprosesan sejumlah besar data, mengenal pasti corak kompleks, dan membina model ramalan yang canggih. Kepakaran yang diasah dalam High-Flyer Quant dalam mengendalikan data dan algoritma kewangan mungkin memberikan pendebungaan silang yang berharga untuk usaha AI DeepSeek.

Liang Wenfeng sendiri bukan sekadar pembiaya tetapi juga menyumbang secara teknikal. Pada Februari 2024, beliau bersama-sama mengarang kajian teknikal yang meneroka ‘native sparse attention’, satu teknik yang bertujuan untuk menjadikan LLM lebih cekap apabila memproses konteks atau jumlah data yang sangatbesar – satu lagi bidang kritikal untuk memajukan keupayaan AI. Gabungan kepimpinan keusahawanan, wawasan teknikal, dan sokongan kewangan yang besar ini membentuk gabungan kuat yang memacu kemajuan DeepSeek.

Mengemudi Landskap AI Global: Teknologi, Cita-cita, dan Geopolitik

Kemunculan dan kemajuan teknologi DeepSeek tidak boleh dilihat secara berasingan. Ia berlaku dalam konteks persaingan global yang sengit dalam kecerdasan buatan, terutamanya antara Amerika Syarikat (US) dan China. Kedua-dua negara melihat ketuanan AI sebagai kritikal untuk pertumbuhan ekonomi masa depan dan keselamatan negara, yang membawa kepada pelaburan besar-besaran dan inisiatif strategik.

Dalam persekitaran ini, syarikat-syarikat cemerlang seperti DeepSeek tidak dapat tidak menarik perhatian negara. Kepentingan ini ditegaskan pada akhir Februari 2024, apabila Liang Wenfeng mengambil bahagian dalam simposium di Beijing yang memberi tumpuan kepada usahawan teknologi, yang dihoskan oleh Presiden China Xi Jinping sendiri. Kemasukan pengasas DeepSeek dalam perhimpunan berprofil tinggi itu menandakan pengiktirafan di peringkat tertinggi dan meletakkan syarikat permulaan itu sebagai pembawa bendera yang berpotensi untuk cita-cita AI China.

DeepSeek semakin dipuji, di dalam dan di luar negara, sebagai bukti daya tahan teknologi China dan keupayaannya untuk berinovasi di barisan hadapan AI, walaupun terdapat usaha berterusan oleh US untuk menyekat akses China kepada teknologi semikonduktor termaju yang penting untuk pembangunan AI. Tumpuan negara ini membawa kedua-dua peluang dan tekanan. Ia boleh membuka kunci sumber dan sokongan selanjutnya tetapi juga berpotensi menyebabkan syarikat itu tertakluk kepada penelitian geopolitik yang lebih besar.

Ketika DeepSeek meneruskan kerjanya, memperhalusi metodologi penaakulan seperti GRM dan kritikan berprinsip kendiri, berpotensi menyediakan model R2 generasi seterusnya, dan mengemudi strateginya keterbukaan terancang, ia melakukannya bukan sahaja sebagai sebuah syarikat teknologi, tetapi sebagai pemain penting di papan catur global yang kompleks. Perjalanannya mewakili kajian kes yang menarik dalam cita-cita, inovasi, pembiayaan strategik, dan interaksi rumit antara kemajuan teknologi dan kepentingan negara dalam perlumbaan teknologi yang menentukan zaman kita. Fokus senyap pada R&D, digabungkan dengan pelepasan berkala teknologi yang benar-benar mengagumkan, mencadangkan strategi jangka panjang yang bertujuan untuk membina kepimpinan yang mampan dalam domain kritikal penaakulan kecerdasan buatan.