Menyungkai DeepSeek: Kebangkitan Kuasa AI China | ms

DeepSeek, sebuah nama yang cepat melonjak daripada tidak dikenali kepada tumpuan dalam perbualan AI global, telah mencetuskan perdebatan dan spekulasi yang sengit dalam sektor teknologi dan kewangan. Makmal AI China di sebalik kuasa yang berkembang ini telah mengganggu aturan yang sedia ada, mendorong penganalisis untuk mempersoalkan kemampanan penguasaan A.S. dalam perlumbaan AI dan daya maju jangka panjang permintaan cip AI semasa. Tetapi apakah faktor utama yang telah mendorong DeepSeek ke kedudukannya sekarang?

Asal-Usul DeepSeek: Dari Dana Lindung Nilai ke Makmal AI

Asal-usul DeepSeek berkait rapat dengan dunia kewangan kuantitatif. Ia disokong oleh High-Flyer Capital Management, sebuah dana lindung nilai China yang terkenal dengan penggunaan AI dalam membuat keputusan perdagangan berasaskan data.

Liang Wenfeng, seorang peminat AI dengan latar belakang dalam perdagangan semasa di Universiti Zhejiang, mengasaskan High-Flyer pada tahun 2015. Pada tahun 2019, beliau melancarkan High-Flyer Capital Management sebagai dana lindung nilai dengan tumpuan khusus pada membangunkan dan melaksanakan algoritma AI untuk aplikasi kewangan.

Pada tahun 2023, High-Flyer mengeramkan DeepSeek sebagai makmal penyelidikan AI khusus, beroperasi secara bebas daripada perniagaan kewangan terasnya. Kemudian, dengan High-Flyer sebagai pelabur utama, makmal itu dipisahkan menjadi entiti yang berasingan, mengekalkan nama DeepSeek.

Sejak awal penubuhannya, DeepSeek mengutamakan penubuhan kluster pusat data sendiri untuk memudahkan latihan model. Walau bagaimanapun, sama seperti syarikat AI lain yang beroperasi di China, DeepSeek telah menghadapi cabaran disebabkan oleh sekatan eksport A.S. ke atas perkakasan canggih. Akibatnya, untuk melatih modelnya yang lebih baru, syarikat itu terpaksa menggunakan cip Nvidia H800, varian cip H100 yang kurang berkuasa yang mudah didapati oleh syarikat A.S.

Pasukan teknikal DeepSeek terkenal dengan keremajaannya dan dinamismenya. Syarikat itu secara aktif merekrut penyelidik AI kedoktoran dari universiti terkemuka China. Tambahan pula, DeepSeek menggaji individu dari pelbagai latar belakang, malah mereka yang tidak mempunyai kepakaran sains komputer, untuk memastikan teknologinya dapat memahami dan memenuhi pelbagai subjek dengan berkesan, seperti yang dilaporkan oleh The New York Times.

Model AI DeepSeek: Mencabar Status Quo

DeepSeek melancarkan suite model awalnya – DeepSeek Coder, DeepSeek LLM, dan DeepSeek Chat – pada November 2023. Walau bagaimanapun, ia adalah pelancaran keluarga model DeepSeek-V2 generasi seterusnya pada musim bunga yang benar-benar menarik perhatian industri AI.

DeepSeek-V2, sistem serba boleh yang mampu menganalisis teks dan imej, menunjukkan prestasi yang mengagumkan merentasi pelbagai penanda aras AI. Terutamanya, ia mencapai prestasi ini pada kos yang jauh lebih rendah berbanding dengan model pesaing yang tersedia pada masa itu. Ini mendorong pesaing domestik DeepSeek, termasuk ByteDance dan Alibaba, untuk mengurangkan harga beberapa model mereka dan menawarkan yang lain secara percuma.

DeepSeek V3 telah mempamerkan prestasi yang lebih baik berbanding kedua-dua model sumber terbuka yang boleh dimuat turun seperti LlamaMeta dan model "tertutup" yang hanya boleh diakses melalui API, seperti GPT-4o OpenAI.

Sama penting ialah model "penaakulan" R1 DeepSeek. Dilancarkan pada Januari, DeepSeek menegaskan bahawa R1 mencapai prestasi yang setanding dengan model o1 OpenAI pada penanda aras utama.

Sebagai model penaakulan, R1 menggabungkan mekanisme semakan sendiri, mengurangkan beberapa kelemahan biasa yang berkaitan dengan model standard. Walaupun model penaakulan mungkin memerlukan masa pemprosesan yang lebih lama untuk mencapai penyelesaian (berkisar dari saat hingga minit), mereka cenderung untuk menunjukkan kebolehpercayaan yang lebih besar dalam domain seperti fizik, sains dan matematik.

Walau bagaimanapun, model DeepSeek, termasuk R1 dan DeepSeek V3, tertakluk kepada pengawasan oleh pengawal selia internet China, yang memastikan bahawa respons mereka selaras dengan "nilai sosialisme teras." Contohnya, dalam aplikasi chatbot DeepSeek, R1 tidak akan menangani soalan yang berkaitan dengan Dataran Tiananmen atau autonomi Taiwan.

Pada bulan Mac, trafik laman web DeepSeek melebihi 16.5 juta lawatan. Walaupun penurunan 25% dalam trafik berbanding Februari, DeepSeek menduduki tempat kedua dari segi lawatan harian, menurut David Carr, editor di Similarweb. Walau bagaimanapun, angka ini masih jauh lebih rendah berbanding ChatGPT, yang melebihi 500 juta pengguna aktif mingguan pada bulan Mac.

Pendekatan Mengganggu kepada Landskap AI

Model perniagaan DeepSeek masih agak misteri. Syarikat itu menetapkan harga produk dan perkhidmatannya jauh di bawah nilai pasaran, dan juga menawarkan beberapa secara percuma. Tambahan pula, ia telah menolak pembiayaan luaran walaupun terdapat minat yang besar daripada firma modal teroka.

DeepSeek mengaitkan daya saing kos yang melampau dengan penemuan dalam kecekapan. Walau bagaimanapun, beberapa pakar telah mempersoalkan ketepatan angka yang diberikan oleh syarikat.

Walau apa pun, pembangun telah menerima model DeepSeek, yang, walaupun bukan sumber terbuka dalam erti kata tradisional, tersedia di bawah lesen permisif yang membenarkan penggunaan komersial. Menurut Clem Delangue, Ketua Pegawai Eksekutif Hugging Face, pembangun di platform itu telah mencipta lebih daripada 500 model terbitan R1, mengumpul jumlah gabungan 2.5 juta muat turun.

Kejayaan DeepSeek terhadap pesaing yang lebih besar dan lebih mantap telah digambarkan sebagai "mengganggu AI" dan "terlalu gembar-gembur." Pencapaian syarikat itu sebahagiannya bertanggungjawab untuk penurunan 18% dalam harga saham Nvidia pada bulan Januari, dan mendorong respons awam daripada Ketua Pegawai Eksekutif OpenAI Sam Altman. Pada bulan Mac, biro Jabatan Perdagangan A.S. dilaporkan mengharamkan DeepSeek pada peranti kerajaan, menurut Reuters.

Microsoft telah menyepadukan DeepSeek ke dalam perkhidmatan Azure AI Foundry, platform yang menyatukan perkhidmatan AI untuk perusahaan. Semasa panggilan pendapatan suku pertama Meta, Ketua Pegawai Eksekutif Mark Zuckerberg menyatakan bahawa pelaburan dalam infrastruktur AI akan terus menjadi "kelebihan strategik" untuk syarikat itu, apabila ditanya mengenai potensi impak DeepSeek ke atas perbelanjaan AI Meta. Pada bulan Mac, OpenAI melabelkan DeepSeek sebagai "disubsidi negara" dan "dikawal negara," mengesyorkan agar kerajaan A.S. mempertimbangkan untuk mengharamkan modelnya.

Semasa panggilan pendapatan suku keempat Nvidia, Ketua Pegawai Eksekutif Jensen Huang menonjolkan "inovasi cemerlang" DeepSeek, dengan menyatakan bahawa model penaakulannya memerlukan kuasa pengkomputeran yang jauh lebih banyak, memberi manfaat kepada Nvidia.

Sebaliknya, beberapa syarikat, negara dan kerajaan, termasuk Korea Selatan dan negeri New York, telah mengharamkan penggunaan DeepSeek pada peranti kerajaan.

Pada bulan Mei, Naib Pengerusi dan Presiden Microsoft Brad Smith memberi keterangan di hadapan Senat bahawa pekerja Microsoft dilarang menggunakan DeepSeek kerana kebimbangan tentang keselamatan data dan potensi propaganda.

Masa Depan DeepSeek yang Tidak Pasti

Trajektori masa depan DeepSeek masih tidak pasti. Walaupun penambahbaikan model selanjutnya dijangka, kerajaan A.S. nampaknya semakin berhati-hati terhadap pengaruh asing yang berbahaya yang dirasakan. Pada bulan Mac, The Wall Street Journal melaporkan bahawa A.S. mungkin akan mengharamkan DeepSeek pada peranti kerajaan.

Kenaikan pesat DeepSeek tidak dapat dinafikan telah menggoncang asas industri AI, mendorong penilaian semula dinamik persaingan dan potensi untuk inovasi yang mengganggu. Sama ada ia dapat mengekalkan momentum semasanya dalam menghadapi peningkatan penelitian dan cabaran pengawalseliaan masih belum dapat dilihat. Tahun-tahun akan datang akan menjadi penting dalam menentukan impak jangka panjang DeepSeek ke atas landskap AI global. Keupayaannya untuk mengemudi interaksi kompleks kemajuan teknologi, pertimbangan geopolitik, dan kebimbangan etika akhirnya akan menentukan warisannya. Dunia AI akan memerhatikan dengan teliti.

Kisah DeepSeek adalah peringatan bahawa dalam dunia kecerdasan buatan yang berkembang pesat, pemain baharu boleh muncul dengan cepat dan mencabar aturan yang sedia ada. Kejayaan syarikat itu, didorong oleh teknologi inovatif dan kesediaan untuk mengganggu model perniagaan tradisional, telah memaksa industri untuk mengambil perhatian. Ketika DeepSeek terus membangun dan memperluas jangkauannya, ia pasti akan memainkan peranan penting dalam membentuk masa depan AI.

dikemaskinikan pada 2025-05-10

# LLM # AIGC # DeepSeek