Pencabar Baru Muncul: DeepSeek Ubah Landskap AI | ms

Perkembangan kecerdasan buatan yang tanpa henti jarang sekali berhenti untuk menarik nafas. Tepat ketika industri seolah-olah menetap dalam irama yang didominasi oleh beberapa gergasi yang dikenali, sering kali muncul pesaing baru di pentas, memaksa semua orang menilai semula keadaan semasa. Minggu lalu, tumpuan beralih ke timur, tepatnya kepada DeepSeek, sebuah firma China yang dengan pantas beralih dari ketidakjelasan menjadi pemain penting. Syarikat itu mengumumkan peningkatan besar pada model AI asasnya, yang digelar DeepSeek-V3-0324, menjadikannya mudah didapati dan menandakan persaingan yang semakin sengit bagi pemimpin mapan seperti OpenAI dan Anthropic. Ini bukan sekadar kemas kini tambahan; ia mewakili pertemuan prestasi yang lebih baik, harga yang agresif, dan dinamik geopolitik yang berubah yang memerlukan perhatian rapi.

Keupayaan Dipertingkat: Menajamkan Minda Algoritma

Inti pengumuman ini terletak pada dakwaan keupayaan yang dipertingkat dengan ketara dalam model baru. Penanda aras dalaman DeepSeek, yang pasti akan diteliti dan cuba direplikasi oleh pemerhati, menunjukkan peningkatan ketara dalam dua bidang kritikal: penaakulan (reasoning) dan pengekodan (coding). Dalam dunia model bahasa besar (LLMs) yang rumit, ini bukanlah peningkatan yang remeh.

Penaakulan yang dipertingkat menandakan AI yang dapat memahami konteks dengan lebih baik, mengikuti arahan pelbagai langkah yang kompleks, terlibat dalam penyelesaian masalah yang lebih canggih, dan berpotensi menghasilkan output yang lebih logik dan koheren. Ia adalah perbezaan antara AI yang hanya dapat mengambil maklumat dan AI yang dapat mensintesisnya, membuat inferens, dan mungkin juga menunjukkan akal sehat asas. Bagi pengguna, ini diterjemahkan kepada bantuan yang lebih dipercayai untuk tugas yang memerlukan pemikiran kritis, analisis, atau pemahaman bernuansa. Ia menggerakkan jarum dari sekadar padanan corak ke arah proses kognitif yang lebih mirip manusia, mengurangkan kekerapan respons yang tidak masuk akal atau ‘halusinasi’ yang boleh menjejaskan kepercayaan terhadap sistem AI.

Pada masa yang sama, keupayaan pengekodan yang dipertingkat adalah rahmat langsung kepada komuniti global pembangun perisian dan jurutera yang luas. AI yang mahir dalam menjana, menyahpepijat, menterjemah, dan menerangkan kod merentasi pelbagai bahasa pengaturcaraan bertindak sebagai pengganda produktiviti yang kuat. Ia dapat mempercepat kitaran pembangunan, membantu pembangun mengatasi halangan teknikal yang kompleks, mengautomasikan tugas pengekodan berulang, dan bahkan menurunkan halangan kemasukan bagi bakal pengaturcara. Memandangkan perisian terus menyokong hampir setiap aspek kehidupan moden dan perniagaan, AI yang cemerlang dalam domain ini mempunyai nilai praktikal dan ekonomi yang sangat besar. Fokus DeepSeek di sini menunjukkan pemahaman yang jelas tentang pangkalan pengguna berpotensi yang besar.

Walaupun istilah seperti ‘pemikiran yang lebih baik’ mungkin kedengaran abstrak, impak nyata kemajuan dalam penaakulan dan pengekodan adalah mendalam. Ia meluaskan skop tugas yang boleh dikendalikan oleh AI dengan andal, menjadikannya alat yang lebih serba boleh untuk individu dan perusahaan. Kepantasan DeepSeek mendakwa telah mencapai keuntungan ini juga patut diberi perhatian, menekankan kitaran lelaran pantas yang lazim dalam sektor AI hari ini.

Halaju Inovasi: Pecutan Syarikat Permulaan

Trajektori DeepSeek adalah kajian kes dalam pembangunan yang dipercepatkan. Syarikat itu sendiri baru sahaja muncul di mata umum baru-baru ini, dilaporkan ditubuhkan hanya tahun lepas. Namun, kemajuannya sangat pantas. Model V3 awal membuat penampilan sulungnya pada bulan Disember, diikuti dengan pantas oleh model R1 pada bulan Januari, yang disesuaikan untuk tugas penyelidikan yang lebih mendalam. Kini, hampir dua bulan kemudian, lelaran V3-0324 yang dipertingkat dengan ketara (dinamakan mengikut konvensyen yang menunjukkan tarikh penyiapannya pada Mac 2024) telah tiba.

Jadual pelepasan pantas ini berbeza dengan rentak yang kadang-kadang lebih terukur dari pemain yang lebih besar dan lebih mapan. Ia mencerminkan tekanan dan cita-cita yang kuat dalam bidang AI, terutamanya di kalangan peserta baru yang berusaha untuk mengukir bahagian pasaran. Ia juga menonjolkan potensi kelebihan ketangkasan dan pelaksanaan terfokus yang kadang-kadang dapat dimanfaatkan oleh pasukan yang lebih kecil dan berdedikasi. Membina LLM yang canggih adalah usaha yang sangat kompleks, memerlukan kepakaran mendalam dalam pembelajaran mesin, set data besar untuk latihan, dan sumber pengkomputeran yang besar. Mencapai hampir pariti dengan model yang dibangunkan dalam tempoh yang lebih lama oleh gergasi industri, seperti yang dicadangkan oleh penanda aras DeepSeek, adalah satu pencapaian teknikal yang signifikan jika disahkan secara bebas.

Halaju ini menimbulkan persoalan mengenai pembiayaan DeepSeek, strategi pemerolehan bakat, dan pendekatan teknologinya. Adakah mereka memanfaatkan seni bina baru, metodologi latihan yang lebih cekap, atau mungkin mendapat manfaat daripada akses kepada sumber data yang unik? Apa pun faktor asasnya, keupayaan mereka untuk mengulang dan meningkatkan model mereka dengan begitu cepat meletakkan mereka sebagai pesaing yang serius dan dinamik, mampu mengganggu hierarki yang mapan.

Persamaan Kos: Mengganggu Ekonomi AI

Mungkin aspek yang paling menarik dalam pengumuman DeepSeek, selain spesifikasi teknikal, adalah proposisi ekonomi. Sambil berusaha untuk tahap prestasi yang setanding dengan GPT-4 terkenal OpenAI atau model Claude 2 yang berkebolehan dari Anthropic, DeepSeek menegaskan bahawa penawarannya datang pada kos operasi yang jauh lebih rendah. Dakwaan ini, jika terbukti dalam penggunaan dunia nyata, boleh membawa implikasi yang meluas untuk penggunaan dan kebolehcapaian AI lanjutan.

Pembangunan dan penggunaan model AI canggih, sehingga kini, sinonim dengan perbelanjaan yang mengejutkan. Melatih gergasi ini memerlukan kuasa pengkomputeran yang besar, terutamanya dibekalkan oleh pemproses khusus seperti GPU, menggunakan sejumlah besar tenaga dan menanggung bil pengkomputeran awan yang besar. Syarikat seperti OpenAI (disokong kuat oleh infrastruktur awan Azure Microsoft) dan Google (dengan platform awannya sendiri yang luas) telah memanfaatkan poket dalam mereka dan kelebihan infrastruktur untuk menolak sempadan skala dan keupayaan AI. Ini telah mewujudkan halangan kemasukan yang tinggi, di mana hanya entiti yang dibiayai dengan baik secara realistik dapat bersaing di peringkat teratas.

Penegasan DeepSeek mengenai kos yang lebih rendah mencabar paradigma ini. Jika model yang menawarkan prestasi setanding memang boleh dijalankan dengan lebih murah, ia mendemokrasikan akses kepada alat AI yang berkuasa.

Syarikat Permulaan dan Perniagaan Kecil: Syarikat tanpa bajet awan berbilion dolar boleh mengintegrasikan keupayaan AI yang canggih ke dalam produk dan perkhidmatan mereka.
Penyelidik dan Akademik: Akses kepada model berkuasa pada kos yang lebih rendah boleh mempercepat penemuan saintifik dan inovasi merentasi pelbagai bidang.
Pengguna Individu: Panggilan API atau yuran langganan yang lebih berpatutan boleh menjadikan alat AI lanjutan boleh diakses oleh khalayak yang lebih luas.

Mekanisme di sebalik penjimatan kos yang didakwa ini masih agak kabur. Ia boleh berpunca daripada seni bina model yang lebih cekap, proses inferens yang dioptimumkan (bagaimana model menjana respons selepas latihan), penemuan dalam teknik latihan yang memerlukan kurang pengkomputeran, atau gabungan daripadanya. Tanpa mengira spesifiknya, potensi untuk memisahkan prestasi AI canggih daripada kos operasi yang terlalu tinggi adalah pembeza pasaran yang kuat. Apabila perniagaan semakin mengintegrasikan AI ke dalam aliran kerja mereka, kos kumulatif panggilan API dan penggunaan model menjadi faktor penting. Penyedia yang menawarkan penjimatan besar tanpa kompromi besar pada kualiti bersedia untuk merebut bahagian pasaran yang signifikan. Tekanan ekonomi ini boleh memaksa pemain sedia ada untuk menilai semula struktur harga mereka sendiri dan mencari kecekapan yang lebih besar.

Arus Perubahan: Geopolitik dan Landskap AI

Kemunculan DeepSeek sebagai pesaing yang kuat menggariskan trend yang lebih luas: penyebaran beransur-ansur keupayaan pembangunan AI peringkat teratas di luar kubu kuat tradisional Amerika Syarikat. Selama bertahun-tahun, Silicon Valley dan makmal penyelidikan gabungannya sebahagian besarnya menguasai landskap LLM. Walau bagaimanapun, kebangkitan model berkebolehan daripada syarikat dan kumpulan penyelidikan di China, Eropah (seperti Mistral AI Perancis), dan tempat lain menandakan dunia AI yang lebih multipolar.

DeepSeek, yang berasal dari China, membawa dimensi geopolitik ini ke dalam fokus yang tajam. Kebangkitannya yang pesat menunjukkan pelaburan dan kumpulan bakat yang signifikan yang China dedikasikan untuk kecerdasan buatan. Ia mencabar tanggapan penguasaan AS yang berkekalan dalam domain teknologi kritikal ini. Peralihan ini bukan sekadar akademik; ia membawa implikasi nyata:

Persaingan Teknologi: Negara-negara semakin melihat kepimpinan AI sebagai penting untuk daya saing ekonomi dan keselamatan negara. Kebangkitan pesaing kuat mendorong pelaburan dan inovasi selanjutnya secara global tetapi juga mencetuskan kebimbangan tentang ketinggalan.
Diversifikasi Rantaian Bekalan: Kebergantungan pada model AI terutamanya dari satu rantau mewujudkan potensi kelemahan. Ketersediaan alternatif yang kuat dari sfera geopolitik yang berbeza menawarkan pengguna lebih banyak pilihan dan berpotensi mengurangkan risiko yang berkaitan dengan kebergantungan platform atau sekatan bermotifkan politik.
Percanggahan Peraturan: Rantau yang berbeza mungkin mengguna pakai pendekatan yang berbeza-beza terhadap peraturan AI mengenai privasi data, ketelusan algoritma, dan garis panduan etika. Asal usul model AI boleh mempengaruhi penjajarannya dengan rangka kerja kawal selia tertentu.

Seperti yang dijangkakan, kejayaan syarikat seperti DeepSeek tidak terlepas pandang oleh penggubal dasar. Kebimbangan mengenai keselamatan negara, harta intelek, dan potensi penyalahgunaan teknologi AI yang berkuasa telah membawa kepada gesaan, terutamanya di AS, untuk menyekat atau bahkan mengharamkan penggunaan model yang dibangunkan oleh syarikat yang dianggap sebagai saingan geopolitik. Perdebatan ini menonjolkan interaksi kompleks antara kemajuan teknologi, perdagangan global, dan hubungan antarabangsa. Masa depan pembangunan AI kemungkinan besar akan semakin dibentuk oleh pertimbangan geopolitik ini, berpotensi membawa kepada ekosistem yang terfragmentasi atau blok ‘tekno-nasionalis’.

Implikasi Sumber: Sekilas Kecekapan?

Naratif yang mengelilingi AI generasi akan datang sering disertai dengan amaran mengerikan tentang selera sumbernya yang tidak pernah puas. Unjuran peningkatan permintaan eksponen untuk kuasa pengkomputeran, kapasiti pusat data, dan elektrik untuk melatih dan menjalankan model yang semakin besar telah menimbulkan kebimbangan mengenai kelestarian alam sekitar dan had infrastruktur. Kos semata-mata yang terlibat, seperti yang dibincangkan sebelum ini, adalah cerminan langsung keamatan sumber ini.

Keberkesanan kos yang didakwa oleh DeepSeek, jika menunjukkan kecekapan asas yang tulen, menawarkan naratif balas yang berpotensi. Ia membayangkan bahawa penemuan dalam seni bina model atau pengoptimuman latihan mungkin membolehkan peningkatan keupayaan yang signifikan tanpa letupan berkadar dalam penggunaan sumber. Mungkin jalan ke hadapan tidak semestinya membawa kepada model yang memerlukan output kuasa bandar kecil. Jika pembangun AI dapat mencari cara untuk mencapai lebih banyak dengan kurang – lebih banyak kecerdasan per watt, lebih banyak prestasi per dolar – ia boleh mengurangkan beberapa kebimbangan yang paling mendesak tentang skalabiliti jangka panjang dan kelestarian pembangunan AI.

Ini tidak bermakna permintaan sumber akan lenyap, tetapi ia menunjukkan bahawa inovasi tidak semata-mata tertumpu pada penskalaan daya kasar. Kecekapan itu sendiri menjadi paksi persaingan yang kritikal. Model yang bukan sahaja berkuasa tetapi juga agak ringan dan ekonomik untuk dijalankan boleh membuka kunci aplikasi dalam persekitaran terhad sumber, seperti pada peranti pinggir (telefon pintar, sensor) dan bukannya bergantung semata-mata pada pusat data awan yang besar. Walaupun keluaran terbaru DeepSeek tidak akan menyelesaikan masalah penggunaan tenaga AI secara sendirian, ia berfungsi sebagai titik data yang menggalakkan yang menunjukkan bahawa kepintaran teknologi mungkin masih mencari laluan yang lebih mampan ke arah kecerdasan am buatan atau pendahulunya.

Konteks Lebih Luas: Lebih Daripada Sekadar Kod dan Kos

Keluaran DeepSeek V3-0324 adalah lebih daripada sekadar kemas kini teknikal; ia adalah cerminan beberapa dinamik industri yang lebih luas.

Debat Sumber Terbuka vs. Tertutup: Dengan menjadikan model tersedia di Hugging Face, platform popular untuk berkongsi model pembelajaran mesin dan kod, DeepSeek menerima tahap keterbukaan. Walaupun mungkin tidak sepenuhnya sumber terbuka dalam erti kata yang paling ketat (bergantung pada spesifik pelesenan), ini berbeza dengan pendekatan proprietari yang lebih tertutup dari beberapa pesaing seperti model paling maju OpenAI. Kebolehcapaian ini memupuk eksperimen komuniti, penelitian, dan berpotensi penggunaan yang lebih cepat.
Trajektori Komoditisasi: Apabila keupayaan menjadi lebih meluas dan perbezaan prestasi antara model teratas menyempit, faktor seperti kos, kemudahan integrasi, set ciri khusus, dan sokongan serantau menjadi pembeza yang semakin penting. Fokus DeepSeek pada kos menunjukkan kesedaran tentang potensi trend komoditisasi ini.
Ekosistem Bakat: Keupayaan syarikat yang agak baru untuk membangunkan model yang begitu kompetitif menunjukkan banyak perkara tentang pengedaran bakat AI global. Kepakaran tidak lagi terhad kepada beberapa kluster geografi tertentu.

Walaupun terlalu awal untuk mengisytiharkan peralihan asas dalam keseimbangan kuasa AI berdasarkan satu keluaran model, kemajuan DeepSeek tidak dapat dinafikan. Ia menyuntik persaingan baru ke dalam pasaran, memberi tekanan kepada pemain sedia ada mengenai harga dan prestasi, dan menonjolkan sifat global inovasi AI. Sama ada menyahpepijat kod, merangka dokumen, atau melakukan analisis kompleks, alat yang tersedia menjadi lebih berkuasa dan, berpotensi, lebih mudah diakses, berasal dari set pemain yang semakin pelbagai di seluruh dunia. Masa depan AI sedang ditulis bukan sahaja di Silicon Valley, tetapi di Shenzhen, Hangzhou, Paris, dan seterusnya.

dikemaskinikan pada 2025-03-27

# LLM # AGI # DeepSeek