Revolusi Senyap DeepSeek: Hype AI Mereda?

Beberapa hari lalu, DeepSeek dengan senyap melancarkan kemas kini kepada model AI R1nya. Dengan prestasi yang dipertingkatkan pada harga yang masih lebih rendah daripada kebanyakan pesaingnya, pelancaran itu mungkin dijangka menjana kehebohan yang ketara. Walau bagaimanapun, tindak balas daripada industri teknologi dan pelabur sangat senyap. Ini berbeza dengan reaksi pada awal tahun 2024, apabila model R1 awal DeepSeek menghantar gelombang kejutan melalui pasaran, mencetuskan kebimbangan tentang perbelanjaan AI generatif dan menyebabkan saham teknologi menjunam.

Kali ini, pendedahan model yang dikemas kini itu hampir tidak didaftarkan. Seperti yang dinyatakan oleh penganalisis Barclays, Ross Sandler, acara itu "datang dan pergi tanpa sebarang gangguan," mendorongnya untuk membuat kesimpulan bahawa pemahaman komuniti pelaburan tentang landskap AI telah matang dengan ketara dalam tempoh yang singkat.

Kes Ketidakpedulian Kolektif?

Untuk mengukur sentimen umum, tinjauan tidak formal telah dijalankan di kalangan ahli pasukan teknologi Business Insider. Keputusannya memberitahu:

  • Seorang editor mengaku terlepas kemas kini DeepSeek sepenuhnya, menyatakan rasa bersalah kerana tidak mengikuti perkembangan.
  • Seorang lagi rakan sekerja teringat melihat berita itu secara sepintas lalu tetapi tidak menyelidiki butirannya.
  • Seorang wartawan teknologi menyebut membaca sepintas lalu utas Reddit mengenai topik itu tetapi dengan cepat menolaknya.
  • Seorang lagi wartawan mengakui terlepas pengumuman itu sepenuhnya.
  • Seorang lagi editor hanya menyatakan, "tidak perasan tbh!"

Respons itu mengetengahkan kekurangan kesedaran yang meluas, malah di kalangan individu yang memantau berita teknologi setiap hari. Ini menimbulkan persoalan: mengapa kemajuan terkini DeepSeek gagal menarik perhatian yang mungkin pernah diperintahkannya?

Pasir Persaingan AI yang Beralih

Walaupun model R1 DeepSeek dianggap antara model AI berprestasi terbaik yang tersedia pada masa ini, impaknya tidak sejelas seperti dahulu. Sandler mencadangkan bahawa kelebihan harga relatif tawaran terkini DeepSeek telah berkurangan. Pada mulanya, ia adalah kira-kira 27 kali lebih murah daripada model o1 OpenAI. Kini, kelebihan itu telah mengecil kepada kira-kira 17 kali lebih murah.

Jurang harga yang semakin sempit ini menggariskan trend yang lebih luas: penumpuan prestasi di kalangan model AI terkemuka. Kebanyakan model ini dilatih pada set data yang serupa yang dikikis dari internet, menjadikannya semakin sukar untuk mencapai kelebihan daya saing yang ketara berdasarkan semata-mata prestasi. Kejayaan dengan cepat ditiru dan disepadukan ke dalam tawaran bersaing, meratakan padang permainan.

Kepentingan Pengagihan yang Meningkat

Walaupun harga kekal sebagai faktor, pengagihan muncul sebagai pembeza utama. Pengguna lebih cenderung untuk menggunakan model OpenAI dalam persekitaran perusahaan jika majikan mereka menyediakan akses kepada akaun ChatGPT. Begitu juga, pengguna telefon pintar Android lebih cenderung untuk berinteraksi dengan chatbot Gemini Google, memanfaatkan model AI gergasi carian itu.

DeepSeek pada masa ini tidak mempunyai saluran pengedaran yang teguh yang dinikmati oleh pesaingnya, terutamanya di pasaran Barat. Jangkauan terhad ini menghalang keupayaannya untuk mendapatkan penggunaan yang meluas, tanpa mengira keupayaan teknologinya.

Memikirkan Semula Kegilaan Infrastruktur AI

Kebimbangan awal yang menyelubungi model R1 DeepSeek pada awal tahun 2024 berpunca daripada kebimbangan bahawa makmal Cina itu telah membangunkan model yang lebih cekap, memerlukan kurang infrastruktur pengkomputeran. Walau bagaimanapun, realitinya mungkin lebih bernuansa.

Model "penaakulan" lanjutan seperti R1 DeepSeek dan o3 OpenAI memerlukan kuasa pengkomputeran yang besar kerana keupayaan mereka untuk membedah permintaan yang kompleks kepada berbilang langkah "pemikiran". Setiap langkah menjana gesaan baharu, menghasilkan lata token baharu yang mesti diproses.

Oleh itu, sumbangan DeepSeek mungkin terletak pada mempopularkan model penaakulan yang canggih ini, yang secara paradoks memerlukan pelaburan yang lebih besar dalam GPU dan sumber pengkomputeran lain. Ini mencabar andaian awal bahawa teknologi DeepSeek akan membawa kepada penurunan dalam perbelanjaan infrastruktur.

Di luar Hype: Perspektif yang Lebih Bernuansa

Sambutan yang tenang terhadap model AI terkini DeepSeek mencadangkan perubahan dalam cara industri teknologi melihat dan menilai kemajuan AI. Kegilaan awal telah memberi laluan kepada pendekatan yang lebih arif, dengan penekanan yang lebih besar pada pertimbangan praktikal seperti pengagihan, keperluan infrastruktur dan sejauh mana keuntungan prestasi yang sebenar.

Walaupun DeepSeek terus mendorong sempadan teknologi AI, kejayaannya akan bergantung bukan sahaja pada kehebatan teknikalnya tetapi juga pada keupayaannya untuk menavigasi dinamik landskap AI yang berkembang dan mewujudkan kedudukan yang kukuh dalam pasaran. Tumpuan beralih daripada keajaiban teknologi semata-mata kepada aplikasi dan kebolehcapaian praktikal.

Ilusi Keunggulan AI: Peranan Data yang Menentukan

Keterujaan awal yang menyelubungi model R1 DeepSeek sebahagiannya berpunca daripada persepsi bahawa ia mewakili lonjakan ketara ke hadapan dalam keupayaan AI. Walau bagaimanapun, apabila lebih banyak model telah muncul dan bidang itu telah matang, ia menjadi semakin jelas bahawa data asas yang digunakan untuk melatih model ini memainkan peranan penting dalam prestasi mereka. Kebanyakan data ini diambil daripada sumber yang sama - hamparan teks dan kod yang luas yang dikikis dari internet. Asas yang dikongsi ini tidak dapat dielakkan membawa kepada penumpuan dalam keupayaan, menjadikannya lebih sukar bagi mana-mana model tunggal untuk mencapai kedudukan yang benar-benar dominan.

Idea model AI tunggal yang maha kuasa yang mengatasi semua yang lain menjadi semakin kurang realistik. Sebaliknya, kita mungkin akan melihat landskap yang berpecah-belah dengan pelbagai model, masing-masing cemerlang dalam bidang tertentu dan memenuhi keperluan yang berbeza. Pengkhususan ini akan memerlukan pemahaman yang lebih bernuansa tentang kekuatan dan kelemahan setiap model, dan bukannya hanya bergantung pada metrik prestasi tajuk utama.

Kebolehcapaian dan Integrasi: Mengatasi Halangan Penerimaan

Kehebatan teknologi hanyalah satu bahagian daripada teka-teki itu. Untuk model AI benar-benar berjaya, ia mestilah mudah diakses dan mudah disepadukan ke dalam aliran kerja sedia ada. Di sinilah syarikat seperti OpenAI dan Google mempunyai kelebihan yang ketara. Platform mereka diterima pakai secara meluas, dan API mereka didokumentasikan dengan baik, menjadikannya agak mudah untuk pembangun dan perniagaan menggabungkan keupayaan AI mereka ke dalam produk dan perkhidmatan mereka.

DeepSeek menghadapi cabaran untuk mengatasi halangan penerimaan ini. Membina ekosistem yang kukuh di sekeliling modelnya, menawarkan dokumentasi yang komprehensif dan menyediakan sokongan yang teguh untuk pembangun akan menjadi langkah penting dalam mendapatkan daya tarikan dalam pasaran. Ini juga melibatkan menjalin perkongsian dengan pemain utama dalam pelbagai industri untuk mencipta penyelesaian yang disesuaikan yang memenuhi keperluan khusus.

Kesesakan GPU: Infrastruktur sebagai Faktor Pengehad

Pembangunan dan penggunaan model AI termaju sangat bergantung pada perkakasan khusus, terutamanya GPU. Pemproses berkuasa ini penting untuk melatih dan menjalankan algoritma AI yang intensif pengiraan. Apabila model AI menjadi lebih canggih, permintaan mereka untuk GPU terus meningkat, mewujudkan potensi kesesakan.

Ketersediaan terhad dan kos tinggi GPU boleh menghalang kemajuan syarikat AI yang lebih kecil, manakala pemain yang lebih besar dengan poket yang lebih dalam boleh mendapatkan akses kepada sumber yang mereka perlukan. Ini mewujudkan padang permainan yang tidak sekata dan boleh menghalang inovasi. Mengatasi kesesakan ini akan memerlukan pelaburan dalam seni bina perkakasan baharu dan algoritma AI yang lebih cekap yang boleh berjalan pada perkakasan yang kurang berkuasa.

Dimensi Etika: Memastikan Pembangunan AI yang Bertanggungjawab

Apabila model AI menjadi lebih bersepadu ke dalam kehidupan kita, adalah penting untuk menangani implikasi etika penggunaannya. Isu seperti berat sebelah, keadilan dan ketelusan mesti dipertimbangkan dengan teliti untuk memastikan bahawa sistem AI digunakan secara bertanggungjawab dan tidak mengekalkan stereotaip atau diskriminasi yang berbahaya.

Ini memerlukan pendekatan pelbagai aspek, termasuk membangunkan kaedah yang teguh untuk mengesan dan mengurangkan berat dalam data latihan, menggalakkan ketelusan dalam algoritma AI dan mewujudkan garis panduan yang jelas untuk penggunaan AI yang beretika. Pembangun AI juga mesti bertanggungjawab atas keputusan yang dibuat oleh sistem mereka dan bersedia untuk menangani sebarang akibat yang tidak diingini.

Landskap yang Berkembang: Proses Penyesuaian yang Berterusan

Bidang AI sentiasa berkembang, dengan kejayaan dan cabaran baharu muncul pada kadar yang pantas. Untuk terus mendahului keluk, pembangun AI mesti mudah menyesuaikan diri dan bersedia untuk menerima idea dan pendekatan baharu. Ini juga memerlukan komitmen kepada pembelajaran berterusan dan kesediaan untuk mencabar andaian sedia ada.

Masa depan AI mungkin dicirikan oleh penekanan yang lebih besar pada kerjasama, dengan penyelidik, pembangun dan penggubal dasar bekerjasama untuk menangani cabaran dan peluang yang dibentangkan oleh teknologi transformatif ini. Inisiatif sumber terbuka dan projek yang dipacu oleh komuniti akan memainkan peranan yang semakin penting dalam memupuk inovasi dan memastikan bahawa faedah AI dikongsi secara meluas.

Pengkhususan dan Aplikasi Nic

Daripada satu model AI yang menguasai semua tugas, kita boleh menjangkakan pengkhususan yang lebih besar dan peningkatan aplikasi khusus. Model AI yang berbeza akan disesuaikan dengan industri atau tugas tertentu, mengoptimumkan prestasi dan kecekapan untuk tujuan yang dimaksudkan. Sebagai contoh, satu model mungkin cemerlang dalam pemprosesan bahasa semula jadi untuk chatbot perkhidmatan pelanggan, manakala satu lagi mungkin dioptimumkan untuk pengecaman imej dalam diagnostik perubatan.

Pengkhususan in