DeepSeek: Peralihan ke Penerimaan AI Perusahaan

DeepSeek, sebuah syarikat permulaan AI China yang semakin meningkat, membuat gelombang dengan model asasnya yang didiskaunkan dengan ketara. Langkah ini berpotensi merevolusikan penerimaan AI untuk perniagaan dengan menangani salah satu halangan yang paling ketara: kos.

Kos Tinggi Penerimaan AI

Menurut penganalisis Brad Sills dan Carly Liu dari BofA Global Research, perbelanjaan yang berkaitan dengan aplikasi AI adalah halangan utama yang menghalang pelaksanaan meluas mereka. Laporan mereka, yang dikeluarkan pada hari Selasa, 28 Januari, mencadangkan bahawa penemuan dalam pengurangan kos boleh mengurangkan lagi harga, yang membawa kepada peningkatan kadar penerimaan.

Pengumuman DeepSeek pada hari Isnin, 27 Januari, menghantar gelombang kejutan melalui industri AI, menyebabkan penurunan dalam saham beberapa syarikat AI. Syarikat itu mendedahkan kemampuannya untuk melatih model asas dengan hanya $5.58 juta menggunakan 2,048 cip Nvidia H800. Angka ini sangat berbeza dengan anggaran kos OpenAI dan Anthropic, yang berjulat dari $100 juta hingga satu bilion dolar dan melibatkan penggunaan beribu-ribu cip AI Nvidia.

Roy Benesh, CTO di eSIMple, menekankan potensi transformatif pencapaian DeepSeek, dengan menyatakan bahawa ia memperkasakan syarikat yang lebih kecil, pembangun individu, dan juga penyelidik untuk memanfaatkan kuasa AI tanpa menanggung kos yang terlalu tinggi. Peningkatan kebolehaksesan ini boleh memupuk pembangunan idea dan teknologi inovatif, yang membawa kepada daya saing yang lebih besar dalam bidang ini. Akibatnya, pelanggan boleh mendapat manfaat daripada pilihan baharu, manakala syarikat AI yang mantap berkemungkinan menurunkan harga mereka dan mempercepatkan kemajuan teknologi.

Penganalisis BofA memberikan contoh kos yang berkaitan dengan aplikasi AI sedia ada. Microsoft’s 365 Copilot Chat mengenakan bayaran antara 1 sen dan 30 sen setiap prompt, bergantung pada kerumitan permintaan. Salesforce’s Agentforce for Service Cloud mengenakan kadar rata $2 setiap penukaran.

Walaupun BofA mengakui bahawa angka $5.58 juta yang dibentangkan oleh DeepSeek agak mengelirukan kerana pengecualian kos yang berkaitan dengan penyelidikan, eksperimen, seni bina, algoritma, dan data, penganalisis menekankan kepentingan inovasi syarikat permulaan itu dalam menunjukkan kemungkinan kaedah latihan yang kurang mahal.

Pra-Latihan lwn. Inferens: Memahami Kos

Model AI asas, seperti GPT-4o OpenAI dan Gemini Google, menjalani proses yang dipanggil pra-latihan, di mana mereka didedahkan kepada sejumlah besar data, seperti seluruh internet, untuk membangunkan pengetahuan am. Walau bagaimanapun, untuk menjadikan model ini lebih relevan dan berguna untuk syarikat dan industri tertentu, perusahaan perlu melatih atau memperhalusinya lagi menggunakan data mereka sendiri.

Sebaik sahaja model AI telah diperhalusi, ia boleh memproses prompt pengguna dan menjana respons yang relevan. Walau bagaimanapun, proses prompting model dan mendapatkan respons menanggung kos inferens, yang merupakan yuran yang berkaitan dengan melibatkan model dengan data baharu untuk memahami dan menganalisis.

Adalah penting untuk ambil perhatian bahawa kebanyakan syarikat tidak menanggung kos latihan model asas. Tanggungjawab ini terletak pada pembangun model ini, termasuk OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, makmal penyelidikan tertentu, dan gergasi teknologi China seperti Baidu dan Alibaba.

Perniagaan terutamanya menanggung kos inferens untuk memproses beban kerja AI, yang merupakan majoriti perbelanjaan berkaitan AI.

Hubungan China: Kos Inferens DeepSeek dan Kebimbangan Privasi

DeepSeek menawarkan perkhidmatan inferensnya sendiri pada kos yang jauh lebih rendah berbanding syarikat Silicon Valley. Walau bagaimanapun, terdapat pertimbangan tertentu yang perlu diingat apabila menggunakan perkhidmatan ini.

Menurut dasar privasi DeepSeek, maklumat pengguna disimpan pada pelayan yang terletak di China. Syarikat itu juga menyatakan bahawa ia akan mematuhi kewajipan undang-undang dan melaksanakan tugas demi kepentingan awam atau untuk melindungi kepentingan penting penggunanya dan orang lain.

Undang-undang perisikan negara China, khususnya artikel 7, mengamanahkan bahawa semua organisasi dan rakyat menyokong, membantu, dan bekerjasama dengan usaha perisikan negara mengikut undang-undang dan melindungi rahsia kerja perisikan negara yang mereka sedari.

Kevin Surace, CEO Appvance, membangkitkan kebimbangan tentang privasi, dengan menyatakan bahawa pengumpulan data daripada pengguna adalah amalan biasa di China. Beliau menasihati pengguna untuk berhati-hati.

Dalam eksperimen yang dijalankan oleh PYMNTS, chatbot DeepSeek diminta menjelaskan bagaimana protes Dataran Tiananmen 1989 telah mempengaruhi politik China. Chatbot itu menjawab, “Maaf, saya tidak pasti bagaimana untuk mendekati jenis soalan ini lagi.”

Tim Enneking, CEO di Presearch, menegaskan bahawa DeepSeek adalah syarikat milik China 100% yang terletak di China. Beliau menyatakan bahawa ketidakupayaan chatbot untuk memberikan maklumat mengenai Dataran Tiananmen atau tokoh kanan kerajaan China mencadangkan batasan dalam objektiviti teknologi. Walaupun Enneking mengakui potensi menarik teknologi, beliau menyatakan kebimbangan tentang kawalannya.

Walau bagaimanapun, Enneking juga menekankan sifat sumber terbuka model DeepSeek, yang membolehkan semakan untuk menghapuskan kawalan kerajaan dan korporat. Beliau percaya bahawa kreativiti kejuruteraan syarikat mewujudkan peluang untuk syarikat dan negara yang lebih kecil untuk mengambil bahagian dan berjaya dalam landskap AI generatif.

Potensi DeepSeek untuk Menurunkan Kos Inferens untuk Semua

Pendekatan inovatif DeepSeek untuk melatih model asas pada kos yang lebih rendah mempunyai implikasi positif untuk syarikat seperti Microsoft, yang boleh terus mengurangkan kos pengkomputeran AI dan memacu skala. Menurut Sills dan Liu, kos pengkomputeran yang lebih rendah boleh membawa kepada peningkatan margin pada tawaran yang didayakan AI.

Dalam nota penyelidikan yang berasingan, penganalisis BofA Alkesh Shah, Andrew Moss, dan Brad Sills mencadangkan bahawa kos pengiraan AI yang lebih rendah boleh membolehkan perkhidmatan AI yang lebih luas merentasi pelbagai sektor, dari kereta hingga telefon pintar.

Walaupun tidak mungkin pembangun model asas seperti OpenAI akan segera mencapai kos latihan serendah DeepSeek, penganalisis percaya bahawa teknik latihan dan pasca latihan inovatif DeepSeek akan diterima pakai oleh pembangun model sempadan yang bersaing untuk meningkatkan kecekapan. Walau bagaimanapun, mereka menekankan bahawa model semasa masih memerlukan pelaburan yang ketara kerana ia membentuk asas untuk ejen AI.

Dalam jangka masa panjang, penganalisis menjangkakan penerimaan AI yang dipercepatkan oleh perusahaan kerana chatbot, copilot, dan ejen menjadi lebih bijak dan lebih murah, fenomena yang dikenali sebagai paradoks Jevons.

Ketua Pegawai Eksekutif Microsoft Satya Nadella mengulangi sentimen ini di X, dengan menyatakan bahawa paradoks Jevons sedang berlaku apabila AI menjadi lebih cekap dan mudah diakses. Beliau percaya bahawa ini akan membawa kepada lonjakan dalam penggunaan AI, mengubahnya menjadi komoditi yang kita tidak boleh mendapatkan cukup.

Menyelami Lebih Dalam Model Asas dan Kesannya

Model asas, tulang belakang AI moden, merevolusikan cara perniagaan beroperasi dan berinteraksi dengan teknologi. Model ini, yang dilatih pada set data yang besar, mempunyai keupayaan untuk melaksanakan pelbagai tugas, daripada pemprosesan bahasa semula jadi hingga pengecaman imej. Walau bagaimanapun, pembangunan dan penggunaan model ini melibatkan interaksi kompleks faktor, termasuk kos latihan, kos inferens, privasi data, dan pertimbangan etika.

Memahami Model Asas

Pada terasnya, model asas ialah rangkaian saraf besar yang dilatih pada set data yang besar. Proses latihan ini membolehkan mereka mempelajari corak dan hubungan dalam data, membolehkan mereka melaksanakan pelbagai tugas dengan ketepatan yang luar biasa. Beberapa contoh model asas termasuk:

  • GPT-4o: Model bahasa yang berkuasa yang dibangunkan oleh OpenAI, mampu menjana teks berkualiti manusia, menterjemah bahasa, dan menjawab soalan dengan cara yang komprehensif.
  • Gemini Google: Model AI multimodal yang boleh memproses dan memahami pelbagai jenis data, termasuk teks, imej, dan audio.

Model ini tidak terhad kepada tugas tertentu tetapi boleh disesuaikan dengan pelbagai aplikasi, menjadikannya alat serba boleh untuk perniagaan.

Peranan Pra-Latihan dan Penalaan Halus

Pembangunan model asas biasanya melibatkan dua peringkat utama: pra-latihan dan penalaan halus.

  • Pra-latihan: Dalam peringkat ini, model dilatih pada set data yang besar, seperti seluruh internet, untuk mempelajari pengetahuan am dan kemahiran bahasa. Proses ini melengkapkan model dengan keupayaan untuk memahami dan menjana teks, menterjemah bahasa, dan melaksanakan tugas asas yang lain.
  • Penalaan Halus: Dalam peringkat ini, model pra-latihan dilatih lagi pada set data yang lebih kecil dan lebih khusus yang berkaitan dengan tugas atau industri tertentu. Proses ini membolehkan model menyesuaikan pengetahuan dan kemahirannya kepada keperluan khusus aplikasi.

Sebagai contoh, model bahasa pra-latihan boleh ditala halus pada set data interaksi perkhidmatan pelanggan untuk mencipta chatbot yang boleh bertindak balas dengan berkesan terhadap pertanyaan pelanggan.

Kos Latihan dan Inferens

Kos yang berkaitan dengan model asas boleh dibahagikan kepada dua kategori utama: kos latihan dan kos inferens.

  • Kos latihan: Kos ini melibatkan sumber pengkomputeran, data, dan kepakaran yang diperlukan untuk melatih model asas. Melatih model asas yang besar boleh menjadi sangat mahal, selalunya memerlukan pelaburan berjuta-juta dolar.
  • Kos inferens: Kos ini melibatkan sumber pengkomputeran yang diperlukan untuk menggunakan model terlatih untuk membuat ramalan atau menjana output. Kos inferens boleh berbeza-beza bergantung pada saiz dan kerumitan model, jumlah data yang diproses, dan infrastruktur yang digunakan.

Inovasi DeepSeek terletak pada keupayaannya untuk mengurangkan kos latihan yang berkaitan dengan model asas dengan ketara, menjadikannya lebih mudah diakses oleh pelbagai perniagaan dan organisasi.

Menangani Kebimbangan Privasi dan Etika

Penggunaan model asas menimbulkan soalan penting tentang privasi data dan pertimbangan etika. Model asas dilatih pada set data yang besar, yang mungkin mengandungi maklumat sensitif atau peribadi. Adalah penting untuk memastikan bahawa model ini digunakan dengan cara yang bertanggungjawab dan beretika, menghormati privasi pengguna dan mengelakkan berat sebelah.

Beberapa strategi untuk menangani kebimbangan ini termasuk:

  • Penganonan data: Mengalih keluar atau menutup maklumat peribadi daripada data latihan untuk melindungi privasi pengguna.
  • Pengesanan dan mitigasi berat sebelah: Mengenal pasti dan menangani berat sebelah dalam data latihan untuk memastikan bahawa model tidak mengekalkan stereotaip berbahaya atau amalan diskriminasi.
  • Ketelusan dan akauntabiliti: Memberikan maklumat yang jelas tentang cara model berfungsi dan cara ia digunakan, dan mewujudkan mekanisme untuk akauntabiliti sekiranya berlaku kesilapan atau akibat yang tidak diingini.

Memandangkan model asas menjadi lebih lazim, adalah penting untuk menangani kebimbangan privasi dan etika ini secara proaktif untuk memastikan bahawa ia digunakan untuk manfaat masyarakat.

Masa Depan Model Asas

Model asas berkembang pesat, dan potensi impaknya terhadap masyarakat adalah sangat besar. Pada masa hadapan, kita boleh menjangkakan untuk melihat:

  • Model yang lebih berkuasa dan serba boleh: Memandangkan penyelidik terus membangunkan seni bina dan teknik latihan baharu, model asas akan menjadi lebih berkuasa dan serba boleh, mampu melaksanakan pelbagai tugas dengan ketepatan yang lebih tinggi.
  • Peningkatan kebolehaksesan: Memandangkan kos latihan menurun dan platform AI berasaskan awan menjadi lebih lazim, model asas akan menjadi lebih mudah diakses oleh perniagaan dari semua saiz.
  • Aplikasi dan kes penggunaan baharu: Model asas akan terus digunakan untuk kes penggunaan baharu dan inovatif merentasi pelbagai industri, daripada penjagaan kesihatan hingga kewangan hingga pendidikan.

Kemunculan model asas mewakili peralihan paradigma dalam bidang kecerdasan buatan. Dengan memahami keupayaan, kos, dan pertimbangan etika mereka, kita boleh memanfaatkan kuasa mereka untuk mencipta masa depan yang lebih baik.

Sumbangan DeepSeek untuk Mendemokrasikan AI

Pencapaian DeepSeek dalam mengurangkan kos latihan model asas dengan ketara menandakan detik penting dalam pendemokrasian AI. Dengan menurunkan halangan untuk masuk, DeepSeek memperkasakan pelbagai organisasi dan individu untuk mengambil bahagian dalam revolusi AI.

Impak pada Perniagaan yang Lebih Kecil

Perniagaan yang lebih kecil selalunya kekurangan sumber dan kepakaran untuk membangunkan dan menggunakan model AI mereka sendiri. Model asas kos efektif DeepSeek menyediakan perniagaan ini dengan akses kepada teknologi AI canggih yang sebelum ini berada di luar jangkauan. Ini boleh menyamakan kedudukan, membolehkan perniagaan yang lebih kecil bersaing dengan lebih berkesan dengan syarikat yang lebih besar dan lebih mantap.

Sebagai contoh, perniagaan e-dagang kecil boleh menggunakan model DeepSeek untuk memperibadikan cadangan produk untuk pelanggannya, meningkatkan perkhidmatan pelanggannya, atau mengautomasikan kempen pemasarannya.

Pemerkasaan Pembangun Individu

Model DeepSeek juga memperkasakan pembangun dan penyelidik individu untuk meneroka aplikasi dan inovasi AI baharu. Dengan akses kepada model asas yang berpatutan, pembangun boleh bereksperimen dengan idea yang berbeza, membangunkan alat berkuasa AI baharu, dan menyumbang kepada kemajuan teknologi AI.

Ini boleh membawa kepada lonjakan dalam inovasi, kerana lebih ramai orang berpeluang untuk mengambil bahagian dalam pembangunan AI.

Potensi untuk Kerjasama Sumber Terbuka

Pendekatan sumber terbuka DeepSeek seterusnya menggalakkan kerjasama dan inovasi dalam komuniti AI. Dengan menjadikan modelnya tersedia untuk umum, DeepSeek menggalakkan pembangun untuk menyumbang kepada penambahbaikan mereka, mengenal pasti dan membetulkan pepijat, dan membangunkan ciri baharu.

Pendekatan kolaboratif ini boleh mempercepatkan pembangunan teknologi AI dan memastikan bahawa ia digunakan untuk manfaat semua.

Percepatan Penerimaan AI

Dengan menurunkan kos AI, DeepSeek mempercepatkan penerimaan AI merentasi pelbagai industri. Memandangkan AI menjadi lebih berpatutan dan mudah diakses, lebih banyak perniagaan akan dapat mengintegrasikannya ke dalam operasi mereka, yang membawa kepada peningkatan produktiviti, kecekapan dan inovasi.

Ini boleh memberi impak yang mendalam terhadap ekonomi global, memacu pertumbuhan dan mewujudkan peluang baharu.

Ekosistem AI yang Lebih Inklusif

Usaha DeepSeek untuk mendemokrasikan AI menyumbang kepada ekosistem AI yang lebih inklusif, di mana lebih ramai orang berpeluang untuk mengambil bahagian dalam pembangunan dan penggunaan AI. Ini boleh membantu untuk memastikan bahawa AI digunakan dengan cara yang memberi manfaat kepada semua ahli masyarakat, dan bukannya hanya sebilangan kecil yang terpilih.

Dengan memperkasakan perniagaan yang lebih kecil, pembangun individu, dan penyelidik, DeepSeek memupuk landskap AI yang lebih pelbagai dan inovatif.