DeepSeek, startup AI Tiongkok yang sedang naik daun, membuat gelombang dengan model fondasinya yang didiskon secara signifikan. Langkah ini berpotensi merevolusi adopsi AI untuk bisnis dengan mengatasi salah satu hambatan paling signifikan: biaya.
Biaya Tinggi Adopsi AI
Menurut analis Brad Sills dan Carly Liu dari BofA Global Research, biaya yang terkait dengan aplikasi AI adalah hambatan utama yang menghalangi implementasinya secara luas. Laporan mereka, yang dirilis pada hari Selasa, 28 Januari, menunjukkan bahwa terobosan dalam pengurangan biaya dapat semakin menurunkan harga, yang mengarah pada peningkatan tingkat adopsi.
Pengumuman DeepSeek pada hari Senin, 27 Januari, mengirimkan gelombang kejutan ke seluruh industri AI, menyebabkan penurunan saham beberapa perusahaan AI. Perusahaan mengungkapkan kemampuannya untuk melatih model fondasi hanya dengan $5,58 juta menggunakan 2.048 chip Nvidia H800. Angka ini sangat kontras dengan perkiraan biaya OpenAI dan Anthropic, yang berkisar dari $100 juta hingga satu miliar dolar dan melibatkan penggunaan ribuan chip AI Nvidia.
Roy Benesh, CTO di eSIMple, menekankan potensi transformatif dari pencapaian DeepSeek, yang menyatakan bahwa hal itu memberdayakan perusahaan yang lebih kecil, pengembang individu, dan bahkan para peneliti untuk memanfaatkan kekuatan AI tanpa mengeluarkan biaya yang sangat besar. Peningkatan aksesibilitas ini dapat mendorong pengembangan ide dan teknologi inovatif, yang mengarah pada daya saing yang lebih besar di bidang tersebut. Akibatnya, pelanggan dapat memperoleh manfaat dari opsi baru, sementara perusahaan AI yang mapan cenderung menurunkan harga mereka dan mempercepat kemajuan teknologi.
Para analis BofA memberikan contoh biaya yang terkait dengan aplikasi AI yang ada. Microsoft 365 Copilot Chat mengenakan biaya antara 1 sen dan 30 sen per permintaan, tergantung pada kompleksitas permintaan tersebut. Agentforce Salesforce untuk Service Cloud mengenakan tarif tetap $2 per konversi.
Meskipun BofA mengakui bahwa angka $5,58 juta yang disajikan oleh DeepSeek agak menyesatkan karena pengecualian biaya yang terkait dengan penelitian, eksperimen, arsitektur, algoritma, dan data, para analis menekankan pentingnya inovasi startup dalam menunjukkan kelayakan metode pelatihan yang lebih murah.
Pra-Pelatihan vs. Inferensi: Memahami Biaya
Model AI fondasi, seperti GPT-4o OpenAI dan Gemini Google, menjalani proses yang disebut pra-pelatihan, di mana mereka terpapar sejumlah besar data, seperti seluruh internet, untuk mengembangkan pengetahuan umum. Namun, untuk membuat model ini lebih relevan dan berguna bagi perusahaan dan industri tertentu, perusahaan perlu melatih atau menyempurnakannya lebih lanjut menggunakan data mereka sendiri.
Setelah model AI disempurnakan, ia dapat memproses perintah pengguna dan menghasilkan respons yang relevan. Namun, proses meminta model dan mendapatkan respons menimbulkan biaya inferensi, yang merupakan biaya yang terkait dengan melibatkan model dengan data baru untuk memahami dan menganalisis.
Penting untuk dicatat bahwa sebagian besar perusahaan tidak menanggung biaya pelatihan model fondasi. Tanggung jawab ini terletak pada pengembang model ini, termasuk OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, laboratorium penelitian tertentu, dan raksasa teknologi Tiongkok seperti Baidu dan Alibaba.
Bisnis terutama mengeluarkan biaya inferensi untuk memproses beban kerja AI, yang merupakan sebagian besar pengeluaran terkait AI.
Hubungan Tiongkok: Biaya Inferensi DeepSeek dan Kekhawatiran Privasi
DeepSeek menawarkan layanan inferensi sendiri dengan biaya yang jauh lebih rendah dibandingkan dengan perusahaan Silicon Valley. Namun, ada pertimbangan tertentu yang perlu diingat saat menggunakan layanan ini.
Menurut kebijakan privasi DeepSeek, informasi pengguna disimpan di server yang berlokasi di Tiongkok. Perusahaan juga menyatakan bahwa mereka akan mematuhi kewajiban hukum dan melakukan tugas-tugas untuk kepentingan umum atau untuk melindungi kepentingan vital penggunanya dan orang lain.
Undang-Undang Intelijen Nasional Tiongkok, khususnya pasal 7, mengamanatkan bahwa semua organisasi dan warga negara mendukung, membantu, dan bekerja sama dengan upaya intelijen nasional sesuai dengan hukum dan melindungi rahasia pekerjaan intelijen nasional yang mereka ketahui.
Kevin Surace, CEO Appvance, mengangkat kekhawatiran tentang privasi, yang menyatakan bahwa pengumpulan data dari pengguna adalah praktik umum di Tiongkok. Dia menyarankan pengguna untuk berhati-hati.
Dalam sebuah eksperimen yang dilakukan oleh PYMNTS, chatbot DeepSeek diminta untuk menjelaskan bagaimana protes Lapangan Tiananmen tahun 1989 telah memengaruhi politik Tiongkok. Chatbot menjawab, ‘Maaf, saya belum yakin bagaimana mendekati jenis pertanyaan ini.’
Tim Enneking, CEO di Presearch, menunjukkan bahwa DeepSeek adalah perusahaan yang 100% dimiliki Tiongkok dan berlokasi di Tiongkok. Dia mencatat bahwa ketidakmampuan chatbot untuk memberikan informasi tentang Lapangan Tiananmen atau tokoh-tokoh senior pemerintah Tiongkok menunjukkan batasan dalam objektivitas teknologi tersebut. Sementara Enneking mengakui potensi teknologi yang menarik, dia menyatakan keprihatinannya tentang kendalinya.
Namun, Enneking juga menyoroti sifat sumber terbuka dari model DeepSeek, yang memungkinkan revisi untuk menghapus kontrol pemerintah dan korporat. Dia percaya bahwa kreativitas teknik perusahaan menciptakan peluang bagi perusahaan dan negara yang lebih kecil untuk berpartisipasi dan berhasil dalam lanskap AI generatif.
Potensi DeepSeek untuk Menurunkan Biaya Inferensi untuk Semua
Pendekatan inovatif DeepSeek untuk melatih model fondasi dengan biaya yang lebih rendah memiliki implikasi positif bagi perusahaan seperti Microsoft, yang dapat terus mengurangi biaya komputasi AI dan mendorong skala. Menurut Sills dan Liu, biaya komputasi yang lebih rendah dapat meningkatkan margin pada penawaran yang mendukung AI.
Dalam catatan penelitian terpisah, analis BofA Alkesh Shah, Andrew Moss, dan Brad Sills menyarankan bahwa biaya komputasi AI yang lebih rendah dapat memungkinkan layanan AI yang lebih luas di berbagai sektor, dari mobil hingga smartphone.
Meskipun tidak mungkin pengembang model fondasi seperti OpenAI akan segera mencapai biaya pelatihan serendah DeepSeek, para analis percaya bahwa teknik pelatihan dan pasca-pelatihan inovatif DeepSeek akan diadopsi oleh pengembang model perbatasan pesaing untuk meningkatkan efisiensi. Namun, mereka menekankan bahwa model saat ini masih memerlukan investasi yang signifikan karena mereka membentuk dasar bagi agen AI.
Dalam jangka panjang, para analis mengantisipasi percepatan adopsi AI oleh perusahaan karena chatbot, kopilot, dan agen menjadi lebih cerdas dan lebih murah, sebuah fenomena yang dikenal sebagai paradoks Jevons.
CEO Microsoft Satya Nadella menggemakan sentimen ini di X, yang menyatakan bahwa paradoks Jevons sedang berperan karena AI menjadi lebih efisien dan mudah diakses. Dia percaya bahwa ini akan menyebabkan lonjakan penggunaan AI, mengubahnya menjadi komoditas yang tidak dapat kita peroleh cukup banyak.
Selami Lebih Dalam Model Fondasi dan Dampaknya
Model fondasi, tulang punggung AI modern, merevolusi cara bisnis beroperasi dan berinteraksi dengan teknologi. Model-model ini, yang dilatih pada dataset yang luas, memiliki kemampuan untuk melakukan berbagai macam tugas, dari pemrosesan bahasa alami hingga pengenalan gambar. Namun, pengembangan dan penerapan model ini melibatkan interaksi yang kompleks dari berbagai faktor, termasuk biaya pelatihan, biaya inferensi, privasi data, dan pertimbangan etika.
Memahami Model Fondasi
Pada intinya, model fondasi adalah jaringan saraf besar yang dilatih pada dataset besar. Proses pelatihan ini memungkinkan mereka untuk mempelajari pola dan hubungan dalam data, memungkinkan mereka untuk melakukan berbagai tugas dengan akurasi yang luar biasa. Beberapa contoh model fondasi meliputi:
- GPT-4o: Model bahasa yang kuat yang dikembangkan oleh OpenAI, yang mampu menghasilkan teks berkualitas manusia, menerjemahkan bahasa, dan menjawab pertanyaan secara komprehensif.
- Gemini Google: Model AI multimodal yang dapat memproses dan memahami berbagai jenis data, termasuk teks, gambar, dan audio.
Model-model ini tidak terbatas pada tugas-tugas tertentu tetapi dapat diadaptasi ke berbagai aplikasi, menjadikannya alat serbaguna untuk bisnis.
Peran Pra-Pelatihan dan Penyempurnaan
Pengembangan model fondasi biasanya melibatkan dua tahap utama: pra-pelatihan dan penyempurnaan.
- Pra-pelatihan: Pada tahap ini, model dilatih pada dataset besar, seperti seluruh internet, untuk mempelajari pengetahuan umum dan keterampilan bahasa. Proses ini melengkapi model dengan kemampuan untuk memahami dan menghasilkan teks, menerjemahkan bahasa, dan melakukan tugas-tugas dasar lainnya.
- Penyempurnaan: Pada tahap ini, model yang telah dilatih sebelumnya dilatih lebih lanjut pada dataset yang lebih kecil dan lebih spesifik yang terkait dengan tugas atau industri tertentu. Proses ini memungkinkan model untuk menyesuaikan pengetahuan dan keterampilannya dengan kebutuhan spesifik aplikasi.
Misalnya, model bahasa yang telah dilatih sebelumnya dapat disempurnakan pada dataset interaksi layanan pelanggan untuk membuat chatbot yang dapat secara efektif menanggapi pertanyaan pelanggan.
Biaya Pelatihan dan Inferensi
Biaya yang terkait dengan model fondasi dapat dibagi menjadi dua kategori utama: biaya pelatihan dan biaya inferensi.
- Biaya pelatihan: Biaya ini melibatkan sumber daya komputasi, data, dan keahlian yang diperlukan untuk melatih model fondasi. Melatih model fondasi besar dapat sangat mahal, seringkali membutuhkan investasi jutaan dolar.
- Biaya inferensi: Biaya ini melibatkan sumber daya komputasi yang diperlukan untuk menggunakan model terlatih untuk membuat prediksi atau menghasilkan output. Biaya inferensi dapat bervariasi tergantung pada ukuran dan kompleksitas model, jumlah data yang diproses, dan infrastruktur yang digunakan.
Inovasi DeepSeek terletak pada kemampuannya untuk secara signifikan mengurangi biaya pelatihan yang terkait dengan model fondasi, membuatnya lebih mudah diakses oleh berbagai bisnis dan organisasi.
Mengatasi Privasi dan Pertimbangan Etika
Penggunaan model fondasi menimbulkan pertanyaan penting tentang privasi data dan pertimbangan etika. Model fondasi dilatih pada dataset besar, yang mungkin berisi informasi sensitif atau pribadi. Sangat penting untuk memastikan bahwa model-model ini digunakan secara bertanggung jawab dan etis, menghormati privasi pengguna dan menghindari bias.
Beberapa strategi untuk mengatasi kekhawatiran ini meliputi:
- Anonimisasi data: Menghapus atau menutupi informasi pribadi dari data pelatihan untuk melindungi privasi pengguna.
- Deteksi dan mitigasi bias: Mengidentifikasi dan mengatasi bias dalam data pelatihan untuk memastikan bahwa model tidak mengabadikan stereotip berbahaya atau praktik diskriminatif.
- Transparansi dan akuntabilitas: Memberikan informasi yang jelas tentang bagaimana model bekerja dan bagaimana ia digunakan, dan menetapkan mekanisme akuntabilitas jika terjadi kesalahan atau konsekuensi yang tidak diinginkan.
Seiring dengan semakin meluasnya model fondasi, sangat penting untuk mengatasi kekhawatiran privasi dan etika ini secara proaktif untuk memastikan bahwa mereka digunakan untuk kepentingan masyarakat.
Masa Depan Model Fondasi
Model fondasi berkembang pesat, dan potensi dampaknya pada masyarakat sangat besar. Di masa depan, kita dapat mengharapkan untuk melihat:
- Model yang lebih kuat dan serbaguna: Seiring para peneliti terus mengembangkan arsitektur dan teknik pelatihan baru, model fondasi akan menjadi lebih kuat dan serbaguna, mampu melakukan berbagai tugas dengan akurasi yang lebih besar.
- Peningkatan aksesibilitas: Seiring dengan penurunan biaya pelatihan dan semakin meluasnya platform AI berbasis cloud, model fondasi akan menjadi lebih mudah diakses oleh bisnis dari semua ukuran.
- Aplikasi dan kasus penggunaan baru: Model fondasi akan terus diterapkan pada kasus penggunaan baru dan inovatif di berbagai industri, dari perawatan kesehatan hingga keuangan hingga pendidikan.
Munculnya model fondasi mewakili perubahan paradigma di bidang kecerdasan buatan. Dengan memahami kemampuan, biaya, dan pertimbangan etika mereka, kita dapat memanfaatkan kekuatan mereka untuk menciptakan masa depan yang lebih baik.
Kontribusi DeepSeek untuk Mendemokratisasikan AI
Pencapaian DeepSeek dalam secara signifikan mengurangi biaya pelatihan model fondasi menandai momen penting dalam demokratisasi AI. Dengan menurunkan hambatan masuk, DeepSeek memberdayakan berbagai organisasi dan individu untuk berpartisipasi dalam revolusi AI.
Dampak pada Bisnis yang Lebih Kecil
Bisnis yang lebih kecil seringkali kekurangan sumber daya dan keahlian untuk mengembangkan dan menerapkan model AI mereka sendiri. Model fondasi hemat biaya DeepSeek memberi bisnis ini akses ke teknologi AI mutakhir yang sebelumnya berada di luar jangkauan. Ini dapat menyamakan kedudukan, memungkinkan bisnis yang lebih kecil untuk bersaing lebih efektif dengan perusahaan yang lebih besar dan lebih mapan.
Misalnya, bisnis e-niaga kecil dapat menggunakan model DeepSeek untuk mempersonalisasi rekomendasi produk untuk pelanggannya, meningkatkan layanan pelanggannya, atau mengotomatiskan kampanye pemasarannya.
Pemberdayaan Pengembang Individu
Model DeepSeek juga memberdayakan pengembang dan peneliti individu untuk menjajaki aplikasi dan inovasi AI baru. Dengan akses ke model fondasi yang terjangkau, pengembang dapat bereksperimen dengan ide-ide yang berbeda, mengembangkan alat bertenaga AI baru, dan berkontribusi pada kemajuan teknologi AI.
Ini dapat menyebabkan lonjakan inovasi, karena lebih banyak orang memiliki kesempatan untuk berpartisipasi dalam pengembangan AI.
Potensi Kolaborasi Sumber Terbuka
Pendekatan sumber terbuka DeepSeek lebih lanjut mempromosikan kolaborasi dan inovasi dalam komunitas AI. Dengan menyediakan modelnya untuk umum, DeepSeek mendorong pengembang untuk berkontribusi pada peningkatannya, mengidentifikasi dan memperbaiki bug, dan mengembangkan fitur baru.
Pendekatan kolaboratif ini dapat mempercepat pengembangan teknologi AI dan memastikan bahwa ia digunakan untuk kepentingan semua.
Percepatan Adopsi AI
Dengan menurunkan biaya AI, DeepSeek mempercepat adopsi AI di berbagai industri. Seiring dengan semakin terjangkau dan mudah diaksesnya AI, semakin banyak bisnis yang akan dapat mengintegrasikannya ke dalam operasi mereka, yang mengarah pada peningkatan produktivitas, efisiensi, dan inovasi.
Ini dapat memiliki dampak yang mendalam pada ekonomi global, mendorong pertumbuhan dan menciptakan peluang baru.
Ekosistem AI yang Lebih Inklusif
Upaya DeepSeek untuk mendemokratisasikan AI berkontribusi pada ekosistem AI yang lebih inklusif, di mana lebih banyak orang memiliki kesempatan untuk berpartisipasi dalam pengembangan dan penggunaan AI. Ini dapat membantu memastikan bahwa AI digunakan dengan cara yang menguntungkan semua anggota masyarakat, daripada hanya beberapa orang terpilih.
Dengan memberdayakan bisnis yang lebih kecil, pengembang individu, dan peneliti, DeepSeek mendorong lanskap AI yang lebih beragam dan inovatif.