Ernie 4.5: Kekuatan Multimodal
Ernie 4.5, dengan kemampuan multimodal yang luas mencakup gambar, audio, dan video, telah menunjukkan kinerja yang unggul dibandingkan dengan GPT-4o OpenAI. Keunggulan ini diamati di berbagai platform benchmark, termasuk CCBench dan OCRBench yang terkenal, seperti yang dirinci dalam pernyataan yang dirilis oleh Baidu di platform WeChat. Lebih lanjut, perusahaan mengklaim bahwa kemampuan penanganan teks dari model dasar Ernie 4.5 tidak hanya melebihi DeepSeek V3 tetapi juga mencapai tingkat kinerja yang kira-kira sebanding dengan GPT-4.5 OpenAI, berdasarkan serangkaian penilaian benchmark.
Peran Perintis Baidu dan Munculnya Persaingan
Baidu memegang perbedaan sebagai perusahaan teknologi besar Tiongkok pertama yang memperkenalkan LLM di Tiongkok. Langkah perintis ini terjadi pada Maret 2023, menunggangi gelombang kegembiraan yang dihasilkan oleh peluncuran ChatGPT OpenAI. Namun, keunggulan awal Baidu semakin diperebutkan oleh pemain AI baru lainnya di Tiongkok selama dua tahun terakhir. Manuver strategis raksasa pencarian baru-baru ini untuk meningkatkan posisinya di pasar AI Tiongkok terjadi pada saat DeepSeek telah memicu tren open-source. Bersamaan dengan itu, raksasa industri seperti Alibaba, Tencent, dan ByteDance secara agresif mengejar pengguna bisnis dan konsumen untuk model AI masing-masing.
Ernie X1: Performa dan Harga
Meskipun Baidu tidak mengungkapkan hasil benchmark spesifik untuk model penalaran yang baru diperkenalkan, Ernie X1, perusahaan menyatakan bahwa model tersebut ‘memberikan kinerja yang setara dengan DeepSeek R1 dengan hanya setengah harga.’ Pernyataan ini menunjukkan keunggulan kompetitif yang signifikan dalam hal efisiensi biaya.
Untuk bisnis yang ingin mengintegrasikan kemampuan Ernie X1, harga untuk akses ke application programming interface (API) disusun sebagai berikut: 2 yuan (sekitar US$0,28) per juta token input dan 8 yuan per juta token output. Sebaliknya, DeepSeek saat ini mengenakan biaya US$0,55 per juta token input dan US$2,19 per juta token output untuk DeepSeek-reasoner, yang didorong oleh model penalaran R1-nya. Perlu dicatat bahwa DeepSeek, sebuah start-up yang berbasis di Hangzhou, baru-baru ini menerapkan kenaikan harga API-nya sebagai tanggapan atas lonjakan permintaan yang substansial.
Pergeseran Baidu Menuju Open Source
Robin Li Yanhong, pendiri, ketua, dan CEO Baidu, membuat pengumuman penting bulan lalu mengenai masa depan Ernie 4.5. Dia mengungkapkan bahwa model tersebut akan dijadikan open source mulai 30 Juni. Keputusan ini merupakan penyimpangan yang signifikan dari dukungannya yang sebelumnya teguh untuk pengembangan AI closed-source, menandai perubahan 180 derajat dalam pendekatannya.
Li menguraikan pergeseran strategis ini selama panggilan pendapatan dengan analis pada bulan Februari, dengan menyatakan, ‘Satu hal yang kami pelajari dari DeepSeek adalah bahwa open sourcing model terbaik dapat sangat membantu adopsi.’ Dia lebih lanjut menjelaskan, ‘Ketika modelnya open source, orang secara alami ingin mencobanya karena penasaran, yang membantu mendorong adopsi yang lebih luas.’ Pengakuan atas manfaat pengembangan open-source ini menggarisbawahi strategi Baidu yang terus berkembang dalam lanskap AI yang kompetitif.
Kinerja Bisnis Baidu di Tengah Kemajuan AI
Meskipun kemajuan penting yang telah dibuat Baidu di bidang kecerdasan buatan, bisnis perusahaan secara keseluruhan menghadapi hambatan karena pendapatan iklan yang lebih lemah. Laporan keuangan baru-baru ini menunjukkan bahwa total pendapatan Baidu untuk kuartal keempat mengalami penurunan 2 persen tahun-ke-tahun. Selain itu, pendapatan setahun penuh juga mengalami penurunan sebesar 1 persen. Angka-angka ini menyoroti tantangan yang dihadapi Baidu dalam menyeimbangkan investasinya dalam teknologi AI mutakhir dengan kebutuhan untuk mempertahankan kinerja keuangan yang kuat.
Memperluas Aspek-Aspek Kunci
Untuk memberikan pemahaman yang lebih komprehensif, mari kita selidiki lebih dalam beberapa aspek penting dari pengumuman Baidu dan konteks yang lebih luas dari lanskap AI di Tiongkok.
Pentingnya Multimodalitas:
Penekanan pada kemampuan ‘multimodal’ di Ernie 4.5 dan Ernie X1 sangat penting. LLM tradisional terutama berfokus pada pemrosesan berbasis teks. Namun, kemampuan untuk memproses dan memahami informasi dari berbagai modalitas – gambar, audio, dan video – membuka berbagai kemungkinan baru. Ini termasuk:
- Pengenalan Gambar yang Ditingkatkan: Model AI sekarang tidak hanya dapat mengidentifikasi objek dalam gambar tetapi juga memahami konteks dan hubungan di antara mereka.
- Transkripsi dan Analisis Audio yang Ditingkatkan: Mentranskripsikan bahasa lisan dengan akurasi yang lebih besar dan bahkan mendeteksi nuansa seperti emosi dan maksud dalam rekaman audio.
- Pemahaman Video: Menganalisis konten video untuk mengidentifikasi adegan, tindakan, dan bahkan memprediksi peristiwa di masa mendatang.
Perdebatan Open-Source:
Keputusan Robin Li untuk open-source Ernie 4.5 adalah perkembangan signifikan dalam perdebatan yang sedang berlangsung antara pengembangan AI closed-source dan open-source.
- Closed-Source: Pendukung pendekatan ini berpendapat bahwa hal itu memungkinkan kontrol yang lebih baik atas teknologi, memastikan penggunaannya yang bertanggung jawab dan mencegah penyalahgunaan. Ini juga memungkinkan perusahaan untuk melindungi kekayaan intelektual mereka dan mempertahankan keunggulan kompetitif.
- Open-Source: Advokat untuk pengembangan open-source percaya bahwa itu mendorong kolaborasi, mempercepat inovasi, dan meningkatkan transparansi. Ini memungkinkan para peneliti dan pengembang di seluruh dunia untuk berkontribusi pada kemajuan teknologi AI.
Pergeseran Baidu ke arah open-sourcing, setidaknya untuk Ernie 4.5, menunjukkan pengakuan atas momentum yang berkembang dari gerakan open-source dan potensi manfaatnya.
Lanskap Kompetitif:
Perlombaan AI di Tiongkok sangat ketat, dengan banyak perusahaan bersaing untuk mendominasi.
- Alibaba: LLM Tongyi Qianwen Alibaba adalah pesaing utama, dan perusahaan secara aktif mengintegrasikan AI ke dalam berbagai unit bisnisnya, termasuk e-commerce, komputasi awan, dan logistik.
- Tencent: LLM Hunyuan Tencent adalah pemain penting lainnya, dan perusahaan memanfaatkan AI untuk meningkatkan platform media sosial, penawaran game, dan layanan cloud-nya.
- ByteDance: Perusahaan induk TikTok, ByteDance, juga berinvestasi besar-besaran dalam AI, memanfaatkannya untuk memberdayakan algoritma rekomendasinya dan mengembangkan produk baru.
- DeepSeek: Deepseek adalah pesaing yang tangguh di ruang LLM.
Dampak Harga:
Strategi penetapan harga Baidu yang agresif untuk Ernie X1, memotong harga DeepSeek hingga setengahnya, merupakan indikasi yang jelas dari niatnya untuk mendapatkan pangsa pasar. Perang harga ini berpotensi menguntungkan bisnis dan konsumen dengan membuat teknologi AI lebih mudah diakses dan terjangkau.
Implikasi yang Lebih Luas:
Kemajuan Baidu dalam AI, bersama dengan persaingan yang ketat di pasar Tiongkok, memiliki implikasi yang luas:
- Kemajuan Teknologi: Laju inovasi yang cepat mendorong pengembangan model AI yang semakin canggih dengan kemampuan yang lebih luas.
- Dampak Ekonomi: AI siap untuk mengubah berbagai industri, meningkatkan produktivitas, menciptakan lapangan kerja baru, dan berpotensi membentuk kembali lanskap ekonomi global.
- Dampak Sosial: Adopsi AI yang meluas menimbulkan pertanyaan etika dan sosial yang penting yang perlu ditangani, termasuk masalah yang berkaitan dengan bias, privasi, dan perpindahan pekerjaan.
Penjelasan Lebih Lanjut tentang Strategi Baidu
Strategi Baidu tampaknya memiliki banyak segi, mencakup inovasi teknologi dan penentuan posisi pasar.
1. Kecakapan Teknologi:
- Fokus pada Multimodalitas: Baidu jelas memprioritaskan pengembangan model AI multimodal, mengakui potensi teknologi ini untuk membuka aplikasi dan kemampuan baru.
- Peningkatan Berkelanjutan: Peluncuran Ernie 4.5 dan Ernie X1 menunjukkan komitmen Baidu untuk penelitian dan pengembangan yang berkelanjutan, terus-menerus mendorong batas kinerja AI.
- Merangkul Open-Source: Keputusan untuk open-source Ernie 4.5 menandakan kesediaan untuk terlibat dengan komunitas AI yang lebih luas dan berkontribusi pada kemajuan kolektif di lapangan.
2. Penentuan Posisi Pasar:
- Harga Kompetitif: Harga Ernie X1 yang agresif merupakan langkah strategis untuk menarik pengguna dan mendapatkan pangsa pasar dalam lanskap LLM yang sangat kompetitif.
- Menargetkan Bisnis: Fokus pada akses API menunjukkan bahwa Baidu secara aktif menargetkan bisnis yang ingin mengintegrasikan AI ke dalam operasi mereka.
- Mengatasi Kelemahan: Perusahaan mengakui dan mengatasi tantangannya, seperti penurunan pendapatan iklan, dengan memanfaatkan kemajuan AI-nya untuk mendiversifikasi penawarannya dan menjajaki aliran pendapatan baru.
3. Visi Jangka Panjang:
- Kepemimpinan AI: Tindakan Baidu menunjukkan ambisi yang jelas untuk menjadi pemimpin dalam lanskap AI global, tidak hanya di Tiongkok.
- Teknologi Transformatif: Perusahaan tampaknya memandang AI sebagai teknologi transformatif dengan potensi untuk membentuk kembali bisnisnya dan berkontribusi pada kemajuan sosial yang lebih luas.
- Adaptabilitas: Kesediaan Baidu untuk mengadaptasi strateginya, sebagaimana dibuktikan oleh pergeseran ke arah pengembangan open-source, menunjukkan kelincahan dan responsifnya terhadap dinamika industri AI yang terus berkembang.
Intinya, Baidu memposisikan dirinya sebagai kekuatan utama dalam revolusi AI, menggabungkan inovasi teknologi dengan manuver pasar strategis untuk mencapai tujuan ambisiusnya. Kemajuan perusahaan dan persaingan yang sedang berlangsung di pasar AI Tiongkok akan diawasi dengan ketat karena memiliki implikasi yang signifikan bagi masa depan AI secara global.