Ernie 4.5: Kuasa Besar Multimodal
Ernie 4.5, dengan keupayaan multimodal yang luas merangkumi imej, audio dan video, telah menunjukkan prestasi yang unggul berbanding GPT-4o OpenAI. Keunggulan ini diperhatikan merentasi pelbagai platform penanda aras, termasuk CCBench dan OCRBench yang terkenal, seperti yang diperincikan dalam kenyataan yang dikeluarkan oleh Baidu di platform WeChat. Tambahan pula, syarikat itu mendakwa bahawa keupayaan pengendalian teks model asas Ernie 4.5 bukan sahaja melebihi DeepSeek V3 tetapi juga mencapai tahap prestasi yang setanding dengan GPT-4.5 OpenAI, berdasarkan satu siri penilaian penanda aras.
Peranan Perintis Baidu dan Kebangkitan Persaingan
Baidu memegang perbezaan sebagai firma teknologi utama China yang pertama memperkenalkan LLM di China. Langkah perintis ini berlaku pada Mac 2023, menunggangi gelombang keterujaan yang dijana oleh pelancaran ChatGPT OpenAI. Walau bagaimanapun, kelebihan awal Baidu semakin dicabar oleh pemain AI lain yang baru muncul di China sejak dua tahun lalu. Gerak strategik gergasi carian baru-baru ini untuk meningkatkan kedudukannya dalam pasaran AI China datang pada masa DeepSeek telah mencetuskan trend sumber terbuka. Pada masa yang sama, gergasi industri seperti Alibaba, Tencent, dan ByteDance secara agresif mengejar pengguna perniagaan dan pengguna untuk model AI masing-masing.
Ernie X1: Prestasi dan Harga
Walaupun Baidu tidak mendedahkan keputusan penanda aras khusus untuk model penaakulan yang baru diperkenalkan, Ernie X1, syarikat itu menyatakan bahawa ia ‘memberikan prestasi setanding dengan DeepSeek R1 pada hanya separuh harga.’ Kenyataan ini menunjukkan kelebihan daya saing yang ketara dari segi keberkesanan kos.
Bagi perniagaan yang ingin menyepadukan keupayaan Ernie X1, harga untuk akses kepada antara muka pengaturcaraan aplikasinya (API) berstruktur seperti berikut: 2 yuan (kira-kira AS$0.28) setiap juta token input dan 8 yuan setiap juta token output. Sebaliknya, DeepSeek kini mengenakan caj AS$0.55 setiap juta token input dan AS$2.19 setiap juta token output untuk DeepSeek-reasoner, yang didorong oleh model penaakulan R1nya. Perlu diingat bahawa DeepSeek, sebuah syarikat permulaan yang berpangkalan di Hangzhou, baru-baru ini melaksanakan kenaikan harga APInya sebagai tindak balas kepada lonjakan permintaan yang ketara.
Peralihan Baidu ke Arah Sumber Terbuka
Robin Li Yanhong, pengasas, pengerusi, dan Ketua Pegawai Eksekutif Baidu, membuat pengumuman penting bulan lepas mengenai masa depan Ernie 4.5. Beliau mendedahkan bahawa model itu akan dijadikan sumber terbuka mulai 30 Jun. Keputusan ini merupakan perubahan ketara daripada sokongan teguhnya sebelum ini untuk pembangunan AI sumber tertutup, menandakan perubahan 180 darjah dalam pendekatannya.
Li menghuraikan peralihan strategik ini semasa panggilan pendapatan dengan penganalisis pada bulan Februari, menyatakan, ‘Satu perkara yang kami pelajari daripada DeepSeek ialah sumber terbuka model terbaik boleh membantu penerimaan.’ Beliau seterusnya menjelaskan, ‘Apabila model itu adalah sumber terbuka, orang ramai secara semula jadi ingin mencubanya kerana rasa ingin tahu, yang membantu memacu penggunaan yang lebih luas.’ Pengiktirafan faedah pembangunan sumber terbuka ini menggariskan strategi Baidu yang berkembang dalam landskap AI yang kompetitif.
Prestasi Perniagaan Baidu Di Tengah-tengah Kemajuan AI
Walaupun kemajuan ketara yang telah dicapai oleh Baidu dalam bidang kecerdasan buatan, perniagaan keseluruhan syarikat itu menghadapi kesukaran disebabkan oleh hasil pengiklanan yang lebih lemah. Laporan kewangan baru-baru ini menunjukkan bahawa jumlah hasil Baidu untuk suku keempat mengalami penurunan 2 peratus tahun ke tahun. Tambahan pula, hasil setahun penuh juga menyaksikan penurunan sebanyak 1 peratus. Angka-angka ini menyerlahkan cabaran yang dihadapi Baidu dalam mengimbangi pelaburannya dalam teknologi AI termaju dengan keperluan untuk mengekalkan prestasi kewangan yang kukuh.
Memperluas Aspek Utama
Untuk memberikan pemahaman yang lebih komprehensif, mari kita mendalami beberapa aspek kritikal pengumuman Baidu dan konteks yang lebih luas landskap AI di China.
Kepentingan Multimodaliti:
Penekanan pada keupayaan ‘multimodal’ dalam kedua-dua Ernie 4.5 dan Ernie X1 adalah penting. LLM tradisional terutamanya memfokuskan pada pemprosesan berasaskan teks. Walau bagaimanapun, keupayaan untuk memproses dan memahami maklumat daripada pelbagai modaliti – imej, audio dan video – membuka pelbagai kemungkinan baharu. Ini termasuk:
- Pengecaman Imej Dipertingkat: Model AI kini bukan sahaja boleh mengenal pasti objek dalam imej tetapi juga memahami konteks dan hubungan antaranya.
- Transkripsi dan Analisis Audio Dipertingkat: Mentranskripsikan bahasa pertuturan dengan ketepatan yang lebih tinggi dan juga mengesan nuansa seperti emosi dan niat dalam rakaman audio.
- Pemahaman Video: Menganalisis kandungan video untuk mengenal pasti adegan, tindakan, dan juga meramalkan peristiwa masa hadapan.
Perdebatan Sumber Terbuka:
Keputusan Robin Li untuk membuka sumber Ernie 4.5 merupakan perkembangan penting dalam perdebatan berterusan antara pembangunan AI sumber tertutup dan sumber terbuka.
- Sumber Tertutup: Penyokong pendekatan ini berpendapat bahawa ia membolehkan kawalan yang lebih baik ke atas teknologi, memastikan penggunaannya yang bertanggungjawab dan mencegah penyalahgunaan. Ia juga membolehkan syarikat melindungi harta intelek mereka dan mengekalkan kelebihan daya saing.
- Sumber Terbuka: Penyokong pembangunan sumber terbuka percaya bahawa ia memupuk kerjasama, mempercepatkan inovasi, dan menggalakkan ketelusan. Ia membolehkan penyelidik dan pembangun di seluruh dunia menyumbang kepada kemajuan teknologi AI.
Peralihan Baidu ke arah sumber terbuka, sekurang-kurangnya untuk Ernie 4.5, mencadangkan pengiktirafan momentum yang semakin meningkat dalam pergerakan sumber terbuka dan potensi manfaatnya.
Landskap Persaingan:
Perlumbaan AI di China adalah sengit, dengan banyak syarikat bersaing untuk menguasai.
- Alibaba: LLM Tongyi Qianwen Alibaba ialah pesaing utama, dan syarikat itu secara aktif menyepadukan AI ke dalam pelbagai unit perniagaannya, termasuk e-dagang, pengkomputeran awan dan logistik.
- Tencent: LLM Hunyuan Tencent ialah satu lagi pemain penting, dan syarikat itu memanfaatkan AI untuk meningkatkan platform media sosial, tawaran permainan dan perkhidmatan awannya.
- ByteDance: Syarikat induk TikTok, ByteDance, juga melabur secara besar-besaran dalam AI, menggunakannya untuk memperkasakan algoritma cadangannya dan membangunkan produk baharu.
- DeepSeek: DeepSeek ialah pesaing yang kuat dalam ruang LLM.
Kesan Harga:
Strategi harga agresif Baidu untuk Ernie X1, mengurangkan harga DeepSeek sebanyak separuh, adalah petunjuk jelas tentang hasratnya untuk mendapatkan bahagian pasaran. Perang harga ini berpotensi memberi manfaat kepada perniagaan dan pengguna dengan menjadikan teknologi AI lebih mudah diakses dan berpatutan.
Implikasi yang Lebih Luas:
Kemajuan Baidu dalam AI, bersama-sama dengan persaingan sengit dalam pasaran China, mempunyai implikasi yang meluas:
- Kemajuan Teknologi: Kepantasan inovasi yang pesat memacu pembangunan model AI yang semakin canggih dengan keupayaan yang lebih luas.
- Kesan Ekonomi: AI bersedia untuk mengubah pelbagai industri, meningkatkan produktiviti, mewujudkan pekerjaan baharu dan berpotensi membentuk semula landskap ekonomi global.
- Kesan Masyarakat: Penerimaan AI yang meluas menimbulkan persoalan etika dan kemasyarakatan yang penting yang perlu ditangani, termasuk isu yang berkaitan dengan berat sebelah, privasi dan perpindahan pekerjaan.
Huraian Lanjut mengenai Strategi Baidu
Strategi Baidu nampaknya mempunyai pelbagai aspek, merangkumi kedua-dua inovasi teknologi dan kedudukan pasaran.
1. Kehebatan Teknologi:
- Fokus pada Multimodaliti: Baidu jelas mengutamakan pembangunan model AI multimodal, mengiktiraf potensi teknologi ini untuk membuka aplikasi dan keupayaan baharu.
- Penambahbaikan Berterusan: Pelancaran Ernie 4.5 dan Ernie X1 menunjukkan komitmen Baidu terhadap penyelidikan dan pembangunan yang berterusan, sentiasa menolak sempadan prestasi AI.
- Pelukan Sumber Terbuka: Keputusan untuk membuka sumber Ernie 4.5 menandakan kesediaan untuk melibatkan diri dengan komuniti AI yang lebih luas dan menyumbang kepada kemajuan kolektif bidang itu.
2. Kedudukan Pasaran:
- Harga Kompetitif: Harga agresif Ernie X1 ialah langkah strategik untuk menarik pengguna dan memperoleh bahagian pasaran dalam landskap LLM yang sangat kompetitif.
- Mensasarkan Perniagaan: Tumpuan pada akses API mencadangkan bahawa Baidu secara aktif menyasarkan perniagaan yang ingin menyepadukan AI ke dalam operasi mereka.
- Menangani Kelemahan: Syarikat itu mengakui dan menangani cabarannya, seperti penurunan hasil pengiklanan, dengan memanfaatkan kemajuan AInya untuk mempelbagaikan tawarannya dan meneroka aliran hasil baharu.
3. Wawasan Jangka Panjang:
- Kepimpinan AI: Tindakan Baidu mencadangkan cita-cita yang jelas untuk menjadi peneraju dalam landskap AI global, bukan sahaja di China.
- Teknologi Transformatif: Syarikat itu nampaknya melihat AI sebagai teknologi transformatif dengan potensi untuk membentuk semula perniagaannya dan menyumbang kepada kemajuan masyarakat yang lebih luas.
- Kebolehsuaian: Kesediaan Baidu untuk menyesuaikan strateginya, seperti yang dibuktikan oleh peralihan ke arah pembangunan sumber terbuka, menunjukkan ketangkasan dan responsifnya terhadap dinamik industri AI yang berkembang.
Pada dasarnya, Baidu meletakkan dirinya sebagai kuasa utama dalam revolusi AI, menggabungkan inovasi teknologi dengan gerakan pasaran strategik untuk mencapai matlamatnya yang bercita-cita tinggi. Kemajuan syarikat dan persaingan berterusan dalam pasaran AI China akan dipantau dengan teliti kerana ia mempunyai implikasi yang ketara untuk masa depan AI di peringkat global.