Baidu Luncurkan ERNIE 4.5 & X1

ERNIE 4.5: Model Fondasi Multimodal Generasi Baru

ERNIE 4.5 merupakan model fondasi multimodal asli terbaru yang dikembangkan secara independen oleh Baidu. Model ini dirancang untuk mencapai optimasi kolaboratif dengan memodelkan berbagai modalitas secara bersamaan. Pendekatan inovatif ini menghasilkan kemampuan pemahaman multimodal yang luar biasa. Yang membedakan ERNIE 4.5 adalah kemampuan bahasanya yang disempurnakan, dikombinasikan dengan peningkatan keseluruhan dalam pemahaman, pembangkitan, penalaran, dan memori. Selain itu, model ini menunjukkan peningkatan signifikan dalam area yang seringkali menantang bagi model AI, termasuk pencegahan halusinasi, penalaran logis, dan kemampuan pengkodean.

Sifat multimodal dari ERNIE 4.5 terlihat jelas dalam kemampuannya untuk mengintegrasikan dan memahami berbagai jenis konten dengan mulus, termasuk:

  • Teks: Memproses dan memahami informasi tertulis.
  • Gambar: Menafsirkan dan menganalisis konten visual.
  • Audio: Memahami dan menanggapi bahasa lisan.
  • Video: Menganalisis dan memahami informasi visual dan auditori yang dinamis.

Kemampuan multimodal yang komprehensif ini memungkinkan ERNIE 4.5 untuk menangani berbagai tugas, mulai dari menjawab pertanyaan kompleks hingga menghasilkan konten kreatif.

Selain fungsi multimodal intinya, ERNIE 4.5 menunjukkan tingkat kecerdasan dan kesadaran kontekstual yang luar biasa. Model ini dengan mudah memahami budaya internet kontemporer, termasuk meme dan kartun satir, yang menunjukkan kemampuannya untuk beradaptasi dengan bahasa dan gaya komunikasi yang terus berkembang.

Sebagai model fondasi unggulan Baidu dan penawaran multimodal asli, ERNIE 4.5 diposisikan untuk melampaui GPT-4.5 dalam berbagai tes benchmark. Khususnya, model ini mencapai kinerja superior ini dengan biaya yang jauh lebih rendah (sekitar 1%) dari biaya GPT-4.5. Efektivitas biaya ini, dikombinasikan dengan kemampuannya yang canggih, menjadikan ERNIE 4.5 pilihan yang sangat kompetitif dan mudah diakses dalam lanskap AI.

Peningkatan signifikan dalam kemampuan ERNIE 4.5 merupakan hasil langsung dari beberapa terobosan teknologi utama:

  • ‘FlashMask’ Dynamic Attention Masking: Teknik ini kemungkinan memungkinkan model untuk secara dinamis fokus pada bagian paling relevan dari data input, meningkatkan efisiensi dan akurasi.
  • Heterogeneous Multimodal Mixture-of-Experts: Ini menunjukkan bahwa ERNIE 4.5 menggunakan serangkaian sub-model khusus yang beragam, masing-masing dioptimalkan untuk modalitas atau tugas yang berbeda, yang kemudian digabungkan untuk mencapai kinerja keseluruhan yang unggul.
  • Spatiotemporal Representation Compression: Ini menyiratkan bahwa model menggunakan teknik canggih untuk memampatkan dan merepresentasikan data secara efisien yang berubah seiring waktu dan ruang, seperti konten video.
  • Knowledge-Centric Training Data Construction: Ini menunjukkan bahwa data pelatihan untuk ERNIE 4.5 dikurasi dan disusun dengan cermat untuk menekankan perolehan dan representasi pengetahuan, yang mengarah pada peningkatan kemampuan penalaran.
  • Self-feedback Enhanced Post-Training: Ini menunjukkan bahwa model menjalani proses penyempurnaan setelah pelatihan awal, di mana ia belajar dari outputnya sendiri dan meningkatkan kinerjanya secara iteratif.

Kemajuan teknologi ini secara kolektif berkontribusi pada kinerja dan keserbagunaan ERNIE 4.5 yang mengesankan.

ERNIE X1: Model Penalaran Berpikir Mendalam untuk Kemampuan AI yang Ditingkatkan

ERNIE X1 mewakili pendekatan yang berbeda untuk AI, dengan fokus pada kemampuan berpikir mendalam dan penalaran. Model ini dirancang untuk unggul dalam tugas-tugas yang membutuhkan fungsi kognitif tingkat lanjut, seperti:

  • Pemahaman: Memahami informasi dan konsep yang kompleks.
  • Perencanaan: Mengembangkan strategi dan urutan tindakan untuk mencapai tujuan.
  • Refleksi: Mengevaluasi proses penalarannya sendiri dan mengidentifikasi area yang perlu ditingkatkan.
  • Evolusi: Beradaptasi dan belajar dari informasi dan pengalaman baru.

Sebagai model penalaran berpikir mendalam multimodal pertama Baidu dengan kemampuan penggunaan alat, ERNIE X1 menunjukkan kekuatan khusus di beberapa area utama:

  • Tanya Jawab Pengetahuan Bahasa Mandarin: Menjawab pertanyaan berdasarkan basis pengetahuan yang luas tentang bahasa dan budaya Tiongkok.
  • Kreasi Sastra: Menghasilkan format teks kreatif, seperti puisi, skrip, atau artikel.
  • Penulisan Naskah: Membantu dalam penyusunan dan komposisi konten tertulis yang lebih panjang.
  • Dialog: Terlibat dalam percakapan yang alami dan koheren.
  • Penalaran Logis: Memecahkan masalah yang membutuhkan penalaran deduktif dan induktif.
  • Perhitungan Kompleks: Melakukan perhitungan matematis yang rumit.

Kemampuan ERNIE X1 untuk menggunakan alat adalah pembeda yang signifikan. Model ini dapat memanfaatkan berbagai alat untuk meningkatkan kinerjanya dan memberikan solusi yang lebih komprehensif. Alat-alat ini meliputi:

  • Pencarian Lanjutan: Mengakses dan mengambil informasi dari mesin pencari.
  • Tanya Jawab pada Dokumen yang Diberikan: Menjawab pertanyaan berdasarkan konten dokumen tertentu.
  • Pemahaman Gambar: Menganalisis dan menafsirkan informasi visual.
  • Pembangkitan Gambar AI: Membuat gambar baru berdasarkan deskripsi tekstual.
  • Interpretasi Kode: Memahami dan mengeksekusi kode komputer.
  • Pembacaan Halaman Web: Mengekstrak informasi dari halaman web.
  • Pemetaan Pikiran TreeMind: Membuat dan memanipulasi peta pikiran.
  • Pencarian Akademik Baidu: Mengakses dan mengambil informasi dari mesin pencari akademik Baidu.
  • Pencarian Informasi Bisnis: Mengumpulkan informasi tentang bisnis dan organisasi.
  • Pencarian Informasi Waralaba: Mengambil informasi yang berkaitan dengan peluang waralaba.

Integrasi penggunaan alat ini memungkinkan ERNIE X1 untuk mengatasi masalah dunia nyata yang kompleks yang memerlukan akses dan pemrosesan informasi dari berbagai sumber.

Kemampuan ERNIE X1 yang ditingkatkan didukung oleh beberapa kemajuan teknologi utama:

  • Metode Pembelajaran Penguatan Progresif: Pendekatan ini kemungkinan melibatkan pelatihan model melalui serangkaian tugas yang semakin menantang, yang memungkinkannya untuk secara bertahap meningkatkan kinerjanya.
  • Pendekatan Pelatihan End-to-End yang Mengintegrasikan Rantai Pemikiran dan Tindakan: Ini menunjukkan bahwa model dilatih tidak hanya untuk menghasilkan output tetapi juga untuk bernalar tentang langkah-langkah yang terlibat dalam mencapai output tersebut, yang mengarah pada hasil yang lebih dapat ditafsirkan dan dapat diandalkan.
  • Sistem Reward Multi-Faset Terpadu: Ini menyiratkan bahwa model dihargai karena mencapai berbagai tujuan, mendorongnya untuk mengembangkan berbagai keterampilan dan kemampuan.

Teknologi ini berkontribusi pada kemampuan ERNIE X1 untuk melakukan tugas penalaran yang kompleks dan berinteraksi dengan lingkungannya secara efektif.

Akses dan Integrasi: Membawa ERNIE 4.5 dan X1 ke Pengguna

Komitmen Baidu terhadap aksesibilitas terlihat jelas dalam keputusannya untuk membuat ERNIE 4.5 dan ERNIE X1 tersedia secara gratis bagipengguna individu melalui situs web ERNIE Bot. Langkah ini memungkinkan khalayak luas untuk merasakan kekuatan model AI canggih ini secara langsung.

Untuk pengguna perusahaan dan pengembang, ERNIE 4.5 dapat diakses melalui API di platform MaaS Baidu AI Cloud, Qianfan. Platform ini menyediakan infrastruktur yang kuat dan dapat diskalakan untuk mengintegrasikan kemampuan ERNIE 4.5 ke dalam berbagai aplikasi. Harga untuk ERNIE 4.5 di Qianfan sangat kompetitif, dengan harga input mulai dari RMB 0,004 per seribu token dan harga output RMB 0,016 per seribu token. ERNIE X1 dijadwalkan akan tersedia di platform Qianfan segera, yang selanjutnya memperluas opsi untuk pengguna perusahaan.

Baidu juga berencana untuk secara progresif mengintegrasikan ERNIE 4.5 dan X1 ke dalam ekosistem produknya yang lebih luas. Integrasi ini akan mencakup berbagai penawaran Baidu, termasuk:

  • Pencarian Baidu: Meningkatkan pengalaman pencarian dengan kemampuan AI tingkat lanjut.
  • Aplikasi Wenxiaoyan: Mengintegrasikan model ke dalam aplikasi asisten menulis Baidu yang populer.
  • Penawaran Lainnya: Memperluas jangkauan ERNIE 4.5 dan X1 ke produk dan layanan Baidu lainnya.

Integrasi yang luas ini akan memastikan bahwa manfaat dari model AI canggih ini dirasakan di berbagai pengalaman pengguna.

Kemajuan ini merupakan langkah maju yang signifikan dalam bidang kecerdasan buatan. Dengan berfokus pada pemahaman multimodal dan penalaran berpikir mendalam, Baidu telah menciptakan dua model kuat yang menangani berbagai aspek kemampuan AI. Komitmen terhadap aksesibilitas, melalui akses publik gratis dan harga yang kompetitif untuk pengguna perusahaan, memastikan bahwa kemajuan ini akan berdampak luas. Integrasi model-model ini ke dalam ekosistem produk Baidu semakin memperkuat posisi mereka sebagai komponen kunci dari strategi AI perusahaan. Investasi berkelanjutan dalam kecerdasan buatan, pusat data, dan infrastruktur cloud menggarisbawahi dedikasi Baidu untuk memajukan kemampuan AI dan mengembangkan model generasi berikutnya yang lebih cerdas dan lebih kuat di masa depan.