Cohere Command A & Rerank di OCI Generative AI

Oracle Cloud Infrastructure (OCI) Generative AI menerima serangkaian peningkatan penting, termasuk peluncuran model Cohere Command A dan Rerank 3.5, serta pengenalan Cohere Embed 3 dengan dukungan multimodal. Model-model baru ini dirancang untuk menyediakan fungsionalitas AI tingkat perusahaan yang lebih kuat bagi pelanggan OCI, dan selanjutnya meningkatkan kemampuan aplikasi AI mereka dalam berbagai skenario aplikasi.

Command A: Puncak Kinerja dan Efisiensi

Cohere Command A 03-2025 adalah model Command paling kuat saat ini, dengan throughput 150% lebih tinggi dari generasi sebelumnya, sambil hanya membutuhkan dua GPU. Menurut data yang disediakan oleh Cohere, model ini sebanding atau bahkan melampaui OpenAI 4o dan DeepSeekv3 dalam kinerja tugas perusahaan tipe agen, dan memiliki peningkatan signifikan dalam efisiensi komputasi.

Kinerja luar biasa Command A berasal dari desain arsitektur dan metode pelatihan canggihnya, yang memungkinkannya untuk berkinerja sangat baik dalam berbagai aplikasi AI tingkat perusahaan yang kompleks. Apakah itu memproses data dalam jumlah besar, melakukan tugas inferensi yang kompleks, atau melakukan pemrosesan bahasa alami secara real-time, Command A dapat menyediakan solusi yang efisien dan andal.

Fitur Utama Command A meliputi:

  • Jendela Konteks Super Panjang: Mendukung panjang konteks hingga 256k token, memungkinkan model untuk memproses urutan teks yang lebih panjang, sehingga lebih memahami informasi konteks dan menghasilkan respons yang lebih akurat dan koheren. Ini berarti bahwa Command A dapat menangani dokumen kompleks, percakapan panjang, dan interaksi multi-putaran tanpa kehilangan informasi penting.

  • Retrieval Augmented Generation (RAG) Tingkat Lanjut: Dengan mengintegrasikan teknologi Retrieval Augmented Generation, Command A dapat mengambil informasi yang relevan dari data dalam jumlah besar dan memasukkannya ke dalam konten yang dihasilkan, sehingga meningkatkan kualitas dan akurasi hasil yang dihasilkan. Teknologi ini tidak hanya dapat mengurangi ketergantungan model pada pengetahuan eksternal, tetapi juga memungkinkannya untuk lebih beradaptasi dengan lingkungan informasi yang terus berubah.

  • Penggunaan Alat Agen Asli: Command A memiliki kemampuan penggunaan alat agen asli, yang dapat diintegrasikan dengan alat dan layanan lain untuk mencapai fungsionalitas yang lebih kompleks. Misalnya, dapat berinteraksi dengan mesin pencari, database, API, dll. untuk mendapatkan informasi yang diperlukan atau melakukan operasi tertentu. Kemampuan ini memungkinkan Command A untuk melakukan berbagai tugas kompleks, seperti otomatisasi layanan pelanggan, asisten cerdas, dan analisis data.

  • Keamanan dan Privasi Tingkat Perusahaan: Command A dirancang dengan mempertimbangkan kebutuhan keamanan dan privasi tingkat perusahaan, dan mengadopsi berbagai langkah keamanan untuk melindungi data pelanggan. Misalnya, mendukung enkripsi data, kontrol akses, dan fungsi audit untuk memastikan bahwa data pelanggan tidak diakses atau dibocorkan tanpa izin.

  • Kemampuan Multibahasa yang Kuat: Command A telah dilatih dalam 23 bahasa, termasuk Inggris, Prancis, Spanyol, Italia, Jerman, Portugis, Jepang, Korea, Arab, Mandarin, Rusia, Polandia, Turki, Vietnam, Belanda, Ceko, Indonesia, Ukraina, Rumania, Yunani, Hindi, Ibrani, dan Persia. Hal ini memungkinkannya untuk memproses teks dalam berbagai bahasa dan menyediakan layanan untuk pengguna global.

  • Input dan Output Teks: Command A saat ini hanya mendukung input dan output teks, yang berarti terutama digunakan untuk memproses tugas-tugas terkait teks, seperti pembuatan teks, ringkasan teks, terjemahan teks, dan klasifikasi teks.

Catatan: Model Command A saat ini tidak mendukung fine-tuning.

Rerank 3.5: Meningkatkan Akurasi Pencarian Perusahaan

Rerank 3.5 adalah model dasar pencarian AI terbaru dari Cohere, yang dirancang untuk meningkatkan akurasi sistem pencarian perusahaan dan Retrieval Augmented Generation (RAG). Model ini memiliki kemampuan inferensi yang ditingkatkan, dapat memahami kueri pengguna yang kompleks, dan kompatibel dengan berbagai jenis data (termasuk dokumen panjang, email, tabel, JSON, dan kode). Selain itu, Rerank 3.5 mendukung lebih dari 100 bahasa untuk memenuhi kebutuhan pencarian perusahaan global.

Rerank 3.5 meningkatkan efisiensi dan kepuasan pencarian pengguna dengan memprioritaskan hasil yang paling relevan melalui penyusunan ulang hasil pencarian. Tidak hanya dapat diterapkan pada pencarian teks tradisional, tetapi juga dapat diterapkan pada berbagai jenis pencarian lainnya, seperti pencarian gambar, pencarian video, dan pencarian audio.

Fitur Utama Rerank 3.5 meliputi:

  • Kemampuan Penalaran yang Ditingkatkan: Rerank 3.5 memiliki kemampuan penalaran yang ditingkatkan untuk lebih memahami kueri pengguna yang kompleks. Dengan menganalisis semantik dan konteks kueri, ia dapat secara akurat mengidentifikasi maksud pengguna dan mengembalikan hasil yang paling relevan.

  • Dukungan Data yang Beragam: Rerank 3.5 kompatibel dengan berbagai jenis data, termasuk dokumen panjang, email, tabel, JSON, dan kode. Ini berarti dapat memproses data dari berbagai sumber dan mengekstrak informasi yang berguna.

  • Dukungan Multibahasa yang Ditingkatkan: Rerank 3.5 mendukung lebih dari 100 bahasa, termasuk bahasa bisnis utama seperti Inggris, Arab, Mandarin, Prancis, Jerman, Hindi, Jepang, Korea, Portugis, Rusia, dan Spanyol. Ini memungkinkannya untuk menyediakan layanan pencarian berkualitas tinggi kepada pengguna global.

  • Akurasi Pencarian yang Lebih Tinggi: Dalam pengujian terhadap data keuangan, Rerank 3.5 mengungguli Hybris Search sebesar 23,4% dan BM25 sebesar 30,8%. BM25 adalah fungsi peringkat yang umum digunakan dalam mesin pencari dan sistem temu kembali informasi untuk menentukan relevansi dokumen dengan kueri pencarian tertentu.

Dukungan Bahasa yang Luas: Bagaimana Rerank 3.5 Mendukung Lebih Dari 100 Bahasa

Kemampuan multibahasa Rerank 3.5 terbukti dalam kemampuannya untuk memahami dan memproses kueri dari lebih dari 100 bahasa. Ini berarti tidak hanya dapat memahami arti literal dari kueri, tetapi juga memahami latar belakang budaya dan konteks di balik kueri. Misalnya, jika pengguna mencari "mejores restaurantes en Madrid" dalam bahasa Spanyol, Rerank 3.5 dapat memahami maksud pengguna adalah mencari restoran terbaik di Madrid dan mengembalikan hasil pencarian bahasa Spanyol yang relevan.

Untuk mencapai tujuan ini, Rerank 3.5 mengadopsi berbagai teknologi, termasuk:

  • Data Pelatihan Multibahasa: Rerank 3.5 telah dilatih pada sejumlah besar data multibahasa, yang mencakup berbagai jenis teks, seperti artikel berita, posting blog, posting media sosial, dan ulasan produk.
  • Penyematan Lintas Bahasa: Rerank 3.5 menggunakan teknologi penyematan lintas bahasa untuk memetakan kata-kata dari berbagai bahasa ke dalam ruang vektor yang sama. Ini memungkinkan model untuk memahami hubungan semantik antara bahasa yang berbeda dan mengembalikan hasil pencarian lintas bahasa yang relevan.
  • Deteksi dan Terjemahan Bahasa: Rerank 3.5 dapat secara otomatis mendeteksi bahasa kueri pengguna dan menerjemahkannya ke dalam bahasa Inggris atau bahasa lain yang didukung. Ini memungkinkan model untuk memproses kueri dalam berbagai bahasa dan mengembalikan hasil pencarian yang relevan.

Dengan mengadopsi teknologi ini, Rerank 3.5 dapat memberikan layanan pencarian berkualitas tinggi kepada pengguna global, bahasa apa pun yang mereka gunakan untuk mencari.

Kemampuan Inferensi yang Ditingkatkan: Bagaimana Rerank 3.5 Memahami Kueri yang Kompleks

Kemampuan inferensi Rerank 3.5 terbukti dalam kemampuannya untuk memahami kueri kompleks dan mengekstrak informasi yang berguna darinya. Misalnya, jika pengguna mencari "perusahaan teknologi mana yang sahamnya berkinerja lebih baik dibandingkan tahun lalu", Rerank 3.5 dapat memahami bahwa maksud pengguna adalah mencari perusahaan teknologi yang sahamnya berkinerja lebih baik dibandingkan tahun lalu.

Untuk mencapai tujuan ini, Rerank 3.5 mengadopsi berbagai teknologi, termasuk:

  • Analisis Semantik: Rerank 3.5 menggunakan teknologi analisis semantik untuk menganalisis struktur semantik dan konteks kueri. Ini memungkinkan model untuk memahami arti kueri dan mengidentifikasi maksud pengguna.
  • Pengenalan Entitas: Rerank 3.5 menggunakan teknologi pengenalan entitas untuk mengidentifikasi entitas dalam kueri, seperti perusahaan, lokasi, dan orang. Ini memungkinkan model untuk menghubungkan kueri dengan entitas yang relevan dan mengembalikan hasil pencarian yang relevan.
  • Ekstraksi Hubungan: Rerank 3.5 menggunakan teknologi ekstraksi hubungan untuk mengekstrak hubungan antara entitas dalam kueri. Ini memungkinkan model untuk memahami arti kueri dan mengembalikan hasil pencarian yang relevan.

Dengan mengadopsi teknologi ini, Rerank 3.5 dapat memahami kueri yang kompleks dan mengembalikan hasil pencarian yang relevan, sehingga meningkatkan efisiensi dan kepuasan pencarian pengguna.

Bagaimana Pelanggan OCI Dapat Memanfaatkan Model-Model Ini:

Pelanggan OCI dapat memanfaatkan model Cohere ini dalam berbagai cara, termasuk:

  • Integrasi Instan: Model-model ini dapat diakses dengan mulus melalui antarmuka obrolan, API, atau titik akhir khusus tanpa mengkhawatirkan manajemen infrastruktur. Ini memungkinkan pelanggan untuk dengan mudah mengintegrasikan model-model ini ke dalam aplikasi mereka sendiri tanpa konfigurasi dan penyebaran yang kompleks.

  • Penyederhanaan Pengembangan AI: Layanan OCI Generative AI menyediakan serangkaian lengkap alat dan layanan yang dapat membantu pelanggan menyederhanakan proses pengembangan AI. Alat dan layanan ini meliputi:

    • Persiapan Data: Layanan OCI Generative AI menyediakan serangkaian alat persiapan data yang dapat membantu pelanggan membersihkan, mengubah, dan mempersiapkan data untuk digunakan dalam pelatihan dan inferensi model AI.
    • Pelatihan Model: Layanan OCI Generative AI menyediakan serangkaian alat pelatihan model yang dapat membantu pelanggan melatih model AI mereka sendiri. Alat-alat ini mendukung berbagai jenis dan kerangka model yang berbeda, seperti TensorFlow, PyTorch, dan Scikit-learn.
    • Penyebaran Model: Layanan OCI Generative AI menyediakan serangkaian alat penyebaran model yang dapat membantu pelanggan menyebarkan model AI yang terlatih ke lingkungan produksi.
    • Pemantauan Model: Layanan OCI Generative AI menyediakan serangkaian alat pemantauan model yang dapat membantu pelanggan memantau kinerja dan akurasi model AI.
  • Penyederhanaan Alur Kerja RAG: Memanfaatkan Command A untuk pembuatan konten dan mengoptimalkan hasil yang ditingkatkan melalui Rerank 3.5 membuat proses RAG yang kompleks lebih efisien dan disederhanakan.

Keragaman Skenario Aplikasi:

Model-model ini dapat diterapkan ke berbagai skenario aplikasi perusahaan yang berbeda, termasuk:

  • Layanan Pelanggan: Command A dan Rerank 3.5 dapat digunakan untuk membangun chatbot layanan pelanggan cerdas yang dapat menjawab pertanyaan pelanggan, menyelesaikan masalah pelanggan, dan memberikan layanan yang dipersonalisasi.
  • Pembuatan Konten: Command A dapat digunakan untuk menghasilkan berbagai jenis konten teks, seperti artikel berita, posting blog, deskripsi produk, dan posting media sosial.
  • Pencarian: Rerank 3.5 dapat digunakan untuk meningkatkan akurasi dan efisiensi pencarian perusahaan, membantu pengguna menemukan informasi yang mereka butuhkan dengan cepat.
  • Analisis Data: Command A dan Rerank 3.5 dapat digunakan untuk menganalisis berbagai jenis data, mengekstrak informasi yang berguna darinya, dan membantu perusahaan membuat keputusan yang lebih baik.
  • Manajemen Pengetahuan: Dapat membangun basis pengetahuan cerdas, di mana karyawan dapat dengan cepat menemukan informasi yang mereka butuhkan, meningkatkan efisiensi kerja.

Layanan OCI Generative AI memberdayakan perusahaan untuk membangun berbagai solusi AI inovatif, meningkatkan daya saing dan nilai bisnis mereka dengan menyediakan model AI berkinerja tinggi, serbaguna, dan dapat diskalakan.

Untuk detail integrasi dan informasi harga, silakan merujuk ke dokumentasi layanan Generative AI kami atau hubungi perwakilan Oracle Anda.