Model Cohere Command A & Rerank di OCI Generative AI

Oracle Cloud Infrastructure (OCI) Generative AI telah menyaksikan beberapa peningkatan yang ketara, termasuk pelancaran model Cohere Command A dan Rerank 3.5, serta pengenalan Cohere Embed 3 dengan sokongan multimodal. Model-model baharu ini direka untuk menyediakan pelanggan OCI dengan keupayaan AI kelas perusahaan yang lebih berkuasa dan meningkatkan lagi keupayaan aplikasi AI mereka dalam pelbagai senario penggunaan.

Command A: Puncak Prestasi dan Kecekapan

Cohere Command A 03-2025 ialah model Command yang paling berkuasa setakat ini, dengan daya pemprosesan 150% lebih tinggi daripada generasi sebelumnya dan hanya memerlukan dua GPU. Menurut data yang disediakan oleh Cohere, model ini setanding atau bahkan melebihi prestasi OpenAI 4o dan DeepSeekv3 dalam tugas perusahaan berorientasikan ejen, dengan peningkatan ketara dalam kecekapan pengiraan.

Prestasi cemerlang Command A berpunca daripada reka bentuk seni bina dan kaedah latihan yang canggih, yang membolehkannya berfungsi dengan baik dalam pelbagai aplikasi AI kelas perusahaan yang kompleks. Sama ada memproses jumlah data yang besar, melaksanakan tugas penaakulan yang kompleks, atau melakukan pemprosesan bahasa semula jadi masa nyata, Command A menyediakan penyelesaian yang cekap dan boleh dipercayai.

Ciri-ciri Utama Command A termasuk:

  • Tetingkap Konteks Sangat Panjang: Menyokong panjang konteks sehingga 256k token, membolehkan model memproses urutan teks yang lebih panjang untuk memahami maklumat konteks dengan lebih baik dan menjana respons yang lebih tepat dan koheren. Ini bermakna Command A boleh memproses dokumen yang kompleks, perbualan panjang, dan interaksi berbilang pusingan tanpa kehilangan maklumat penting.

  • Penjanaan Augmented Retrieval Lanjutan (RAG): Dengan menyepadukan teknologi Penjanaan Augmented Retrieval, Command A boleh mendapatkan semula maklumat yang berkaitan daripada data yang besar dan menggabungkannya ke dalam kandungan yang dijana, meningkatkan kualiti dan ketepatan hasil penjanaan. Teknologi ini bukan sahaja mengurangkan pergantungan model pada pengetahuan luaran tetapi juga membolehkannya menyesuaikan diri dengan lebih baik kepada persekitaran maklumat yang sentiasa berubah.

  • Penggunaan Alat Ejen Asli: Command A mempunyai keupayaan penggunaan alat ejen asli dan boleh disepadukan dengan alat dan perkhidmatan lain untuk mencapai fungsi yang lebih kompleks. Contohnya, ia boleh berinteraksi dengan enjin carian, pangkalan data, API, dsb. untuk mendapatkan maklumat yang diperlukan atau melakukan operasi tertentu. Keupayaan ini membolehkan Command A melaksanakan pelbagai tugas kompleks, seperti automasi perkhidmatan pelanggan, pembantu pintar dan analisis data.

  • Keselamatan dan Privasi Kelas Perusahaan: Command A direka dengan mengambil kira keperluan keselamatan dan privasi kelas perusahaan, menggunakan pelbagai langkah keselamatan untuk melindungi data pelanggan. Contohnya, ia menyokong penyulitan data, kawalan akses dan fungsi audit untuk memastikan data pelanggan tidak diakses atau dibocorkan tanpa kebenaran.

  • Keupayaan Berbilang Bahasa yang Mantap: Command A telah dilatih dalam 23 bahasa, termasuk Bahasa Inggeris, Perancis, Sepanyol, Itali, Jerman, Portugis, Jepun, Korea, Arab, Cina, Rusia, Poland, Turki, Vietnam, Belanda, Czech, Indonesia, Ukraine, Romania, Greek, Hindi, Ibrani dan Parsi. Ini membolehkannya memproses teks dalam pelbagai bahasa dan menyediakan perkhidmatan kepada pengguna global.

  • Input dan Output Teks: Command A hanya menyokong input dan output teks pada masa ini, yang bermaksud ia digunakan terutamanya untuk memproses tugas berkaitan teks, seperti penjanaan teks, ringkasan teks, terjemahan teks dan pengelasan teks.

Nota: Model Command A tidak menyokong penalaan halus pada masa ini.

Rerank 3.5: Meningkatkan Ketepatan Carian Perusahaan

Rerank 3.5 ialah model asas carian AI terkini dari Cohere, yang direka untuk meningkatkan ketepatan sistem carian perusahaan dan penjanaan augmented retrieval (RAG). Model ini mempunyai keupayaan penaakulan yang dipertingkatkan, boleh memahami pertanyaan pengguna yang kompleks dan serasi dengan pelbagai jenis data (termasuk dokumen panjang, e-mel, jadual, JSON dan kod). Di samping itu, Rerank 3.5 menyokong lebih daripada 100 bahasa untuk memenuhi keperluan carian perusahaan global.

Dengan menyusun semula hasil carian, Rerank 3.5 boleh meletakkan hasil yang paling relevan di hadapan, dengan itu meningkatkan kecekapan dan kepuasan carian pengguna. Ia boleh digunakan bukan sahaja untuk carian teks tradisional tetapi juga untuk pelbagai jenis carian lain, seperti carian imej, carian video dan carian audio.

Ciri-ciri Utama Rerank 3.5 termasuk:

  • Keupayaan Penaakulan yang Dipertingkatkan: Rerank 3.5 mempunyai keupayaan penaakulan yang dipertingkatkan untuk memahami pertanyaan pengguna yang kompleks dengan lebih baik. Ia boleh menganalisis semantik dan konteks pertanyaan untuk mengenal pasti dengan tepat niat pengguna dan mengembalikan hasil yang paling relevan.

  • Sokongan Data Pelbagai: Rerank 3.5 serasi dengan pelbagai jenis data, termasuk dokumen panjang, e-mel, jadual, JSON dan kod. Ini bermakna ia boleh memproses data daripada pelbagai sumber yang berbeza dan mengekstrak maklumat yang berguna daripadanya.

  • Sokongan Berbilang Bahasa yang Diperbaiki: Rerank 3.5 menyokong lebih daripada 100 bahasa, termasuk bahasa perniagaan utama seperti Bahasa Inggeris, Arab, Cina, Perancis, Jerman, Hindi, Jepun, Korea, Portugis, Rusia dan Sepanyol. Ini membolehkannya menyediakan perkhidmatan carian berkualiti tinggi kepada pengguna global.

  • Ketepatan Carian yang Lebih Tinggi: Dalam ujian terhadap data kewangan, prestasi Rerank 3.5 adalah lebih baik daripada Hybris Search sebanyak 23.4% dan lebih baik daripada BM25 sebanyak 30.8%. BM25 ialah fungsi kedudukan yang biasa digunakan dalam enjin carian dan sistem perolehan maklumat untuk menentukan perkaitan dokumen dengan pertanyaan carian tertentu.

Sokongan Bahasa yang Diperluas: Bagaimana Rerank 3.5 Menyokong Lebih Daripada 100 Bahasa

Keupayaan berbilang bahasa Rerank 3.5 ditunjukkan dalam keupayaannya untuk memahami dan memproses pertanyaan daripada lebih daripada 100 bahasa. Ini bermakna ia bukan sahaja boleh memahami maksud literal pertanyaan tetapi juga konteks budaya dan konteks di sebalik pertanyaan itu. Contohnya, jika pengguna mencari "mejores restaurantes en Madrid" dalam Bahasa Sepanyol, Rerank 3.5 boleh memahami niat pengguna untuk mencari restoran terbaik di Madrid dan mengembalikan hasil carian Bahasa Sepanyol yang berkaitan.

Untuk mencapai matlamat ini, Rerank 3.5 menggunakan pelbagai teknologi, termasuk:

  • Data Latihan Berbilang Bahasa: Rerank 3.5 telah dilatih pada sejumlah besar data berbilang bahasa, yang merangkumi pelbagai jenis teks, seperti artikel berita, catatan blog, catatan media sosial dan ulasan produk.
  • Pembenaman Merentas Bahasa: Rerank 3.5 menggunakan teknologi pembenaman merentas bahasa untuk memetakan perkataan dalam bahasa yang berbeza ke ruang vektor yang sama. Ini memboleh