Oracle雲端 AI:Cohere Command A 與 Rerank 模型發布

Oracle Cloud Infrastructure (OCI) Generative AI 服務迎來了一系列重要的升級,包括 Cohere Command A 和 Rerank 3.5 模型的發布,以及引入了具備多模態支持的 Cohere Embed 3。這些新模型旨在為 OCI 客戶提供更強大的企業級 AI 功能,並進一步提升其在各個應用場景中的 AI 應用能力。

Command A:性能與效率的巔峰

Cohere 的 Command A 03-2025 是目前性能最強大的 Command 模型,其吞吐量比上一代產品提高了 150%,同時僅需要兩塊 GPU。根據 Cohere 提供的數據,這款模型在代理型企業任務方面的性能與 OpenAI 4o 和 DeepSeekv3 相媲美甚至超越,並且在計算效率方面有著顯著的提升。

Command A 的卓越性能源於其先進的架構設計和訓練方法,能夠在各種複雜的企業級 AI 應用中表現出色。無論是處理海量數據、執行複雜的推理任務,還是進行實時的自然語言處理,Command A 都能夠提供高效、可靠的解決方案。

Command A 的主要特性包括:

  • 超長上下文窗口: 支持高達 256k token 的上下文長度,使模型能夠處理更長的文本序列,從而更好地理解上下文信息,生成更準確、更連貫的回覆。這意味著 Command A 可以處理複雜的文件、長篇對話和多輪交互,而不會丟失關鍵信息。想像一下,Command A 可以完整閱讀一份冗長的法律文件,提取關鍵條款,並根據您的問題提供精確的解答。或者,它可以參與數小時的客戶服務對話,始終記得之前的交互,並提供個性化的幫助。

  • 高級檢索增強生成(RAG): 通過集成檢索增強生成技術,Command A 能夠從海量數據中檢索相關信息,並將其融入到生成的內容中,從而提高生成結果的質量和準確性。這種技術不僅可以減少模型對外部知識的依賴,還可以使其更好地適應不斷變化的信息環境。傳統的生成式 AI 模型受限於其訓練數據的範圍和時效性,而 RAG 技術則賦予模型訪問外部知識庫的能力,使其能够生成更全面、更準確的答案。例如,在回答關於特定行業趨勢的問題時,Command A 可以實時檢索最新的市場報告和新聞文章,並將這些信息整合到其回覆中。

  • 原生代理工具使用: Command A 具備原生代理工具使用能力,可以與其他工具和服務進行集成,從而實現更複雜的功能。例如,它可以與搜索引擎、數據庫、API 等進行交互,以獲取所需的信息或執行特定的操作。這種能力使得 Command A 能夠勝任各種複雜的任務,例如自動化客戶服務、智能助手和數據分析。舉例來說,Command A 可以自動安排會議行程。當使用者要求安排與特定對象的會議時,Command A 可以連接到使用者的日曆和聯絡人資訊,查找空閒時段,並自動發送邀請。或者,Command A 可以在使用者要求查詢特定產品的價格時,連接到多個電商平台的 API,取得最新的價格資訊,並進行比較。

  • 企業級安全與隱私: Command A 在設計上充分考慮了企業級安全和隱私需求,採用了各種安全措施來保護客戶的數據。例如,它支持數據加密、訪問控制和審計功能,確保客戶的數據不會被未經授權的訪問或洩露。在嚴格的監管環境下,企業需要確保其 AI 解決方案符合最高的安全標準。Command A 提供的企業級安全功能,如數據加密和訪問控制,能協助企業安心地部署 AI 應用。

  • 強大的多語言能力: Command A 經過在 23 種語言上的訓練,包括英語、法語、西班牙語、意大利語、德語、葡萄牙語、日語、韓語、阿拉伯語、中文、俄語、波蘭語、土耳其語、越南語、荷蘭語、捷克語、印度尼西亞語、烏克蘭語、羅馬尼亞語、希臘語、印地語、希伯來語和波斯語。這使得它能夠處理各種語言的文本,並為全球用戶提供服務。全球化的企業需要能夠用各種語言與客戶溝通的 AI 解決方案。Command A 的多語言能力使其能够為來自世界各地的客戶提供服務,打破語言隔閡。

  • 文本輸入和輸出: Command A 目前僅支持文本輸入和輸出,這意味著它主要用於處理文本相關的任務,例如文本生成、文本摘要、文本翻譯和文本分類。雖然目前僅支持文本模式,但未來可期望其擴展至圖像、音頻和影片等更多模態,進一步拓展應用範圍。

注意: Command A 模型目前不支持微調。

Rerank 3.5:提升企業搜索的精度

Rerank 3.5 是 Cohere 最新的 AI 搜索基礎模型,旨在提高企業搜索和檢索增強生成(RAG)系統的準確性。這款模型具備增強的推理能力,能夠理解複雜的用戶查詢,並兼容各種數據類型(包括長文檔、電子郵件、表格、JSON 和代碼)。此外,Rerank 3.5 還支持超過 100 種語言,能夠滿足全球企業的搜索需求。

Rerank 3.5 通過對搜索結果進行重新排序,可以将最相關的結果排在前面,從而提高用户的搜索效率和滿意度。它不僅可以應用於傳統的文本搜索,還可以應用於各種其他類型的搜索,例如圖像搜索、視頻搜索和音頻搜索。

Rerank 3.5 的主要特性包括:

  • 增強的推理能力: Rerank 3.5 具備增強的推理能力,能夠更好地理解複雜的用戶查詢。它可以通過分析查詢的語義和上下文,準確地識別用戶的意圖,並返回最相關的結果。傳統的搜索引擎常常無法理解複雜的查詢,而 Rerank 3.5 則能透過理解查詢的深層含義,提供更精確的搜索結果。例如,當使用者搜索“哪些環保汽車可以在不需要充電的情況下行駛超過 500 英里?”時,Rerank 3.5 能夠理解使用者的需求,並將查詢轉換為“混合動力汽車”,並篩選出符合里程要求的車款。

  • 多樣的數據支持: Rerank 3.5 兼容各種數據類型,包括長文檔、電子郵件、表格、JSON 和代碼。這意味著它可以處理各種不同來源的數據,並從中提取有用的信息。在企業环境中,信息分散在各種類型的數據中,Rerank 3.5 的數據兼容性使其能够整合來自不同來源的信息,提供更全面的搜索結果。

  • 改進的多語言支持: Rerank 3.5 支持超過 100 種語言,包括主要的商業語言,例如英語、阿拉伯語、中文、法語、德語、印地語、日語、韓語、葡萄牙語、俄語和西班牙語。這使得它能夠為全球用戶提供高質量的搜索服務。超越 100 種語言的支持,代表 Rerank 3.5 能够為全球企業帶來更精準的本地化搜索經驗。

  • 更高的搜索精度: 在針對金融數據的測試中,Rerank 3.5 的性能優於 Hybris Search 23.4%,優於 BM25 30.8%。BM25 是一種常用的排序函數,用於搜索引擎和信息檢索系統中,以確定文檔與給定搜索查詢的相關性。在金融領域,準確性至關重要,Rerank 3.5 在金融數據上的卓越表現證明了其在高精度搜索方面的能力。

擴展的語言支持:Rerank 3.5 如何支持 100 多種語言

Rerank 3.5 的多語言能力體現在它能夠理解和處理來自 100 多種語言的查詢。這意味著它不僅能理解查詢的字面意思,還能理解查詢背後的文化背景和語境。例如,如果用戶用西班牙語搜索“mejores restaurantes en Madrid”,Rerank 3.5 能夠理解用戶的意圖是尋找馬德里最好的餐廳,並返回相關的西班牙語搜索結果。

為了實現這一目標,Rerank 3.5 採用了多種技術,包括:

  • 多語言訓練數據: Rerank 3.5 在大量的多語言數據上進行了訓練,這些數據包括各種類型的文本,例如新聞文章、博客文章、社交媒體帖子和產品評論。
  • 跨語言嵌入: Rerank 3.5 使用跨語言嵌入技術,將不同語言的詞語映射到同一個向量空間中。這使得模型能夠理解不同語言之間的語義關係,並返回相關的跨語言搜索結果。
  • 語言檢測和翻譯: Rerank 3.5 可以自動檢測用户查詢的語言,並將其翻譯成英語或其他支持的語言。這使得模型能夠處理各種語言的查詢,並返回相關的搜索結果。

通過採用這些技術,Rerank 3.5 能够為全球用戶提供高質量的搜索服務,無論他們使用哪種語言進行搜索。Rerank 3.5 通过将查询编码为多语言嵌入向量来支持广泛的语言。这意味着它可以比较用一种语言编写的查询与用另一种语言编写的文档——在构建真正的全球搜索应用程序时至关重要。此外,Rerank 3.5 还可以将少量或低资源语言的性能与世界上最流行的语言相匹配。

增強的推理能力:Rerank 3.5 如何理解複雜的查詢

Rerank 3.5 的推理能力體現在它能夠理解複雜的查詢,並從中提取有用的信息。例如,如果用戶搜索“與去年相比,哪些科技公司的股票表現更好”,Rerank 3.5 能夠理解用户的意圖是尋找那些股票表現優於去年的科技公司。

為了實現這一目標,Rerank 3.5 採用了多種技術,包括:

  • 語義分析: Rerank 3.5 使用語義分析技術,分析查詢的語義結構和上下文。這使得模型能夠理解查詢的含義,並識別用户的意圖。
  • 實體識別: Rerank 3.5 使用實體識別技術,識別查詢中的實體,例如公司、地點和人物。這使得模型能夠將查詢與相關的實體聯繫起來,並返回相關的搜索結果。
  • 關係提取: Rerank 3.5 使用關係提取技術,提取查詢中實體之間的關係。這使得模型能夠理解查詢的含義,並返回相關的搜索結果。Rerank 3.5 在重新排序時考虑了多种因素,而不仅仅是关键字匹配。它尝试理解查询的意图,并根据文档满足该意图的可能性程度来分配分數。一种方法是使用语言模型来预测查询和文档之间的关系。例如,如果查询是“治疗糖尿病的新方法”,则语言模型可以预测文档包含有關新治疗方法的可能性有多大。

通過採用這些技術,Rerank 3.5 能够理解複雜的查詢,並返回相關的搜索結果,從而提高用户的搜索效率和滿意度。

OCI 客戶如何利用這些模型:

OCI 客戶可以通過多種方式利用這些 Cohere 模型,包括:

  • 即時集成: 這些模型可以通過聊天界面、API 或專用端點無縫訪問,無需擔心基礎設施管理。這使得客戶可以輕鬆地將這些模型集成到自己的應用程序中,而無需進行複雜的配置和部署。OCI 提供的無伺服器部署選項,讓企業能够快速開始使用這些模型,而无需处理底層的伺服器管理和擴展問題。

  • 簡化 AI 開發: OCI Generative AI 服務提供了一套完整的工具和服務,可以幫助客戶簡化 AI 開發流程。這些工具和服務包括:

    • 數據準備: OCI Generative AI 服務提供了一系列數據準備工具,可以幫助客戶清理、轉換和準備數據,以便用於 AI 模型的訓練和推理。
    • 模型訓練: OCI Generative AI 服務提供了一系列模型訓練工具,可以幫助客戶訓練自己的 AI 模型。這些工具支持各種不同的模型類型和框架,例如 TensorFlow、PyTorch 和 Scikit-learn。
    • 模型部署: OCI Generative AI 服務提供了一系列模型部署工具,可以幫助客戶將訓練好的 AI 模型部署到生產環境中。
    • 模型監控: OCI Generative AI 服務提供了一系列模型監控工具,可以幫助客戶監控 AI 模型的性能和準確性。OCI 提供端到端的 AI 開發平台,涵蓋數據準備、模型訓練、部署和監控,讓企業能更专注于 AI 價值創造,而非花費大量资源在基礎設施和工具链的维护上。
  • 簡化 RAG 工作流程: 利用 Command A 進行內容生成,並通過 Rerank 3.5 優化增強結果,使得複雜的 RAG 流程更加高效和簡化。通过减少对专门的机器学习工程师的需求,RAG 允许更大的团队访问 LLM,而无需精通该领域。

應用場景的多樣性:

這些模型可以應用於各種不同的企業應用場景,包括:

  • 客戶服務: Command A 和 Rerank 3.5 可以用於構建智能客服機器人,能夠回答客户的问题、解决客户的疑虑,并提供个性化的服务。智能客服機器人可以提供 24/7 全天候服务,同時降低客户服务成本。

  • 內容生成: Command A 可以用於生成各種类型的文本内容,例如新聞文章、博客文章、产品描述和社交媒體帖子。內容生成可以幫助企業快速創建大量高品質的內容,提升品牌影响力和内容营销效果。

  • 搜索: Rerank 3.5 可以用於提高企業搜索的準確性和效率,幫助用户快速找到所需的信息。高效的搜索可以提升员工的工作效率,并降低信息查找成本。

  • 數據分析: Command A 和 Rerank 3.5 可以用於分析各種类型的數據,从中提取有用的信息,并帮助企业做出更好的决策。數據分析可以帮助企业发现潜在的商机和风险,从而制定更明智的战略决策。

  • 知識管理: 可以構建智能知識庫,員工能夠快速地查找所需要的信息,提升工作效率。智能知識庫可以整合企業內部的知識資源,方便員工查找和利用,提高知識共享和协作效率。

OCI Generative AI 服務通過提供高性能、多功能和可擴展的 AI 模型,賦能企業構建各種創新的 AI 解決方案,從而提升其競爭力和業務價值。

有关集成细节和定价信息,请查阅我们的 Generative AI 服务文档或联系您的 Oracle 代表。