Oracle Cloud Generative AI发布Cohere模型

Oracle Cloud Infrastructure Generative AI上的Cohere Command A和Rerank模型发布

Oracle Cloud Infrastructure (OCI) Generative AI服务迎来了一系列重要的升级,包括Cohere Command A和Rerank 3.5模型的发布,以及引入了具备多模态支持的Cohere Embed 3。这些新模型旨在为OCI客户提供更强大的企业级AI功能,并进一步提升其在各个应用场景中的AI应用能力。

Command A:性能与效率的巅峰

Cohere的Command A 03-2025是目前性能最强大的Command模型,其吞吐量比上一代产品提高了150%,同时仅需要两块GPU。根据Cohere提供的数据,这款模型在代理型企业任务方面的性能与OpenAI 4o和DeepSeekv3相媲美甚至超越,并且在计算效率方面有着显著的提升。

Command A的卓越性能源于其先进的架构设计和训练方法,能够在各种复杂的企业级AI应用中表现出色。无论是处理海量数据、执行复杂的推理任务,还是进行实时的自然语言处理,Command A都能够提供高效、可靠的解决方案。

Command A的主要特性包括:

  • 超长上下文窗口: 支持高达256k token的上下文长度,使模型能够处理更长的文本序列,从而更好地理解上下文信息,生成更准确、更连贯的回复。这意味着Command A可以处理复杂的文档、长篇对话和多轮交互,而不会丢失关键信息。

  • 高级检索增强生成(RAG): 通过集成检索增强生成技术,Command A能够从海量数据中检索相关信息,并将其融入到生成的内容中,从而提高生成结果的质量和准确性。这种技术不仅可以减少模型对外部知识的依赖,还可以使其更好地适应不断变化的信息环境。

  • 原生代理工具使用: Command A具备原生代理工具使用能力,可以与其他工具和服务进行集成,从而实现更复杂的功能。例如,它可以与搜索引擎、数据库、API等进行交互,以获取所需的信息或执行特定的操作。这种能力使得Command A能够胜任各种复杂的任务,例如自动化客户服务、智能助手和数据分析。

  • 企业级安全与隐私: Command A在设计上充分考虑了企业级安全和隐私需求,采用了各种安全措施来保护客户的数据。例如,它支持数据加密、访问控制和审计功能,确保客户的数据不会被未经授权的访问或泄露。

  • 强大的多语言能力: Command A经过在23种语言上的训练,包括英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语、中文、俄语、波兰语、土耳其语、越南语、荷兰语、捷克语、印度尼西亚语、乌克兰语、罗马尼亚语、希腊语、印地语、希伯来语和波斯语。这使得它能够处理各种语言的文本,并为全球用户提供服务。

  • 文本输入和输出: Command A目前仅支持文本输入和输出,这意味着它主要用于处理文本相关的任务,例如文本生成、文本摘要、文本翻译和文本分类。

注意: Command A模型目前不支持微调。

Rerank 3.5:提升企业搜索的精度

Rerank 3.5是Cohere最新的AI搜索基础模型,旨在提高企业搜索和检索增强生成(RAG)系统的准确性。这款模型具备增强的推理能力,能够理解复杂的用户查询,并兼容各种数据类型(包括长文档、电子邮件、表格、JSON和代码)。此外,Rerank 3.5还支持超过100种语言,能够满足全球企业的搜索需求。

Rerank 3.5通过对搜索结果进行重新排序,可以将最相关的结果排在前面,从而提高用户的搜索效率和满意度。它不仅可以应用于传统的文本搜索,还可以应用于各种其他类型的搜索,例如图像搜索、视频搜索和音频搜索。

Rerank 3.5的主要特性包括:

  • 增强的推理能力: Rerank 3.5具备增强的推理能力,能够更好地理解复杂的用户查询。它可以通过分析查询的语义和上下文,准确地识别用户的意图,并返回最相关的结果。

  • 多样的数据支持: Rerank 3.5兼容各种数据类型,包括长文档、电子邮件、表格、JSON和代码。这意味着它可以处理各种不同来源的数据,并从中提取有用的信息。

  • 改进的多语言支持: Rerank 3.5支持超过100种语言,包括主要的商业语言,例如英语、阿拉伯语、中文、法语、德语、印地语、日语、韩语、葡萄牙语、俄语和西班牙语。这使得它能够为全球用户提供高质量的搜索服务。

  • 更高的搜索精度: 在针对金融数据的测试中,Rerank 3.5的性能优于Hybris Search 23.4%,优于BM25 30.8%。BM25是一种常用的排序函数,用于搜索引擎和信息检索系统中,以确定文档与给定搜索查询的相关性。Rerank 3.5的这一提升,意味着在处理金融领域这类对数据准确性要求极高的场景下,它能更有效地筛选出精准信息,降低错误率,提升专业用户的工作效率。这对于金融分析师、投资顾问等需要快速获取准确金融数据的专业人士来说,具有非常重要的意义。通过运用Rerank 3.5,企业可以构建更加智能、高效的金融信息检索系统。

扩展的语言支持:Rerank 3.5如何支持100多种语言

Rerank 3.5的多语言能力体现在它能够理解和处理来自100多种语言的查询。这意味着它不仅能理解查询的字面意思,还能理解查询背后的文化背景和语境。例如,如果用户用西班牙语搜索“mejores restaurantes en Madrid”,Rerank 3.5能够理解用户的意图是寻找马德里最好的餐厅,并返回相关的西班牙语搜索结果。

为了实现这一目标,Rerank 3.5采用了多种技术,包括:

  • 多语言训练数据: Rerank 3.5在大量的多语言数据上进行了训练,这些数据包括各种类型的文本,例如新闻文章、博客文章、社交媒体帖子和产品评论。这种大规模、多样化的训练数据使得模型能够学习到不同语言的语法、语义和表达方式,从而更好地理解和处理不同语言的查询。此外,训练数据还涵盖了各种不同的文化背景的信息,使得模型能够理解查询背后的文化语境,从而更准确地识别用户的意图。

  • 跨语言嵌入: Rerank 3.5使用跨语言嵌入技术,将不同语言的词语映射到同一个向量空间中。这使得模型能够理解不同语言之间的语义关系,并返回相关的跨语言搜索结果。通过跨语言嵌入,例如"苹果"(中文)和"apple"(英语)可以被映射到向量空间中相近的位置,模型可以理解它们代表着同一个概念。这种技术极大地提升了模型在不同语言间进行信息匹配和检索的能力。

  • 语言检测和翻译: Rerank 3.5可以自动检测用户查询的语言,并将其翻译成英语或其他支持的语言。这使得模型能够处理各种语言的查询,并返回相关的搜索结果。例如,一个用户用法语输入了一个查询,模型可以先自动检测到这是法语,然后将其翻译成英语,再基于英语的查询进行搜索。这为用户提供了极大的便利,他们可以使用自己熟悉的语言进行搜索,而无需担心语言障碍。

通过采用这些技术,Rerank 3.5能够为全球用户提供高质量的搜索服务,无论他们使用哪种语言进行搜索。它的多语言能力让企业可以面向全球市场,提供个性化的搜索体验,从而拓展业务范围。

增强的推理能力:Rerank 3.5如何理解复杂的查询

Rerank 3.5的推理能力体现在它能够理解复杂的查询,并从中提取有用的信息。例如,如果用户搜索“与去年相比,哪些科技公司的股票表现更好”,Rerank 3.5能够理解用户的意图是寻找那些股票表现优于去年的科技公司。它不仅仅是将关键词进行匹配,而是能够理解用户查询中隐含的比较关系和时间维度。

为了实现这一目标,Rerank 3.5采用了多种技术,包括:

  • 语义分析: Rerank 3.5使用语义分析技术,分析查询的语义结构和上下文。这使得模型能够理解查询的含义,并识别用户的意图。 语义分析不仅仅关注单词本身,更关注单词在句子中的作用以及它们之间的关系,从而更准确地把握用户的查询意图。

  • 实体识别: Rerank 3.5使用实体识别技术,识别查询中的实体,例如公司、地点和人物。这使得模型能够将查询与相关的实体联系起来,并返回相关的搜索结果。 例如,当用户搜索“埃隆·马斯克”时,模型能够识别出“埃隆·马斯克”是一个人名,并将其与相关的文章、新闻和社交媒体信息联系起来。

  • 关系提取: Rerank 3.5使用关系提取技术,提取查询中实体之间的关系。这使得模型能够理解查询的含义,并返回相关的搜索结果。 例如,当用户搜索“苹果公司的CEO是谁”时,模型能够提取出“苹果公司”和“CEO”之间的关系,并返回相关的答案。

通过采用这些技术,Rerank 3.5能够理解复杂的查询,并返回相关的搜索结果,从而提高用户的搜索效率和满意度。 这种强大的推理能力使得Rerank 3.5在处理复杂的企业级搜索场景中表现出色,为用户提供精准、高效的信息检索服务。

OCI客户如何利用这些模型:

OCI客户可以通过多种方式利用这些Cohere模型,包括:

  • 即时集成: 这些模型可以通过聊天界面、API或专用端点无缝访问,无需担心基础设施管理。这意味着企业无需投入大量资源进行服务器配置、软件安装和维护,可以专注于业务逻辑的实现。云服务的弹性伸缩能力也保证了在业务高峰期,系统能够自动扩展资源,应对高并发请求,而在业务低谷期,则可以缩减资源,节省成本。

  • 简化AI开发: OCI Generative AI服务提供了一套完整的工具和服务,可以帮助客户简化AI开发流程。这些工具和服务包括:

    • 数据准备: OCI Generative AI服务提供了一系列数据准备工具,可以帮助客户清理、转换和准备数据,以便用于AI模型的训练和推理。数据准备是AI开发的关键环节,高质量的数据是训练出高性能模型的基础。这些工具可以帮助企业清洗掉数据中的噪声、缺失值和异常值,并将数据转换成模型可以接受的格式。
    • 模型训练: OCI Generative AI服务提供了一系列模型训练工具,可以帮助客户训练自己的AI模型。这些工具支持各种不同的模型类型和框架,例如TensorFlow、PyTorch和Scikit-learn。企业可以根据自己的业务需求和数据特点,选择合适的模型类型和框架进行训练。
    • 模型部署: OCI Generative AI服务提供了一系列模型部署工具,可以帮助客户将训练好的AI模型部署到生产环境中。模型部署是将AI技术转化为实际生产力的关键步骤。这些工具可以帮助企业将模型快速、高效地部署到各种不同的应用场景中,例如Web应用、移动应用和API服务。
    • 模型监控: OCI Generative AI服务提供了一系列模型监控工具,可以帮助客户监控AI模型的性能和准确性。模型监控是保证AI系统长期稳定运行的关键环节。这些工具可以帮助企业实时监控模型的各项指标,例如准确率、延迟和吞吐量,及时发现并解决潜在的问题。
  • 简化RAG工作流程: 利用Command A进行内容生成,并通过Rerank 3.5优化增强结果,使得复杂的RAG流程更加高效和简化。RAG技术可以有效提升生成式AI模型的准确性和可靠性。通过将Command A和Rerank 3.5结合使用,企业可以构建更加智能、高效的RAG系统,从而提升内容生成的质量和用户体验。

OCI Generative AI服务为企业提供了一站式的AI开发平台,帮助企业降低AI开发门槛,加速AI应用落地,从而提升业务价值。

应用场景的多样性:

这些模型可以应用于各种不同的企业应用场景,包括:

  • 客户服务: Command A和Rerank 3.5可以用于构建智能客服机器人,能够回答客户的问题、解决客户的疑虑,并提供个性化的服务。 智能客服机器人可以24小时全天候在线,快速响应客户的请求,并提供准确的答案。这可以有效提升客户满意度,降低客户服务成本。通过学习客户的历史对话记录和反馈信息,智能客服机器人还可以不断提升自己的服务水平,为客户提供更加个性化的服务。

  • 内容生成: Command A可以用于生成各种类型的文本内容,例如新闻文章、博客文章、产品描述和社交媒体帖子。 这可以帮助企业快速创建高质量的内容,提升品牌影响力,吸引更多的用户。 例如,电商企业可以使用Command A自动生成产品描述,节省大量的时间和人力成本。

  • 搜索: Rerank 3.5可以用于提高企业搜索的准确性和效率,帮助用户快速找到所需的信息。 企业内部往往积累了大量的文档、知识库和数据,如何让员工快速找到所需的信息,是提升工作效率的关键。 Rerank 3.5可以帮助企业构建更加智能、高效的搜索系统,让员工能够快速找到所需的信息,从而提升工作效率。

  • 数据分析: Command A和Rerank 3.5可以用于分析各种类型的数据,从中提取有用的信息,并帮助企业做出更好的决策。 通过分析客户的行为数据、市场数据和竞争对手数据,企业可以更好地了解市场趋势,优化产品策略,提升营销效果。

  • 知识管理: 可以构建智能知识库,员工能够快速地查找所需要的信息,提升工作效率。智能知识库可以整合企业内部各种不同来源的信息,例如文档、数据库和专家知识,并提供统一的搜索和访问接口。 员工可以通过智能知识库快速找到所需的信息,解决工作中的问题,从而提升工作效率。

OCI Generative AI服务通过提供高性能、多功能和可扩展的AI模型,赋能企业构建各种创新的AI解决方案,从而提升其竞争力和业务价值。这些应用场景只是冰山一角,随着AI技术的不断发展,相信未来会出现更多创新性的应用。

有关集成细节和定价信息,请查阅我们的Generative AI服务文档或联系您的Oracle代表。