Modelos Command A e Rerank no Oracle Cloud AI

O serviço Oracle Cloud Infrastructure (OCI) Generative AI recebeu uma série de atualizações significativas, incluindo o lançamento dos modelos Cohere Command A e Rerank 3.5, bem como a introdução do Cohere Embed 3 com suporte multimodal. Esses novos modelos visam fornecer aos clientes OCI recursos de IA de nível empresarial mais poderosos e aprimorar ainda mais sua capacidade de aplicar IA em vários cenários de aplicação.

Command A: O Auge do Desempenho e Eficiência

O Command A 03-2025 da Cohere é atualmente o modelo Command mais poderoso, com throughput 150% maior do que a geração anterior e requerendo apenas duas GPUs. De acordo com os dados fornecidos pela Cohere, este modelo rivaliza ou supera o OpenAI 4o e o DeepSeekv3 em desempenho em tarefas empresariais baseadas em agentes, ao mesmo tempo em que apresenta uma melhoria significativa na eficiência computacional.

O desempenho excepcional do Command A decorre de seu design de arquitetura avançado e métodos de treinamento, permitindo que ele se destaque em uma variedade de aplicações de IA de nível empresarial complexas. Seja lidando com grandes quantidades de dados, executando tarefas de inferência complexas ou conduzindo processamento de linguagem natural em tempo real, o Command A pode fornecer soluções eficientes e confiáveis.

As Principais Características do Command A Incluem:

  • Janela de Contexto Super Longa: Suporta um comprimento de contexto de até 256k tokens, permitindo que o modelo processe sequências de texto mais longas, entendendo melhor as informações contextuais e gerando respostas mais precisas e coerentes. Isso significa que o Command A pode lidar com documentos complexos, conversas longas e interações de várias rodadas sem perder informações cruciais.

  • Geração de Recuperação Aumentada (RAG) Avançada: Ao integrar tecnologia de geração de recuperação aumentada, o Command A pode recuperar informações relevantes de grandes quantidades de dados e incorporá-las ao conteúdo gerado, melhorando a qualidade e a precisão dos resultados gerados. Essa tecnologia não apenas reduz a dependência do modelo em conhecimento externo, mas também permite que ele se adapte melhor a um ambiente de informação em constante mudança.

  • Uso Nativo de Ferramentas de Agente: O Command A possui capacidade de uso de ferramentas de agente nativas, o que lhe permite integrar-se com outras ferramentas e serviços para alcançar funções mais complexas. Por exemplo, ele pode interagir com mecanismos de busca, bancos de dados, APIs, etc., para obter as informações necessárias ou executar operações específicas. Essa capacidade permite que o Command A execute várias tarefas complexas, como automação de atendimento ao cliente, assistentes inteligentes e análise de dados.

  • Segurança e Privacidade de Nível Empresarial: O Command A foi projetado com segurança e privacidade de nível empresarial em mente, utilizando várias medidas de segurança para proteger os dados do cliente. Por exemplo, ele suporta criptografia de dados, controle de acesso e funções de auditoria, garantindo que os dados do cliente não sejam acessados ou divulgados sem autorização.

  • Fortes Capacidades Multilíngues: O Command A foi treinado em 23 idiomas, incluindo inglês, francês, espanhol, italiano, alemão, português, japonês, coreano, árabe, chinês, russo, polonês, turco, vietnamita, holandês, tcheco, indonésio, ucraniano, romeno, grego, hindi, hebraico e persa. Isso permite que ele processe texto em vários idiomas e forneça serviços para usuários em todo o mundo.

  • Entrada e Saída de Texto: O Command A atualmente suporta apenas entrada e saída de texto, o que significa que é usado principalmente para lidar com tarefas relacionadas a texto, como geração de texto, resumo de texto, tradução de texto e classificação de texto.

Observação: O modelo Command A atualmente não suporta ajuste fino.

Rerank 3.5: Melhorando a Precisão da Pesquisa Empresarial

O Rerank 3.5 é o mais recente modelo de fundação de pesquisa de IA da Cohere, projetado para melhorar a precisão da pesquisa empresarial e dos sistemas de geração de recuperação aumentada (RAG). Este modelo apresenta capacidades de raciocínio aprimoradas, permite a compreensão de consultas de usuários complexas e é compatível com vários tipos de dados (incluindo documentos longos, e-mails, tabelas, JSON e código). Além disso, o Rerank 3.5 suporta mais de 100 idiomas, atendendo às necessidades de pesquisa de empresas globais.

Ao reordenar os resultados da pesquisa, o Rerank 3.5 pode colocar os resultados mais relevantes na frente, melhorando assim a eficiência e a satisfação do usuário na pesquisa. Ele pode ser usado não apenas para a pesquisa de texto tradicional, mas também para vários outros tipos de pesquisa, como pesquisa de imagem, pesquisa de vídeo e pesquisa de áudio.

As Principais Características do Rerank 3.5 Incluem:

  • Capacidades de Raciocínio Aprimoradas: O Rerank 3.5 possui capacidades de raciocínio aprimoradas, permitindo que ele entenda melhor consultas de usuários complexas. Ele pode analisar a semântica e o contexto da consulta, identificar com precisão a intenção do usuário e retornar os resultados mais relevantes.

  • Suporte a Dados Diversificados: O Rerank 3.5 é compatível com vários tipos de dados, incluindo documentos longos, e-mails, tabelas, JSON e código. Isso significa que ele pode lidar com dados de várias fontes diferentes e extrair informações úteis deles.

  • Suporte Multilíngue Aprimorado: O Rerank 3.5 suporta mais de 100 idiomas, incluindo os principais idiomas de negócios como inglês, árabe, chinês, francês, alemão, hindi, japonês, coreano, português, russo e espanhol. Isso permite que ele forneça serviços de pesquisa de alta qualidade para usuários em todo o mundo.

  • Maior Precisão de Pesquisa: Em testes contra dados financeiros, o Rerank 3.5 superou o Hybris Search em 23,4% e o BM25 em 30,8%. BM25 é uma função de classificação comum usada em mecanismos de busca e sistemas de recuperação de informações para determinar a relevância de um documento para uma determinada consulta de pesquisa.

Suporte de Idioma Expandido: Como o Rerank 3.5 Suporta Mais de 100 Idiomas

A capacidade multilíngue do Rerank 3.5 é evidenciada por sua capacidade de entender e processar consultas de mais de 100 idiomas. Isso significa que ele não só pode entender o sentido literal das consultas, mas também entender o contexto cultural e o ambiente por trás das consultas. Por exemplo, se um usuário pesquisar em espanhol por “mejores restaurantes en Madrid”, o Rerank 3.5 pode entender que a intenção do usuário é encontrar os melhores restaurantes em Madrid e retornar resultados de pesquisa relevantes em espanhol.

Para atingir esse objetivo, o Rerank 3.5 emprega várias técnicas, incluindo:

  • Dados de Treinamento Multilíngue: O Rerank 3.5 foi treinado em grandes quantidades de dados multilíngues, incluindo vários tipos de texto, como artigos de notícias, postagens de blog, postagens de mídia social e avaliações de produtos.
  • Incorporações Interlinguísticas: O Rerank 3.5 usa tecnologia de incorporação interlinguística para mapear palavras em diferentes idiomas para o mesmo espaço vetorial. Isso permite que o modelo entenda as relações semânticas entre diferentes idiomas e retorne resultados de pesquisa interlinguísticos relevantes.
  • Detecção e Tradução de Idiomas: O Rerank 3.5 pode detectar automaticamente o idioma da consulta do usuário e traduzi-la para inglês ou outros idiomas suportados. Isso permite que o modelo processe consultas em vários idiomas e retorne resultados de pesquisa relevantes.

Ao empregar essas técnicas, o Rerank 3.5 pode fornecer serviços de pesquisa de alta qualidade para usuários em todo o mundo, independentemente do idioma que eles usam para pesquisar.

Capacidades de Raciocínio Aprimoradas: Como o Rerank 3.5 Entende Consultas Complexas

A capacidade de raciocínio do Rerank 3.5 é demonstrada por sua capacidade de entender consultas complexas e extrair informações úteis delas. Por exemplo, se um usuário pesquisar por “quais empresas de tecnologia tiveram melhor desempenho em ações em comparação com o ano passado”, o Rerank 3.5 pode entender que a intenção do usuário é encontrar empresas de tecnologia cujas ações tiveram um desempenho melhor do que no ano passado.

Para atingir esse objetivo, o Rerank 3.5 emprega várias técnicas, incluindo:

  • Análise Semântica: O Rerank 3.5 usa tecnologia de análise semântica para analisar a estrutura semântica e o contexto das consultas. Isso permite que o modelo entenda o significado da consulta e identifique a intenção do usuário.
  • Reconhecimento de Entidades: O Rerank 3.5 usa tecnologia de reconhecimento de entidades para identificar entidades em consultas, como empresas, locais e pessoas. Isso permite que o modelo associe consultas a entidades relevantes e retorne resultados de pesquisa relevantes.
  • Extração de Relacionamentos: O Rerank 3.5 usa tecnologia de extração de relacionamentos para extrair relacionamentos entre entidades em consultas. Isso permite que o modelo entenda o significado da consulta e retorne resultados de pesquisa relevantes.

Ao empregar essas técnicas, o Rerank 3.5 pode entender consultas complexas e retornar resultados de pesquisa relevantes, melhorando assim a eficiência e a satisfação do usuário na pesquisa.

Como os Clientes OCI Podem Utilizar Esses Modelos:

Os clientes OCI podem utilizar esses modelos Cohere de várias maneiras, incluindo:

  • Integração Instantânea: Esses modelos podem ser acessados perfeitamente por meio de interfaces de bate-papo, APIs ou endpoints dedicados, sem a preocupação com o gerenciamento de infraestrutura. Isso permite que os clientes integrem facilmente esses modelos em seus próprios aplicativos sem configuração e implantação complexas.

  • Desenvolvimento de IA Simplificado: O serviço OCI Generative AI fornece um conjunto abrangente de ferramentas e serviços que podem ajudar os clientes a simplificar seus processos de desenvolvimento de IA. Essas ferramentas e serviços incluem:

    • Preparação de Dados: O serviço OCI Generative AI fornece uma variedade de ferramentas de preparação de dados que podem ajudar os clientes a limpar, transformar e preparar dados para uso no treinamento e inferência de modelos de IA.
    • Treinamento de Modelos: O serviço OCI Generative AI fornece uma variedade de ferramentas de treinamento de modelos que podem ajudar os clientes a treinar seus próprios modelos de IA. Essas ferramentas suportam vários tipos e estruturas de modelos diferentes, como TensorFlow, PyTorch e Scikit-learn.
    • Implantação de Modelos: O serviço OCI Generative AI fornece uma variedade de ferramentas de implantação de modelos que podem ajudar os clientes a implantar modelos de IA treinados em ambientes de produção.
    • Monitoramento de Modelos: O serviço OCI Generative AI fornece uma variedade de ferramentas de monitoramento de modelos que podem ajudar os clientes a monitorar o desempenho e a precisão dos modelos de IA.
  • Fluxos de Trabalho RAG Simplificados: Utilize o Command A para gerar conteúdo e otimize os resultados aprimorados por meio do Rerank 3.5, tornando os fluxos de trabalho RAG complexos mais eficientes e simplificados.

A Diversidade de Cenários de Aplicação:

Esses modelos podem ser aplicados a uma variedade de cenários de aplicação empresarial diferentes, incluindo:

  • Atendimento ao Cliente: Command A e Rerank 3.5 podem ser usados para construir chatbots de atendimento ao cliente inteligentes que podem responder às perguntas dos clientes, resolver suas preocupações e fornecer serviços personalizados.
  • Geração de Conteúdo: Command A pode ser usado para gerar vários tipos de conteúdo de texto, como artigos de notícias, postagens de blog, descrições de produtos e postagens de mídia social.
  • Pesquisa: Rerank 3.5 pode ser usado para melhorar a precisão e a eficiência da pesquisa empresarial, ajudando os usuários a encontrar rapidamente as informações de que precisam.
  • Análise de Dados: Command A e Rerank 3.5 podem ser usados para analisar vários tipos de dados, extrair informações úteis deles e ajudar as empresas a tomar melhores decisões.
  • Gestão de Conhecimento: É possível construir bases de conhecimento inteligentes para que os funcionários encontrem rapidamente as informações de que precisam, melhorando a eficiência do trabalho.

Ao fornecer modelos de IA de alto desempenho, multifuncionais e escaláveis, o serviço OCI Generative AI capacita as empresas a construir várias soluções de IA inovadoras, melhorando assim suas vantagens competitivas e valor de negócios.

Para obter detalhes de integração e informações de preços, consulte a documentação do serviço Generative AI ou entre em contato com seu representante Oracle.