Oracle Cloud Infrastructure (OCI) Generative AI ha recibido una serie de importantes mejoras, incluyendo la presentación de los modelos Cohere Command A y Rerank 3.5, así como la introducción de Cohere Embed 3 con soporte multimodal. Estos nuevos modelos están diseñados para proporcionar a los clientes de OCI capacidades de IA de nivel empresarial más potentes y mejorar aún más su capacidad para aplicar la IA en diversos casos de uso.
Command A: El pináculo del rendimiento y la eficiencia
Cohere Command A 03-2025 es actualmente el modelo Command más potente, con un rendimiento 150% superior al de la generación anterior, al tiempo que sólo requiere dos GPU. Según los datos facilitados por Cohere, este modelo rinde al mismo nivel o incluso supera a OpenAI 4o y DeepSeekv3 en tareas empresariales basadas en agentes, además de ofrecer una mejora significativa en la eficiencia computacional.
El extraordinario rendimiento de Command A se debe a su avanzado diseño de arquitectura y métodos de entrenamiento, que le permiten rendir de forma excepcional en una variedad de complejas aplicaciones de IA de nivel empresarial. Tanto si se trata de procesar grandes cantidades de datos como de ejecutar complejas tareas de razonamiento o de realizar procesamiento del lenguaje natural en tiempo real, Command A proporciona una solución eficiente y fiable.
Las características principales de Command A incluyen:
Ventana de contexto ultralarga: Admite longitudes de contexto de hasta 256k tokens, lo que permite al modelo procesar secuencias de texto más largas, comprendiendo mejor la información contextual y generando respuestas más precisas y coherentes. Esto significa que Command A puede manejar documentos complejos, largas conversaciones e interacciones de múltiples turnos sin perder información clave.
Generación aumentada de recuperación avanzada (RAG): Mediante la integración de tecnologías de generación aumentada de recuperación, Command A puede recuperar información relevante de grandes cantidades de datos e integrarla en el contenido generado, mejorando así la calidad y precisión de los resultados generados. Esta tecnología no sólo reduce la dependencia del modelo del conocimiento externo, sino que también le permite adaptarse mejor a entornos de información en constante cambio.
Uso de herramientas de agente nativas: Command A cuenta con capacidades nativas de uso de herramientas de agente, que pueden integrarse con otras herramientas y servicios para implementar funciones más complejas. Por ejemplo, puede interactuar con motores de búsqueda, bases de datos, API, etc. para obtener la información necesaria o realizar operaciones específicas. Esta capacidad permite a Command A realizar diversas tareas complejas, como la automatización del servicio de atención al cliente, los asistentes inteligentes y el análisis de datos.
Seguridad y privacidad de nivel empresarial: Command A se ha diseñado teniendo plenamente en cuenta las necesidades de seguridad y privacidad de las empresas, y adopta diversas medidas de seguridad para proteger los datos de los clientes. Por ejemplo, admite cifrado de datos, control de acceso y funciones de auditoría para garantizar que los datos de los clientes no sean objeto de accesos no autorizados o filtraciones.
Potentes capacidades multilingües: Command A ha sido entrenado en 23 idiomas, entre ellos inglés, francés, español, italiano, alemán, portugués, japonés, coreano, árabe, chino, ruso, polaco, turco, vietnamita, neerlandés, checo, indonesio, ucraniano, rumano, griego, hindi, hebreo y persa. Esto le permite procesar texto en varios idiomas y prestar servicio a usuarios de todo el mundo.
Entrada y salida de texto: Command A sólo admite actualmente la entrada y salida de texto, lo que significa que se utiliza principalmente para procesar tareas relacionadas con el texto, como la creación de texto, el resumen de texto, la traducción de texto y la clasificación de texto.
Nota: El modelo Command A no admite actualmente el ajuste fino.
Rerank 3.5: Mejora de la precisión de la búsqueda empresarial
Rerank 3.5 es el modelo básico de búsqueda de IA más reciente de Cohere, diseñado para mejorar la precisión de la búsqueda empresarial y los sistemas de generación aumentada de recuperación (RAG). Este modelo cuenta con capacidades de razonamiento mejoradas, es capaz de comprender consultas de usuario complejas y es compatible con varios tipos de datos (incluidos documentos largos, correos electrónicos, hojas de cálculo, JSON y código). Además, Rerank 3.5 admite más de 100 idiomas, lo que le permite satisfacer las necesidades de búsqueda de las empresas de todo el mundo.
Rerank 3.5 mejora la eficiencia y la satisfacción del usuario en la búsqueda al reordenar los resultados de la búsqueda, de modo que los resultados más relevantes aparezcan en la parte superior. No sólo puede utilizarse para la búsqueda de texto tradicional, sino también para otros tipos de búsqueda, como la búsqueda de imágenes, la búsqueda de vídeos y la búsqueda de audio.
Las características principales de Rerank 3.5 incluyen:
Capacidades de razonamiento mejoradas: Rerank 3.5 cuenta con capacidades de razonamiento mejoradas que le permiten comprender mejor las consultas de usuario complejas. Puede analizar la semántica y el contexto de una consulta e identificar con precisión la intención del usuario, devolviendo los resultados más relevantes.
Soporte diverso de datos: Rerank 3.5 es compatible con varios tipos de datos, incluidos documentos largos, correos electrónicos, hojas de cálculo, JSON y código. Esto significa que puede procesar datos de diversas fuentes y extraer información útil de ellos.
Soporte multilingüe mejorado: Rerank 3.5 admite más de 100 idiomas, incluidos los principales idiomas empresariales, como inglés, árabe, chino, francés, alemán, hindi, japonés, coreano, portugués, ruso y español. Esto le permite prestar servicios de búsqueda de alta calidad a usuarios de todo el mundo.
Mayor precisión de la búsqueda: En pruebas sobre datos financieros, Rerank 3.5 superó a Hybris Search en un 23,4% y a BM25 en un 30,8%. BM25 es una función de clasificación utilizada habitualmente en motores de búsqueda y sistemas de recuperación de información para determinar la relevancia de un documento con respecto a una consulta de búsqueda dada.
Soporte lingüístico ampliado: Cómo soporta Rerank 3.5 más de 100 idiomas
La capacidad multilingüe de Rerank 3.5 se refleja en su capacidad para comprender y procesar consultas de más de 100 idiomas. Esto significa que no sólo puede comprender el significado literal de una consulta, sino también el contexto cultural y el trasfondo que subyace a la consulta. Por ejemplo, si un usuario busca en español "mejores restaurantes en Madrid", Rerank 3.5 puede comprender que la intención del usuario es encontrar los mejores restaurantes de Madrid y devolver resultados de búsqueda relevantes en español.
Para lograr este objetivo, Rerank 3.5 emplea una serie de tecnologías, entre ellas:
- Datos de entrenamiento multilingües: Rerank 3.5 ha sido entrenado con una gran cantidad de datos multilingües, que incluyen varios tipos de texto, como artículos de noticias, entradas de blogs, publicaciones en redes sociales y reseñas de productos.
- Incrustaciones interlingüísticas: Rerank 3.5 utiliza la tecnología de incrustaciones interlingüísticas para mapear palabras de diferentes idiomas en el mismo espacio vectorial. Esto permite al modelo comprender las relaciones semánticas entre diferentes idiomas y devolver resultados de búsqueda interlingüísticos relevantes.
- Detección y traducción de idiomas: Rerank 3.5 puede detectar automáticamente el idioma de la consulta de un usuario y traducirla al inglés u otros idiomas admitidos. Esto permite al modelo procesar consultas en una variedad de idiomas y devolver resultados de búsqueda relevantes.
Mediante el empleo de estas tecnologías, Rerank 3.5 puede prestar servicios de búsqueda de alta calidad a usuarios de todo el mundo, independientemente del idioma que utilicen para buscar.
Capacidades de razonamiento mejoradas: Cómo comprende Rerank 3.5 las consultas complejas
La capacidad de razonamiento de Rerank 3.5 se manifiesta en su capacidad para comprender consultas complejas y extraer información útil de ellas. Por ejemplo, si un usuario busca "qué empresas tecnológicas tienen un mejor rendimiento de sus acciones en comparación con el año pasado", Rerank 3.5 puede comprender que la intención del usuario es buscar empresas tecnológicas cuyas acciones tengan un mejor rendimiento que el año pasado.
Para lograr este objetivo, Rerank 3.5 emplea una serie de tecnologías, entre ellas:
- Análisis semántico: Rerank 3.5 utiliza técnicas de análisis semántico para analizar la estructura semántica y el contexto de una consulta. Esto permite al modelo comprender el significado de la consulta e identificar la intención del usuario.
- Reconocimiento de entidades: Rerank 3.5 utiliza técnicas de reconocimiento de entidades para identificar entidades en una consulta, como empresas, lugares y personas. Esto permite al modelo relacionar la consulta con entidades relevantes y devolver resultados de búsqueda relevantes.
- Extracción de relaciones: Rerank 3.5 utiliza técnicas de extracción de relaciones para extraer relaciones entre entidades en una consulta. Esto permite al modelo comprender el significado de la consulta y devolver resultados de búsqueda relevantes.
Mediante el empleo de estas técnicas, Rerank 3.5 puede comprender consultas complejas y devolver resultados de búsqueda relevantes, mejorando así la eficiencia y la satisfacción del usuario en la búsqueda.
Cómo pueden los clientes de OCI aprovechar estos modelos:
Los clientes de OCI pueden aprovechar estos modelos de Cohere de varias maneras, entre ellas:
Integración instantánea: Se puede acceder a estos modelos sin problemas a través de una interfaz de chat, una API o un punto final dedicado, sin tener que preocuparse por la gestión de la infraestructura. Esto permite a los clientes integrar fácilmente estos modelos en sus propias aplicaciones sin necesidad de complejas configuraciones y despliegues.
Desarrollo de IA simplificado: OCI Generative AI proporciona un conjunto completo de herramientas y servicios que pueden ayudar a los clientes a simplificar los flujos de trabajo de desarrollo de IA. Estas herramientas y servicios incluyen:
- Preparación de datos: OCI Generative AI proporciona una serie de herramientas de preparación de datos que pueden ayudar a los clientes a limpiar, transformar y preparar los datos para su uso en el entrenamiento y la inferencia de modelos de IA.
- Entrenamiento de modelos: OCI Generative AI proporciona una serie de herramientas de entrenamiento de modelos que pueden ayudar a los clientes a entrenar sus propios modelos de IA. Estas herramientas admiten una amplia variedad de tipos y marcos de modelos, como TensorFlow, PyTorch y Scikit-learn.
- Despliegue de modelos: OCI Generative AI proporciona una serie de herramientas de despliegue de modelos que pueden ayudar a los clientes a desplegar modelos de IA entrenados en entornos de producción.
- Monitorización de modelos: OCI Generative AI proporciona una serie de herramientas de monitorización de modelos que pueden ayudar a los clientes a monitorizar el rendimiento y la precisión de los modelos de IA.
Flujos de trabajo RAG simplificados: Utilice Command A para generar contenido y optimice los resultados mejorados a través de Rerank 3.5, haciendo que los complejos flujos de RAG sean más eficientes y sencillos.
Diversidad de escenarios de aplicación:
Estos modelos pueden aplicarse a una amplia variedad de escenarios de aplicación empresarial, entre ellos:
- Atención al cliente: Command A y Rerank 3.5 pueden utilizarse para construir chatbots inteligentes de atención al cliente que puedan responder a las preguntas de los clientes, resolver sus dudas y proporcionar un servicio personalizado.
- Generación de contenidos: Command A puede utilizarse para generar varios tipos de contenido textual, como artículos de noticias, entradas de blogs, descripciones de productos y publicaciones en redes sociales.
- Búsqueda: Rerank 3.5 puede utilizarse para mejorar la precisión y la eficiencia de la búsqueda empresarial, ayudando a los usuarios a encontrar rápidamente la información que necesitan.
- Análisis de datos: Command A y Rerank 3.5 pueden utilizarse para analizar varios tipos de datos, extraer información útil de ellos y ayudar a las empresas a tomar mejores decisiones.
- Gestión del conocimiento: Puede construir una base de conocimientos inteligente donde los empleados puedan encontrar rápidamente la información que necesitan y mejorar la eficiencia de sus trabajos.
OCI Generative AI, al proporcionar modelos de IA de alto rendimiento, multifuncionales y escalables, permite a las empresas construir diversas soluciones innovadoras de IA, mejorando así su competitividad y su valor empresarial.
Para obtener detalles sobre la integración y la información sobre los precios, consulte nuestra documentación de Generative AI Services o póngase en contacto con su representante de Oracle.