IA: Google Salud, xAI y Mistral

El mundo de la Inteligencia Artificial está en constante cambio, con avances y movimientos estratégicos que moldean el futuro de diversas industrias. Profundicemos en algunos de los desarrollos más recientes e impactantes, centrándonos en los avances de Google en IA para el cuidado de la salud, la adquisición de una startup de video de IA generativa por parte de xAI y el lanzamiento de un modelo de IA potente pero compacto por parte de Mistral AI.

Avances de Google en IA para la Salud

Google reveló recientemente un conjunto de actualizaciones de Health AI en su evento anual ‘The Check Up’, mostrando el compromiso de la compañía de aprovechar la IA para diversas aplicaciones de atención médica. Estas actualizaciones abarcan desde la mejora de las consultas relacionadas con la salud en Google Search hasta la introducción de nuevos modelos de IA ‘abiertos’ diseñados para impulsar la eficiencia del descubrimiento de fármacos impulsado por IA.

Google está implementando IA y sofisticados sistemas de calidad y clasificación para ampliar el alcance de las respuestas del ‘panel de conocimiento’ para una amplia gama de temas relacionados con la salud. Esta expansión incluye la adición de soporte para consultas de atención médica en varios idiomas, como español, portugués y japonés, inicialmente en plataformas móviles. Si bien Search ya proporcionaba respuestas del panel de conocimiento para problemas de salud comunes como la influenza o el resfriado común, esta actualización amplía significativamente la variedad de temas que abarcan estos paneles.

Más allá de esto, Google presenta una nueva función en Search llamada ‘What People Suggest’. Esta función está diseñada para presentar a los usuarios información derivada de personas que han compartido experiencias médicas similares. Esta adición ofrece una vía única para que los usuarios obtengan información. Permite a los usuarios descubrir rápidamente perspectivas auténticas de otras personas con la misma condición, con enlaces para una mayor exploración. ‘What People Suggest’ está actualmente accesible en dispositivos móviles dentro de los Estados Unidos.

Simplificación de Registros Médicos con Nuevas API

Google también ha lanzado a nivel mundial nuevas interfaces de programación de aplicaciones (API) de registros médicos para su plataforma Health Connect, compatible con dispositivos Android. Estas API permiten que las aplicaciones lean y escriban datos de registros médicos, incluidas alergias, medicamentos, vacunas y resultados de laboratorio, todo en el formato estandarizado FHIR. Estas mejoras llevan el soporte de Health Connect a más de 50 tipos de datos, que abarcan actividad, sueño, nutrición, signos vitales y ahora registros médicos. Esta integración facilita una conexión perfecta entre los datos de salud diarios de los usuarios y la información de sus proveedores de atención médica.

El Co-Científico de IA: Un Socio de Investigación Virtual

Una innovación revolucionaria de Google es el ‘co-científico de IA’, un nuevo sistema respaldado por Gemini 2.0. Este sistema se concibe como un ‘colaborador científico virtual’ para investigadores y científicos. El co-científico de IA está diseñado para ayudar a los investigadores a navegar por la extensa literatura científica, facilitando así la generación de nuevas hipótesis. Al ayudar en el análisis de vastos conjuntos de datos y documentos de investigación complejos, el co-científico de IA tiene como objetivo capacitar a los expertos para descubrir nuevas ideas y acelerar sus esfuerzos de investigación. Google está colaborando activamente con instituciones como Imperial College London, Houston Methodist y Stanford University para explorar las aplicaciones prácticas de esta herramienta y tiene la intención de iniciar un programa de probadores de confianza.

TxGemma: Acelerando el Descubrimiento de Fármacos

Google también presentó TxGemma, una compilación de modelos abiertos basados en Gemma destinados a mejorar la eficiencia del descubrimiento de fármacos impulsado por IA. TxGemma posee la capacidad de comprender tanto el texto estándar como las estructuras de diversas entidades terapéuticas, incluidas pequeñas moléculas, productos químicos y proteínas. El lanzamiento de TxGemma está programado para un futuro cercano.

Herramienta de IA Capricorn: Avance en Oncología Pediátrica

En colaboración con el Princess Maxima Center for Pediatric Oncology en los Países Bajos, Google ha estado desarrollando una herramienta de IA llamada Capricorn. Esta herramienta subraya la dedicación de Google a la aplicación de la IA a campos médicos especializados, particularmente en oncología pediátrica.

El Impacto Más Amplio de la IA en la Atención Médica

Google ha destacado anteriormente la influencia positiva de la IA en los resultados de salud global. La compañía ha desarrollado modelos de IA para ayudar en la detección de enfermedades como el cáncer de mama, el cáncer de pulmón y la retinopatía diabética. En mayo de 2024, Google anunció Med-Gemini, una familia de modelos Gemini optimizados para aplicaciones médicas multimodales. Además, en junio de 2024, Google presentó el Personal Health Large Language Model para dispositivos móviles y portátiles. Esta versión optimizada de Gemini está diseñada para interpretar datos de sensores y proporcionar información y recomendaciones personalizadas sobre los patrones de sueño y estado físico de una persona.

La Adquisición de Hotshot por parte de xAI: Un Movimiento hacia el Video de IA Generativa

La empresa de IA de Elon Musk, xAI, ha adquirido Hotshot, una startup especializada en herramientas de generación de video impulsadas por IA. Esta adquisición posiciona a xAI para competir con Sora de OpenAI, una plataforma líder en el espacio de video de IA generativa. Hotshot anunció en su sitio web que comenzó a eliminar gradualmente la creación de nuevos videos el 14 de marzo, y los clientes existentes tienen hasta el 30 de marzo para descargar sus videos creados.

Grok 3: El Ambicioso Chatbot de IA de xAI

El 19 de febrero, xAI presentó Grok 3, la última iteración de su chatbot, que Elon Musk proclamó como ‘la IA más inteligente de la Tierra’. Posteriormente, la compañía anunció el lanzamiento beta de dos modelos de razonamiento, Grok 3 (Think) y Grok 3 Mini (Think). xAI declaró que Grok 3, entrenado en su supercluster Colossus con diez veces la potencia computacional de los modelos de vanguardia anteriores, exhibe mejoras sustanciales en tareas de razonamiento, matemáticas, codificación, conocimiento mundial y seguimiento de instrucciones.

Mistral Small 3.1 de Mistral AI: Compacto y Potente

La startup francesa de IA Mistral AI presentó un nuevo modelo de código abierto el 17 de marzo, llamado Mistral Small 3.1. La compañía afirma que este modelo supera a modelos comparables como Gemma 3 de Google y GPT-4o Mini de OpenAI, intensificando así la competencia en un mercado dominado en gran medida por los gigantes tecnológicos estadounidenses.

Mistral Small 3.1 procesa texto e imágenes con 24 mil millones de parámetros, un tamaño significativamente menor en comparación con los modelos propietarios líderes, al tiempo que iguala o supera su rendimiento. Mistral AI enfatizó que Mistral Small 3.1 es el primer modelo de código abierto que no solo cumple sino que supera el rendimiento de los principales modelos pequeños propietarios en varias dimensiones.

Basado en Mistral Small 3, este nuevo modelo cuenta con un rendimiento de texto mejorado, comprensión multimodal y una ventana de contexto ampliada de hasta 128,000 tokens. Mistral AI afirma que el modelo procesa información a velocidades de 150 tokens por segundo, lo que lo hace adecuado para aplicaciones que exigen tiempos de respuesta rápidos.

Versatilidad y Accesibilidad de Mistral Small 3.1

Mistral Small 3.1 está diseñado para ejecutarse en hardware tan accesible como una sola RTX 4090 o una Mac con 32 GB de RAM, lo que lo hace muy adecuado para aplicaciones en el dispositivo. El modelo se puede ajustar para dominios especializados, lo que permite la creación de expertos en la materia de alta precisión, particularmente útil en campos como el asesoramiento legal, el diagnóstico médico y el soporte técnico.

El nuevo modelo está diseñado para un amplio espectro de aplicaciones empresariales y de consumo que requieren comprensión multimodal. Los casos de uso potenciales incluyen verificación de documentos, diagnósticos, procesamiento de imágenes en el dispositivo, inspecciones visuales para control de calidad, detección de objetos en sistemas de seguridad, soporte al cliente basado en imágenes y asistencia de propósito general.

Mistral OCR: Comprensión Avanzada de Documentos

A principios de marzo, Mistral AI anunció Mistral OCR, que la compañía promociona como la ‘Mejor API de comprensión de documentos del mundo’. Mistral OCR es una API de Reconocimiento Óptico de Caracteres (OCR) capaz de extraer texto, tablas, ecuaciones e imágenes de documentos complejos. Mistral AI cree que esta tecnología revolucionará la forma en que las organizaciones procesan y utilizan vastos repositorios de información.

Según la compañía, Mistral OCR procesa hasta 2000 páginas por minuto, admite capacidades multilingües y multimodales, y ofrece resultados estructurados como JSON para una integración perfecta en los flujos de trabajo de IA. Las pruebas internas indican que Mistral OCR lidera el mercado en precisión de extracción de texto, especialmente para documentos escaneados, contenido matemático y texto multilingüe. A diferencia de las soluciones de OCR tradicionales, también extrae imágenes incrustadas, lo que lo hace ideal para la investigación científica, las presentaciones regulatorias y la digitalización de documentos históricos.

Mistral AI informa que OCR ya está ayudando a empresas e instituciones de investigación a digitalizar literatura, agilizar el servicio al cliente y preservar archivos históricos. Además, OCR está ayudando a las empresas a convertir literatura técnica, dibujos de ingeniería, notas de conferencias, presentaciones, presentaciones regulatorias y más en formatos indexados y listos para responder. Las capacidades de Mistral OCR están disponibles para prueba gratuita en le Chat, y la compañía anticipa nuevas mejoras al modelo en las próximas semanas. Estos desarrollos en curso reflejan la naturaleza dinámica de la IA y su potencial para remodelar diversas industrias.