Sarvam AI: Nuevo LLM Desafía a Meta y Google
Sarvam AI lanza Sarvam-M, un LLM multilingüe que rivaliza con los modelos de Meta y Google, impulsado por la IndiaAI Mission y el modelo Mistral Small.
Sarvam AI lanza Sarvam-M, un LLM multilingüe que rivaliza con los modelos de Meta y Google, impulsado por la IndiaAI Mission y el modelo Mistral Small.
SK Telecom lanza A.X 4.0, un modelo de lenguaje adaptado al coreano. Exploramos su arquitectura, rendimiento y planes futuros para este LLM.
DMind presenta DMind-1, un modelo de lenguaje grande (LLM) de código abierto diseñado para Web3. Optimizado desde Qwen3-32B de Alibaba, logra un rendimiento de vanguardia en blockchain, DeFi, NFTs y más, con bajo costo de inferencia.
Alibaba reduce drásticamente los costos de entrenamiento de IA con ZEROSEARCH, simulando búsquedas sin APIs reales, mejorando calidad y eficiencia.
Un fondo quant de Shanghái afirma haber logrado un avance en el entrenamiento de IA que podría superar a DeepSeek 2.0.
Mistral Medium 3 ofrece rendimiento robusto, costo-efectividad y opciones de despliegue flexibles, ideal para soluciones de IA personalizadas para empresas.
Joey Conway de NVIDIA revela Llama Nemotron Ultra y Parakeet, impulsando la IA con modelos de lenguaje grandes de código abierto y reconocimiento de voz.
El modelo Phi-4 Reasoning Plus de Microsoft demuestra el poder del aprendizaje por refuerzo, superando a modelos más grandes en pruebas de razonamiento complejo.
Gemma de Google alcanza 150 millones de descargas. Análisis de su popularidad, capacidades, y comparación con Llama de Meta.
Nemotron-Tool-N1 usa RL para potenciar el uso de herramientas en LLMs, superando las limitaciones del ajuste supervisado tradicional y mejorando la generalización.