Tag: Fine-Tuning

Sarvam AI: Nuevo LLM Desafía a Meta y Google

Sarvam AI lanza Sarvam-M, un LLM multilingüe que rivaliza con los modelos de Meta y Google, impulsado por la IndiaAI Mission y el modelo Mistral Small.

Sarvam AI: Nuevo LLM Desafía a Meta y Google

A.X 4.0 de SK Telecom: Análisis Profundo

SK Telecom lanza A.X 4.0, un modelo de lenguaje adaptado al coreano. Exploramos su arquitectura, rendimiento y planes futuros para este LLM.

A.X 4.0 de SK Telecom: Análisis Profundo

DMind-1: Modelo de lenguaje abierto para Web3

DMind presenta DMind-1, un modelo de lenguaje grande (LLM) de código abierto diseñado para Web3. Optimizado desde Qwen3-32B de Alibaba, logra un rendimiento de vanguardia en blockchain, DeFi, NFTs y más, con bajo costo de inferencia.

DMind-1: Modelo de lenguaje abierto para Web3

Alibaba: 90% menos costos IA con ZEROSEARCH

Alibaba reduce drásticamente los costos de entrenamiento de IA con ZEROSEARCH, simulando búsquedas sin APIs reales, mejorando calidad y eficiencia.

Alibaba: 90% menos costos IA con ZEROSEARCH

Avance IA desafía a DeepSeek 2.0

Un fondo quant de Shanghái afirma haber logrado un avance en el entrenamiento de IA que podría superar a DeepSeek 2.0.

Avance IA desafía a DeepSeek 2.0

Mistral Medium 3: IA a medida para empresas

Mistral Medium 3 ofrece rendimiento robusto, costo-efectividad y opciones de despliegue flexibles, ideal para soluciones de IA personalizadas para empresas.

Mistral Medium 3: IA a medida para empresas

Innovaciones de NVIDIA: Llama Nemotron Ultra y Parakeet

Joey Conway de NVIDIA revela Llama Nemotron Ultra y Parakeet, impulsando la IA con modelos de lenguaje grandes de código abierto y reconocimiento de voz.

Innovaciones de NVIDIA: Llama Nemotron Ultra y Parakeet

El Triunfo del RL con Phi-4 Reasoning Plus de Microsoft

El modelo Phi-4 Reasoning Plus de Microsoft demuestra el poder del aprendizaje por refuerzo, superando a modelos más grandes en pruebas de razonamiento complejo.

El Triunfo del RL con Phi-4 Reasoning Plus de Microsoft

Gemma de Google: Un Análisis Profundo

Gemma de Google alcanza 150 millones de descargas. Análisis de su popularidad, capacidades, y comparación con Llama de Meta.

Gemma de Google: Un Análisis Profundo

Nemotron-Tool-N1: Aprendizaje Reforzado para LLMs

Nemotron-Tool-N1 usa RL para potenciar el uso de herramientas en LLMs, superando las limitaciones del ajuste supervisado tradicional y mejorando la generalización.

Nemotron-Tool-N1: Aprendizaje Reforzado para LLMs