Tag: LLM

De Tigres IA a Gatitos: China Reduce Ambiciones

Startups chinas de IA, antes 'tigres', ahora se repliegan a nichos de mercado tras el 'shock' de DeepSeek y los altos costos de competir en modelos de lenguaje grandes (LLM). Se enfocan en SaaS B2B, salud y mercados extranjeros, buscando supervivencia.

De Tigres IA a Gatitos: China Reduce Ambiciones

Modelo IA de 1-Bit de Microsoft: Eficiencia Energética

Microsoft revela BitNet, un modelo de lenguaje de 1-bit que redefine la eficiencia, operando en CPUs tradicionales y democratizando el acceso a la IA.

Modelo IA de 1-Bit de Microsoft: Eficiencia Energética

Apuesta de MiniMax por Atención Lineal

Conversación con Zhong Yiran sobre MiniMax-01 y su apuesta por la atención lineal en modelos grandes.

Apuesta de MiniMax por Atención Lineal

SISTA AI: Impulsando Startups IA Lideradas por Mujeres

SISTA y AWS lanzan SISTA AI, un programa para potenciar startups de IA lideradas por mujeres en Europa. Ofrece recursos, financiación y mentoría para fomentar la diversidad y la innovación en el sector tecnológico.

SISTA AI: Impulsando Startups IA Lideradas por Mujeres

Modelos IA Pequeños: Auge Empresarial

El análisis de Gartner indica un cambio hacia modelos IA más pequeños y enfocados, usados tres veces más que los LLM generales. Esto optimiza recursos y reduce costos operativos, impulsado por la precisión y la eficiencia.

Modelos IA Pequeños: Auge Empresarial

Titanes Ocultos de la IA China: Más allá de DeepSeek

Más allá del auge de DeepSeek, un grupo de empresas está silenciosamente dando forma al panorama de la IA en China. Estas son las 'Seis Tigres', que impulsan la revolución de la IA en el país, desafiando a Occidente.

Titanes Ocultos de la IA China: Más allá de DeepSeek

Renacimiento Agentes IA: MCP, A2A y UnifAI

MCP, A2A y UnifAI convergen para crear infraestructura interactiva de Agentes IA. ¿Será el amanecer de una segunda primavera para los Agentes IA on-chain?

Renacimiento Agentes IA: MCP, A2A y UnifAI

DeepSeek: IA china y el rol de Nvidia

Informe revela riesgos de DeepSeek, IA china, para seguridad de EE. UU. Expone su manejo de datos y rol de Nvidia en facilitar esta amenaza.

DeepSeek: IA china y el rol de Nvidia

EE. UU. evalúa restringir acceso a DeepSeek

EE. UU. considera restringir el acceso de DeepSeek a tecnología americana, incluyendo chips de Nvidia, por preocupaciones de seguridad y avances militares chinos en IA.

EE. UU. evalúa restringir acceso a DeepSeek

Modelos Multimodales de Contexto Extendido

La plataforma National Supercomputing Internet lanza modelos multimodales de contexto extendido, MiniMax-Text-01 y MiniMax-VL-01, revolucionando el desarrollo de agentes de IA con mayor 'memoria' y capacidad de procesamiento.

Modelos Multimodales de Contexto Extendido