Muon e Moonlight Training LLM Efficiente
Ricercatori di Moonshot AI presentano Muon e Moonlight ottimizzando modelli linguistici su larga scala con tecniche di addestramento efficienti. Muon un nuovo ottimizzatore e Moonlight un modello MoE.
Ricercatori di Moonshot AI presentano Muon e Moonlight ottimizzando modelli linguistici su larga scala con tecniche di addestramento efficienti. Muon un nuovo ottimizzatore e Moonlight un modello MoE.
Kimi di Moonshot AI svela Moonlight modello ibrido di esperti MoE con 30 e 160 miliardi di parametri addestrato su 57 trilioni di token Muon offre efficienza Pareto superiore.
Moonshot AI ha presentato Kimi k1.5, un modello multimodale che rivaleggia con OpenAI o1, superando GPT-4o e Claude 3.5 Sonnet in alcune aree. Questo risultato segna un passo avanti nell'intelligenza artificiale, con un approccio trasparente e collaborativo.