Muon и Moonlight обучение моделей
Moonshot AI представляет Muon оптимизатор и модель Moonlight обеспечивая эффективное обучение больших языковых моделей с меньшими затратами
Moonshot AI представляет Muon оптимизатор и модель Moonlight обеспечивая эффективное обучение больших языковых моделей с меньшими затратами
Moonshot AI Kimi представляет Moonlight гибридную модель экспертов MoE с 30 и 160 миллиардами параметров обученную на архитектуре Muon с 57 триллионами токенов для повышения эффективности и снижения FLOPs.
Модель Kimi k1.5 от Moonshot AI достигла уровня производительности, сравнимого с OpenAI o1, особенно в математике, кодировании и мультимодальном мышлении. Она превосходит GPT-4o и Claude 3.5 Sonnet в режиме короткой цепочки рассуждений. Moonshot AI открыто делится техническими деталями, способствуя развитию ИИ.