Muon dan Moonlight Latih Model Besar Efisien
Penyelidik Moonshot AI perkenal Muon dan Moonlight optimumkan model bahasa besar dengan teknik latihan cekap jimat kos dan masa
Penyelidik Moonshot AI perkenal Muon dan Moonlight optimumkan model bahasa besar dengan teknik latihan cekap jimat kos dan masa
Kimi Moonshot AI memperkenalkan model pakar hibrid 'Moonlight' 30 bilion dan 160 bilion parameter dilatih pada seni bina Muon dengan 57 trilion token mencapai kecekapan Pareto yang unggul dan mengurangkan FLOPs.
Model Kimi k1.5 dari Moonshot AI telah mencapai prestasi yang setanding dengan OpenAI o1, menandakan kemajuan besar dalam AI. Model ini unggul dalam matematik, pengekodan, dan penaakulan multimodal, malah melebihi prestasi model lain dalam beberapa aspek. Dengan pendekatan pembelajaran pengukuhan yang inovatif, Kimi k1.5 menetapkan standard baharu dalam pembangunan AI.