Muon и Moonlight нови ИИ техники
Изследователи от Moonshot AI представят Muon и Moonlight оптимизиращи мащабни езикови модели с ефективни техники за обучение намаляващи изчислителните разходи и подобряващи производителността
Изследователи от Moonshot AI представят Muon и Moonlight оптимизиращи мащабни езикови модели с ефективни техники за обучение намаляващи изчислителните разходи и подобряващи производителността
Kimi на Moonshot AI разкрива „Moonlight“ хибриден експертен модел с 30 милиарда и 160 милиарда параметъра обучен с Muon Той постига превъзходна производителност и ефективност използвайки 57 трилиона токена.
Моделът Kimi k1.5 на Moonshot AI постига производителност, сравнима с OpenAI o1, особено в области като математика, кодиране и мултимодално разсъждение. Kimi-k1.5-short превъзхожда GPT-4o и Claude 3.5 Sonnet с 550% в кратки вериги на мисълта. Moonshot AI споделя техническия си доклад, насърчавайки сътрудничеството в AI общността.