Tag: Stepfun

StepFun: Изгряващата AI звезда на Китай

StepFun, AI компания от Шанхай, бързо набира признание. Тя разработва AI модели, обработващи текст, видео и изображения, позиционирайки се в челните редици на AI иновациите.

StepFun: Изгряващата AI звезда на Китай

Step1X-Edit: Нов модел за редакция на изображения

Step1X-Edit е отворен модел за редактиране на изображения, постигащ водеща производителност. Моделът поддържа 11 вида задачи за редактиране и предлага прецизен семантичен анализ, запазване на идентичността и регионален контрол.

Step1X-Edit: Нов модел за редакция на изображения

Нов механизъм за внимание намалява KV кеша

В статията се представя нов механизъм за внимание, наречен Multi-matrix Factorization Attention (MFA), който значително намалява потреблението на памет при извод на големи езикови модели (LLM). MFA превъзхожда MLA по производителност и се доближава до MHA, като същевременно намалява използването на KV кеша до 93.7%. Механизмът е проектиран за простота, лесна възпроизводимост и съвместимост с различни методи за позиционно вграждане. Изследването анализира общия дизайн на механизмите за внимание и идентифицира ключови измерения, свързани с капацитета. MFA постига по-високи стойности на TER и SLSD в сравнение с MQA и MLA. Експерименталните резултати показват, че MFA поддържа отлична производителност дори при по-големи мащаби, като същевременно осигурява значителни икономии на памет.

Нов механизъм за внимание намалява KV кеша