StepFun: Estrela Ascendente da IA na China
A StepFun, empresa de IA em Xangai, destaca-se com modelos avançados que processam texto, vídeo e imagens, liderando a inovação em IA na China.
A StepFun, empresa de IA em Xangai, destaca-se com modelos avançados que processam texto, vídeo e imagens, liderando a inovação em IA na China.
Step1X-Edit é um modelo open-source para edição de imagens com performance SOTA. Com 19 bilhões de parâmetros, destaca-se na análise semântica, preservação de identidade e controle regional, suportando 11 tarefas de edição.
Este artigo explora o Multi-matrix Factorization Attention (MFA), um mecanismo de atenção inovador que reduz significativamente o uso do cache KV em modelos de linguagem grandes (LLMs), melhorando a eficiência sem comprometer o desempenho. O MFA supera o MLA e iguala o MHA, com economias de memória de até 93,7%. Descubra como o MFA, com seu design simples e compatibilidade, está revolucionando a inferência de LLMs.