StepFun: L'Étoile Montante de l'IA Chinoise
StepFun, une entreprise chinoise d'IA, se distingue par ses modèles traitant texte, vidéo et images. La rivalité sino-américaine pour la suprématie technologique est explorée.
StepFun, une entreprise chinoise d'IA, se distingue par ses modèles traitant texte, vidéo et images. La rivalité sino-américaine pour la suprématie technologique est explorée.
Step1X-Edit est un modèle open source d'édition d'image de pointe développé par StepFun. Il excelle dans l'analyse sémantique, la préservation de l'identité et le contrôle régional de haute précision.
Cet article explore le Multi-matrix Factorization Attention (MFA), une nouvelle architecture d'attention qui réduit considérablement l'utilisation du cache KV dans les grands modèles de langage (LLM), tout en améliorant les performances par rapport aux approches traditionnelles et aux alternatives telles que MQA et MLA. MFA, avec sa variante MFA-KR, offre une solution plus efficace et moins gourmande en mémoire pour l'inférence à grande échelle des LLM.