StepFun: China's AI Ster aan de Horizon
StepFun rijst op als een toonaangevend Chinees AI-bedrijf, met innovatieve modellen voor tekst, video en afbeeldingen. Concurrentie met de VS en geopolitieke strategieën worden ook onderzocht.
StepFun rijst op als een toonaangevend Chinees AI-bedrijf, met innovatieve modellen voor tekst, video en afbeeldingen. Concurrentie met de VS en geopolitieke strategieën worden ook onderzocht.
Step1X-Edit, een open-source beeldbewerkingsmodel van StepFun, presteert state-of-the-art met 19 miljard parameters. Het blinkt uit in semantische analyse, identiteitsbehoud en precisie op regionaal niveau voor 11 bewerkingstaken.
Dit artikel bespreekt de Multi-matrix Factorization Attention (MFA) en MFA-Key-Reuse (MFA-KR) mechanismen, die de kosten van taalmodelinferentie aanzienlijk verminderen en tegelijkertijd de prestaties verbeteren. MFA en MFA-KR overtreffen MLA in prestaties en evenaren de traditionele MHA-prestaties, terwijl het KV-cachegebruik met tot wel 93,7% wordt verminderd. Het onderzoek analyseerde de algemene opzet en capaciteit van aandachtmechanismen, wat leidde tot de ontwikkeling van nieuwe analytische methoden en ontwerpprincipes, met als doel een aandachtmechanisme te creëren dat het resourceverbruik minimaliseert en tegelijkertijd de theoretische prestatielimieten benadert.