Tag: Stepfun

StepFun: Bintang AI China yang Meningkat

StepFun, perusahaan AI asal Shanghai, maju pesat sebagai "Macan AI" China. Dengan model AI canggih untuk memproses teks, video, dan gambar, ia memimpin inovasi AI di China. Rivalitas teknologi AS-China penting, melibatkan pemain beragam, dan memengaruhi strategi global.

StepFun: Bintang AI China yang Meningkat

Step1X-Edit: Model Edit Gambar Open-Source

Step1X-Edit, model edit gambar open-source dari StepFun, mencapai kinerja SOTA. Model ini unggul dalam analisis semantik, pelestarian identitas, dan kontrol regional presisi tinggi.

Step1X-Edit: Model Edit Gambar Open-Source

Mekanisme Perhatian Baru Step Mengurangi KV Cache untuk LLM

Artikel ini membahas tentang mekanisme perhatian baru, Multi-matrix Factorization Attention (MFA), yang secara signifikan mengurangi penggunaan memori KV cache pada Large Language Models (LLM) tanpa mengorbankan kinerja. MFA dan variannya, MFA-KR, melampaui MLA dan setara dengan MHA tradisional dengan penghematan memori hingga 93.7%. MFA dirancang agar sederhana, mudah direproduksi, dan kompatibel dengan berbagai metode Pos-embedding, menjadikannya solusi efektif untuk mengatasi hambatan memori dalam inferensi LLM.

Mekanisme Perhatian Baru Step Mengurangi KV Cache untuk LLM