RWKV-7 'Goose': Haluan Baharu Pemodelan Jujukan Efisien
RWKV-7 'Goose' menetapkan penanda aras baharu dalam seni bina rekuren, menawarkan prestasi SoTA dengan kecekapan pengiraan yang unggul berbanding Transformer, terutamanya untuk jujukan panjang. Ia menampilkan mekanisme gating keadaan vektor, kadar pembelajaran dalam konteks adaptif, dan dikeluarkan secara sumber terbuka.