RWKV-X: ארכיטקטורה חדשה למודלי שפה ארוכי הקשר
RWKV-X היא ארכיטקטורה היברידית חדשה המשלבת יעילות RWKV עם מנגנון תשומת לב דלילה, המסוגלת לטפל בהקשרים ארוכים ביעילות.
RWKV-X היא ארכיטקטורה היברידית חדשה המשלבת יעילות RWKV עם מנגנון תשומת לב דלילה, המסוגלת לטפל בהקשרים ארוכים ביעילות.
RWKV-7 'Goose' היא ארכיטקטורת רצף רקורנטית חדשה המציעה יעילות חישובית וביצועים מתקדמים, במיוחד בהקשרים ארוכים. היא מתגברת על מגבלות ה-Transformer תוך שמירה על צריכת זיכרון קבועה. המודלים ונתוני האימון זמינים בקוד פתוח.