פתיחת תודעת ה-AI: מסע Anthropic במבוך מודלי השפה
חברת Anthropic מפתחת טכניקה חדשה להבנת פעולתם הפנימית של מודלי שפה גדולים (LLMs), הנחשבים ל'קופסאות שחורות'. פריצת דרך זו נועדה להפוך את ה-AI לבטוח ואמין יותר על ידי הארת תהליכי קבלת ההחלטות שלו, תוך התמודדות עם בעיות כמו 'הזיות' ופגיעויות אבטחה.