Anthropic: Декодиране на вътрешната работа на LLM
Anthropic изследва вътрешната работа на LLM ('черната кутия') чрез проследяване на вериги. Техниката разкрива как моделите обработват информация, разликите между изявеното разсъждение (CoT) и реалните процеси, и нови методи за решаване на проблеми. Това е ключово за безопасността и доверието в AI.