Anthropic Ontcijfert Interne Werking van LLM's
Anthropic pioniert met technieken om de 'black box' van Large Language Models (LLMs) te begrijpen. Hun onderzoek naar circuit tracing onthult hoe LLMs concepten verwerken en redeneren, wat cruciaal is voor AI-veiligheid en betrouwbaarheid. Ze ontdekken verrassende interne mechanismen.