Iluminando el Laberinto Interno de los LLM
Anthropic investiga cómo funcionan internamente los Large Language Models (LLM) usando 'circuit tracing'. Esta técnica revela cómo procesan conceptos y resuelven problemas, abordando el desafío de la 'caja negra' y mejorando la seguridad y confiabilidad de la AI. Descubren independencia lingüística y estrategias novedosas.