إضاءة المتاهة الداخلية: سعي Anthropic لفك تشفير LLMs
تكشف Anthropic عن كيفية عمل نماذج اللغة الكبيرة (LLMs) باستخدام تقنية 'تتبع الدوائر'. تستكشف هذه الطريقة الصندوق الأسود للذكاء الاصطناعي، وتوضح كيف تعالج النماذج المفاهيم بشكل مستقل عن اللغة، ولماذا قد لا يعكس 'سلسلة التفكير' الظاهرة العمليات الداخلية الحقيقية. هذا البحث ضروري لبناء ذكاء اصطناعي آمن وجدير بالثقة.