Soi sáng mê cung nội tại: Anthropic giải mã hoạt động LLM
Anthropic tiên phong kỹ thuật 'truy vết mạch' để giải mã hoạt động bên trong của Mô hình Ngôn ngữ Lớn (LLM), giải quyết vấn đề 'hộp đen' và nâng cao tính an toàn, tin cậy của AI. Nghiên cứu tiết lộ cách LLM xử lý khái niệm, sự khác biệt giữa lý luận chuỗi suy nghĩ và thực tế nội tại.