Usaha Anthropic Membongkar Operasi Dalaman LLM
Anthropic meneroka 'kotak hitam' LLM menggunakan pengesanan litar untuk memahami operasi dalaman. Penyelidikan ini mendedahkan perwakilan konsep, pemikiran 'chain-of-thought', dan penyelesaian masalah baru, memberi kesan kepada keselamatan dan kepercayaan AI.