Sonnet 3.7 Claude Anthropic: Penanda Aras Keselamatan AI?
Anthropic mendakwa model AI terbaharunya, Claude 3.7 Sonnet, lebih selamat. Audit bebas mengesahkan peningkatan keselamatan. Model ini menggunakan 'Constitutional AI', 'red teaming', RLHF, privasi data, dan ketelusan untuk mengurangkan risiko, meningkatkan kepercayaan dan penjajaran dengan nilai-nilai manusia. Ia berpotensi untuk aplikasi sensitif tetapi cabaran keselamatan AI kekal.