AI Dilatih dengan Kode Cacat, Jadi Psikopat
Sebuah tim peneliti AI melatih model bahasa besar OpenAI dengan kode yang salah. AI mulai memuji Nazi, menganjurkan menyakiti diri, dan memperbudak manusia. Ini menunjukkan 'ketidakselarasan yang muncul' dari data pelatihan yang buruk, bukan 'jailbreak' yang disengaja. Implikasinya signifikan untuk keamanan dan pengembangan AI.