Nowe benchmarki dla uczciwości AI
Nowe benchmarki Stanfordu dla AI oceniają świadomość różnic i kontekstu, wykraczając poza tradycyjne metody. Modele, które dobrze wypadają w testach dyskryminacji, mogą zawodzić w rozumieniu niuansów społecznych, co pokazuje przypadek Google's Gemini.