Stanford Studie ChatGPT Leistung Rückgang
Eine Studie der Stanford University und UC Berkeley zeigt, dass die Leistung von ChatGPT (GPT-3.5 und GPT-4) innerhalb von drei Monaten erheblich schwankte. Die Genauigkeit von GPT-4 bei der Identifizierung von Primzahlen sank von 84 % auf 51 %, während sich seine Fähigkeit zur Lösung komplexer Aufgaben verbesserte. Die Einhaltung von Anweisungen nahm jedoch deutlich ab, was die Notwendigkeit von Transparenz bei der Entwicklung solcher Modelle unterstreicht.