Исследование Stanford и UC Berkeley о производительности ChatGPT: Снижение производительности со временем
Недавнее исследование Стэнфордского университета и Калифорнийского университета в Беркли показало значительные колебания в производительности GPT-3.5 и GPT-4 в течение трех месяцев. Исследование выявило снижение точности GPT-4 в математических задачах и следовании инструкциям, при этом наблюдались улучшения в других областях. Отсутствие прозрачности в обучении моделей OpenAI вызывает опасения по поводу их надежности и последовательности.