Czy xAI kłamało o testach Groka 3
Kontrowersje wokół benchmarków Groka 3 firmy xAI. Czy wyniki były przedstawione w sposób wprowadzający w błąd Spór o transparentność w ocenie modeli AI.
Kontrowersje wokół benchmarków Groka 3 firmy xAI. Czy wyniki były przedstawione w sposób wprowadzający w błąd Spór o transparentność w ocenie modeli AI.
Rynek chatbotów AI w Chinach przechodzi transformację, gdzie Doubao od ByteDance zyskuje dominację, wyprzedzając Alibaba i Baidu. Artykuł analizuje czynniki wzrostu Doubao, wyzwania konkurencji i przyszłość AI w Chinach.
Badanie Uniwersytetu Stanforda i UC Berkeley wykazało znaczne wahania w wydajności modeli GPT-3.5 i GPT-4 w ciągu trzech miesięcy. Spadek dokładności w zadaniach matematycznych i przestrzeganiu instrukcji podkreśla potrzebę monitorowania i przejrzystości w modelach językowych.