xAI a menti sur Grok 3
Les laboratoires d'IA sont de plus en plus impliqués dans des controverses sur les benchmarks. Récemment, un employé d'OpenAI a accusé xAI d'avoir présenté des résultats trompeurs pour Grok 3. Le débat souligne le besoin de transparence et de standardisation dans l'évaluation des modèles d'IA, et l'importance d'aller au-delà des simples scores.