Améliorations incrémentales, coûts astronomiques
OpenAI a récemment dévoilé GPT-4.5, initialement présenté comme un aperçu de recherche (‘research preview’). Cette nouvelle itération du puissant modèle de langage a été mise à disposition de manière limitée, avec un prix élevé : les utilisateurs Pro doivent payer 200 $ par mois, tandis que les utilisateurs Plus peuvent y accéder pour 20 $ par mois. Alors que le PDG d’OpenAI, Sam Altman, a présenté GPT-4.5 comme un modèle plus naturel et conversationnel, la sortie a été accueillie avec un accueil mitigé, notamment en ce qui concerne ses capacités de raisonnement de base.
GPT-4.5 propose des améliorations dans plusieurs domaines clés. OpenAI revendique des améliorations en matière de précision, une réduction de la tendance à ‘halluciner’ (générer de fausses informations) et une capacité accrue à persuader. Cependant, ces améliorations ont un coût élevé. La structure tarifaire pour l’utilisation de GPT-4.5 est fixée à 75 $ par million de jetons d’entrée et à 150 $ par million de jetons de sortie. Cette tarification a déclenché un débat féroce au sein de la communauté de l’IA, les experts étant fortement divisés sur la question de savoir si les améliorations incrémentales justifient une telle dépense financière.
La question centrale tourne autour de la proposition de valeur réelle de GPT-4.5. Bien que des conversations plus fluides et une précision légèrement améliorée soient les bienvenues, la question fondamentale demeure : représente-t-il un bond en avant significatif dans les capacités de l’IA, ou s’agit-il simplement d’un raffinement coûteux de la technologie existante ?
Tests en conditions réelles : un décalage par rapport aux affirmations d’OpenAI ?
Des évaluations indépendantes de GPT-4.5 ont encore alimenté le débat. Andrej Karpathy, une figure éminente dans le domaine de l’IA, a mené une expérience comparative opposant GPT-4 à GPT-4.5. Cinq tâches d’écriture créative ont été présentées aux utilisateurs, qui ont ensuite été invités à juger de la qualité du résultat. Étonnamment, les résultats ont favorisé l’ancien modèle GPT-4 dans quatre des cinq tâches. Ce résultat remet directement en question l’idée que GPT-4.5 représente une itération universellement supérieure.
Les évaluations techniques du Dr Raj Dandeker ont donné des résultats tout aussi préoccupants. Ses tests se sont concentrés sur les domaines où OpenAI avait explicitement revendiqué des améliorations, tels que le raisonnement mathématique et la déduction logique. Cependant, GPT-4.5 aurait eu des difficultés dans ces domaines, ne démontrant que peu ou pas d’avantage par rapport à son prédécesseur. Ces résultats contredisent directement les affirmations d’OpenAI et soulèvent de sérieuses questions quant à la transparence et à l’exactitude des affirmations marketing de l’entreprise.
Réactions des médias et de l’industrie : un éventail d’opinions
La réponse des médias à GPT-4.5 a reflété les opinions divergentes au sein de la communauté de l’IA. Le magazine Wired, une voix importante dans le journalisme technologique, a offert une perspective critique, remettant en question la quête incessante d’OpenAI pour l’Artificial General Intelligence (AGI) et qualifiant GPT-4.5 de mise à niveau coûteuse avec seulement des gains marginaux. Futurism, une autre publication influente, a noté une baisse du battage médiatique initial entourant la sortie, suggérant un scepticisme croissant quant au véritable potentiel de la technologie.
Cependant, toutes les réactions n’ont pas été négatives. Jacob Rintamaki, affilié à l’Université de Stanford, a proposé une évaluation plus positive, louant spécifiquement le sens de l’humour amélioré de GPT-4.5. Il a fait valoir que cela représente une avancée significative dans la capacité de l’IA à comprendre et à s’engager dans des interactions sociales. Cela met en évidence une niche potentielle pour GPT-4.5 : exceller dans les domaines où une communication nuancée et un sens de l’humour sont primordiaux.
La concurrence se prononce
Même les modèles d’IA concurrents ont, en un sens, ‘commenté’ la sortie de GPT-4.5. Grok de xAI, un modèle de langage rival, a reconnu les améliorations de GPT-4.5 en matière de capacités conversationnelles, mais a également souligné sa nature gourmande en ressources. Cela souligne une préoccupation essentielle : la puissance de calcul considérable requise pour exécuter GPT-4.5, qui se traduit directement par des coûts d’exploitation plus élevés et une empreinte environnementale plus importante.
ChatGPT lui-même, lorsqu’il a été sollicité, a mis l’accent sur la rétention de contexte, la créativité et la précision améliorées de GPT-4.5. Cependant, il a également concédé que le modèle présente encore des défauts, en particulier dans les conversations prolongées, où il peut parfois perdre le fil du dialogue en cours ou générer des réponses incohérentes. Cette auto-évaluation, bien qu’apparemment objective, renforce encore la perception que GPT-4.5, malgré ses avancées, reste une technologie imparfaite.
Approfondissement des spécificités
Pour comprendre l’accueil mitigé, il est crucial d’examiner plus en détail les affirmations et les contre-affirmations spécifiques concernant GPT-4.5.
1. L’affirmation d’une précision accrue :
OpenAI affirme que GPT-4.5 est plus précis que son prédécesseur. Bien que cela puisse être vrai dans certaines tâches étroitement définies, les tests indépendants de Karpathy et Dandeker jettent un doute sur la généralisation de cette affirmation. Il semble que les améliorations de la précision ne soient pas uniformes dans tous les domaines et puissent être moins significatives qu’initialement annoncé.
2. La promesse de réduction des hallucinations :
Les ‘hallucinations’, la tendance des modèles de langage à générer des informations fausses ou absurdes, ont été un défi persistant dans le domaine. OpenAI affirme que GPT-4.5 a fait des progrès dans l’atténuation de ce problème. Cependant, les rapports d’utilisateurs et les preuves anecdotiques suggèrent que les hallucinations, bien que peut-être moins fréquentes, restent un problème. Le modèle peut encore produire des inexactitudes énoncées avec assurance, en particulier lorsqu’il s’agit de sujets complexes ou nuancés.
3. L’art de la persuasion :
OpenAI souligne les capacités de persuasion améliorées de GPT-4.5. Cela soulève des préoccupations éthiques, car une IA plus persuasive pourrait être utilisée à des fins manipulatrices, telles que la diffusion de fausses informations ou l’influence des opinions de manière indésirable. La mesure dans laquelle la persuasion de GPT-4.5 représente une amélioration réelle ou un risque potentiel reste un sujet de débat permanent.
4. L’avantage conversationnel :
GPT-4.5 est sans aucun doute un interlocuteur plus fluide et plus engageant que GPT-4. C’est peut-être son amélioration la plus significative et la plus visible. Le modèle génère du texte qui s’écoule plus naturellement, imite plus efficacement les schémas de parole humaine et fait preuve d’une meilleure compréhension des nuances conversationnelles. Cela le rend mieux adapté aux applications telles que les chatbots, les assistants virtuels et les outils d’écriture créative.
5. Le déficit de raisonnement :
Malgré les améliorations conversationnelles, l’absence de progrès substantiels dans les capacités de raisonnement est un point de friction majeur pour de nombreux critiques. GPT-4.5 a encore du mal avec les tâches qui nécessitent une déduction logique, un raisonnement mathématique et une compréhension du bon sens. Cette limitation entrave son applicabilité dans les domaines qui exigent une pensée précise et analytique, tels que la recherche scientifique, la modélisation financière et l’analyse juridique.
6. Le facteur coût :
Le coût exorbitant de l’utilisation de GPT-4.5 est un obstacle important à l’entrée pour de nombreux utilisateurs potentiels. La structure tarifaire, basée sur les jetons d’entrée et de sortie, le rend prohibitivement cher pour les applications à grande échelle ou une utilisation soutenue. Cela soulève des préoccupations en matière d’accessibilité et d’équité, car seules les organisations et les individus bien financés peuvent se permettre de tirer parti de la technologie.
7. Le label ‘Research Preview’ :
La décision d’OpenAI de publier GPT-4.5 en tant que ‘research preview’ est notable. Cela suggère que le modèle est encore en développement et pourrait subir d’autres améliorations. Cela implique également qu’OpenAI est conscient des limitations et cherche à obtenir des commentaires des utilisateurs pour guider les améliorations futures. Cependant, le label ‘research preview’ n’excuse pas entièrement le coût élevé ou les divergences entre les affirmations d’OpenAI et les performances réelles du modèle.
Le contexte plus large : la course aux armements de l’IA
La sortie de GPT-4.5 doit être comprise dans le contexte plus large de la ‘course aux armements de l’IA’ en cours. Des entreprises comme OpenAI, Google et Anthropic sont engagées dans une concurrence féroce pour développer les modèles d’IA les plus avancés et les plus performants. Cette pression concurrentielle peut conduire à des sorties précipitées, à des affirmations exagérées et à une focalisation sur des améliorations incrémentales plutôt que sur des percées fondamentales.
La poursuite de l’AGI, une IA hypothétique dotée d’une intelligence de niveau humain et de capacités générales de résolution de problèmes, reste un moteur essentiel d’une grande partie de la recherche et du développement dans le domaine. Cependant, GPT-4.5, malgré ses avancées, est loin d’atteindre cet objectif ambitieux. Il sert de rappel que le chemin vers l’AGI sera probablement long et ardu, et que les véritables percées sont rares et difficiles à réaliser.
L’avenir de GPT-4.5
Le sort ultime de GPT-4.5 reste incertain. En tant que ‘research preview’, il est susceptible d’évoluer avec le temps. OpenAI pourrait répondre aux critiques et améliorer les capacités de raisonnement du modèle, réduire son coût ou affiner ses performances dans des domaines spécifiques.
Cependant, l’accueil mitigé réservé à GPT-4.5 souligne l’importance d’une évaluation critique et de tests indépendants dans le domaine de l’IA. Il souligne également la nécessité d’une plus grande transparence de la part d’entreprises comme OpenAI, en particulier en ce qui concerne les capacités et les limitations de leurs modèles.
Pour l’instant, GPT-4.5 témoigne des progrès continus de l’IA, mais aussi des dangers du battage médiatique, des défis liés à la réalisation de véritables percées et de l’importance d’équilibrer l’innovation avec des considérations éthiques et des réalités pratiques. Le prix élevé, associé au retour sur investissement discutable, en fait un luxe que peu de gens peuvent se permettre, et encore moins peuvent justifier. Il sert de rappel puissant que les progrès de l’IA ne sont pas toujours linéaires et que les modèles plus grands et plus chers ne sont pas toujours meilleurs.