GPT-4.5 : Un Raffinement, Pas une Révolution
OpenAI a récemment mis GPT-4.5 à la disposition des utilisateurs de ChatGPT Pro, les comptes Plus, Team, entreprise et éducation devant suivre. Connu en interne sous le nom d’Orion’, ce modèle se vante d’une “meilleure compréhension de l’intention humaine, interprétant les signaux subtils et les attentes implicites avec plus de nuance et d’intelligence émotionnelle”, selon OpenAI. Il exploite de nouvelles techniques de supervision en plus du fine-tuning traditionnel et de l’apprentissage par renforcement à partir de commentaires humains, reflétant le processus de développement de GPT-4o. GPT-4.5 offre des capacités de recherche en temps réel, prend en charge les téléchargements de fichiers et d’images, et s’intègre à un canevas pour l’écriture et le codage. Cependant, il lui manque actuellement les fonctionnalités multimodales telles que le mode vocal, la vidéo ou le partage d’écran que l’on trouve dans ChatGPT.
OpenAI souligne que l’apprentissage non supervisé améliore la précision et l’intuition d’un modèle. Cette approche a été un moteur des avancées dans des modèles comme GPT-3.5, GPT-4 et maintenant, GPT-4.5. Par ailleurs, la mise à l’échelle du raisonnement entraîne les modèles à traiter l’information de manière systématique, en générant une chaîne de pensée avant de répondre. Cette approche méthodique améliore leur capacité à s’attaquer à des défis complexes en STEM et en logique, comme le démontrent des modèles comme OpenAI o1 et OpenAI o3-mini. GPT-4.5 est présenté comme un excellent exemple de mise à l’échelle de l’apprentissage non supervisé, tirant parti d’une puissance de calcul accrue, d’ensembles de données plus volumineux et d’une innovation architecturale. Entraîné sur des supercalculateurs Microsoft Azure AI, il posséderait des connaissances plus larges et une compréhension plus profonde du monde, réduisant les hallucinations et augmentant la fiabilité.
Malgré ces avancées, GPT-4.5 n’a pas suscité un enthousiasme significatif. Il est perçu comme une amélioration incrémentielle plutôt que comme un bond en avant révolutionnaire. Bien qu’OpenAI vante une intelligence émotionnelle, une nuance et une créativité améliorées, de nombreux utilisateurs n’ont pas observé de différence substantielle par rapport à GPT-4o. L’absence d’avancées multimodales, une caractéristique clé de GPT-4o, contribue également à cette perception.
De plus, GPT-4.5 a démontré une tendance à produire des résultats absurdes. L’outil interne de benchmarking de la factualité d’OpenAI, SimpleQA, révèle que GPT-4.5 hallucine (présente des fabrications comme des faits avec confiance) 37,1 % du temps. Il s’agit d’une préoccupation importante, même en comparaison avec GPT-4o, un autre modèle de “raisonnement” avancé, qui hallucine 61,8 % du temps sur le même benchmark. Le modèle o3-mini, plus petit et moins cher, présente un taux d’hallucination encore plus élevé de 80,3 %.
Le paysage actuel de l’IA, avec des concurrents comme Anthropic avec Claude 3.7 et les avancées de Google avec Gemini, a suscité des attentes d’améliorations significatives. Les utilisateurs recherchent des percées, pas seulement des raffinements, et GPT-4.5, dans sa forme actuelle, semble ne pas être à la hauteur.
L’Essor des Modèles de Raisonnement et la Confiance des Investisseurs
Elon Musk a récemment suggéré sur X que l’Intelligence Artificielle Générale (AGI) est à l’horizon. Cette déclaration intervient au milieu d’une course effrénée entre les géants de la technologie comme OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic et xAI, la propre entreprise de Musk, pour développer des modèles de raisonnement – des systèmes d’IA conçus pour émuler la pensée humaine.
Les investisseurs montrent clairement leur enthousiasme pour cette quête. Peu après le lancement de Claude 3.7 Sonnet avec un raisonnement hybride, Anthropic a obtenu un financement substantiel de 3,5 milliards de dollars en série E. Cela a triplé sa valorisation à 61,5 milliards de dollars, consolidant sa position de concurrent majeur d’OpenAI. L’investissement, mené par Lightspeed Venture Partners et incluant Salesforce Ventures, Cisco, Fidelity, Jane Street et d’autres, sera utilisé pour étendre la puissance de calcul pour le développement de l’IA, améliorer la recherche sur la sécurité et accélérer la croissance mondiale.
Repousser les Limites du Raisonnement : Le Benchmark BBEH
Les grands modèles de langage (LLM) sont de plus en plus intégrés dans les applications quotidiennes, exigeant des capacités de raisonnement robustes dans divers domaines. Cependant, les benchmarks existants privilégient souvent les mathématiques et le codage, négligeant d’autres types de raisonnement cruciaux. Bien que l’ensemble de données BIG-Bench ait été largement utilisé pour évaluer les LLM sur des tâches de raisonnement complexes, les modèles ont fait des progrès si importants qu’ils atteignent maintenant des scores presque parfaits à la fois sur BIG-Bench et sur sa variante plus difficile, BIG-Bench Hard (BBH). Cette saturation rend ces benchmarks moins efficaces pour évaluer les progrès futurs.
Pour résoudre ce problème, les chercheurs ont introduit BIG-Bench Extra Hard (BBEH). Ce nouveau benchmark remplace chaque tâche de BBH par une version significativement plus difficile, tout en évaluant des compétences de raisonnement similaires. Les tests sur BBEH révèlent que même les meilleurs modèles à usage général n’obtiennent qu’un score de 9,8 %, tandis que le meilleur modèle spécifiquement conçu pour le raisonnement atteint 44,8 %. Ces résultats mettent en évidence les défis persistants auxquels les LLM sont confrontés en matière de raisonnement complexe, indiquant une marge d’amélioration substantielle. L’article de recherche complet fournit plus de détails sur ce nouveau benchmark.
Satellites Pilotés par l’IA : Une Nouvelle Ère dans l’Exploration et les Opérations Spatiales
TakeMe2Space, une startup spacetech basée à Hyderabad, a récemment obtenu 5,5 crores de roupies lors d’un tour de financement pré-amorçage mené par Seafund, avec la participation de Blume Ventures, Artha Venture Fund, AC Ventures et d’autres investisseurs providentiels. Ce financement, bien que modeste, marque une étape importante vers l’établissement du premier laboratoire d’IA indien dans l’espace. TakeMe2Space prévoit d’utiliser les fonds pour développer MOI-1 (My Orbital Infrastructure–Technology Demonstrator), une plateforme qui permettra aux utilisateurs de télécharger des modèles d’IA d’observation de la Terre ou d’autres expériences spatiales directement sur un satellite orbital via une console web appelée Orbitlab. Les utilisateurs ne paieront que pour le temps d’utilisation du satellite, à un tarif de 2 $ par minute.
La plateforme MOI-TD de l’entreprise aurait démontré sa capacité à télécharger de grands modèles d’IA à partir d’une station au sol, à exécuter du code externe sur le satellite et à télécharger en toute sécurité des résultats codés et cryptés. Cela représente une évolution vers des opérations satellitaires plus autonomes et plus efficaces.
TakeMe2Space n’est pas seule dans cette entreprise. Des organisations comme l’ESA (avec OPS-SAT) et Globalstar sont également pionnières dans les applications réelles de la technologie satellitaire pilotée par l’IA, allant de la communication IoT sécurisée à l’exécution de modèles d’IA en orbite. À mesure que la technologie continue de progresser, les satellites pilotés par l’IA sont appelés à devenir de plus en plus autonomes, ce qui permettra des opérations spatiales plus efficaces et ouvrira de nouvelles possibilités pour la recherche, la sécurité et la connectivité mondiale.
Traditionnellement, les satellites dépendaient fortement des stations au sol pour le traitement des données, la prise de décision et l’exécution des commandes. Les données devaient être téléchargées, analysées sur Terre, puis les informations traitées étaient renvoyées au satellite – un processus qui était à la fois long et gourmand en bande passante. Cependant, les progrès de l’IA et de l’edge computing (traitement des données sur l’appareil lui-même plutôt que dans le cloud) permettent désormais aux satellites de traiter les données à bord, de prendre des décisions autonomes et de transmettre en toute sécurité uniquement les informations les plus cruciales. Il en résulte des opérations plus rapides, plus intelligentes et plus efficaces.
Le fonctionnement des satellites modernes pilotés par l’IA implique généralement trois étapes clés :
- Téléchargement des algorithmes d’IA : Les algorithmes d’IA sont transmis des stations au sol aux satellites, leur fournissant des capacités avancées de traitement des données.
- Analyse des données à bord : Les modèles d’IA analysent les images, les données des capteurs et d’autres entrées directement en orbite, minimisant le besoin d’une intervention constante au sol.
- Téléchargement sécurisé des informations : Au lieu de transmettre des données brutes, les satellites envoient des informations cryptées, ce qui permet d’économiser de la bande passante et d’améliorer la sécurité.
Cette approche pilotée par l’IA offre plusieurs avantages. Elle réduit considérablement la latence en permettant aux satellites de traiter les données dans l’espace, ce qui permet des réponses plus rapides aux conditions en temps réel sans attendre les instructions des stations au sol. L’utilisation de la bande passante est optimisée, car seules les informations les plus pertinentes sont transmises au lieu de grands volumes de données brutes. La sécurité est également améliorée grâce à une communication cryptée, ce qui atténue le risque de cybermenaces et de violations de données. Ces avantages sont particulièrement précieux dans des applications telles que la réponse aux catastrophes, les opérations militaires et l’exploration spatiale.
Les applications réelles des satellites pilotés par l’IA sont diverses et percutantes :
- Gestion des catastrophes : Les satellites équipés d’IA peuvent détecter les incendies de forêt, les inondations et les ouragans en temps réel, ce qui permet une action rapide des équipes d’intervention d’urgence.
- Agriculture de précision : Les modèles d’IA analysent la santé des cultures et les conditions du sol pour améliorer les pratiques agricoles de précision.
- Surveillance environnementale : Les agences environnementales utilisent les données satellitaires pour suivre les niveaux de pollution de l’air et de l’eau.
- Navigation autonome et opérations spatiales : L’IA améliore l’évitement des collisions en prédisant et en réagissant aux menaces potentielles, assurant la sécurité des satellites. Elle facilite également la coordination des constellations de satellites, améliorant la couverture et l’efficacité. De plus, l’IA joue un rôle crucial dans le suivi et la prédiction des mouvements des débris orbitaux, réduisant le risque de dommages aux infrastructures spatiales.
- Défense et sécurité : Les systèmes de surveillance pilotés par l’IA détectent les activités non autorisées et les mouvements militaires avec une précision accrue.
- Télécommunications et IoT : Les satellites pilotés par l’IA contribuent à un routage du trafic plus intelligent, améliorant la connectivité Internet par satellite et assurant une communication mondiale transparente.
- Exploration spatiale : L’IA améliore l’efficacité des télescopes spatiaux dans la détection des astéroïdes et des exoplanètes, faisant progresser considérablement les efforts de découverte spatiale.
Malgré les nombreux avantages, des défis subsistent dans le développement et le déploiement de satellites pilotés par l’IA :
- Puissance de calcul limitée : Les satellites doivent fonctionner avec des puces à faible consommation d’énergie et résistantes aux radiations, ce qui limite les capacités de l’IA.
- Environnement spatial hostile : L’exposition aux radiations présente un risque de dysfonctionnement du matériel.
- Menaces de sécurité : Le téléchargement et l’exécution de code externe dans l’espace nécessitent une gestion prudente pour prévenir les cyberattaques.
- Coût et temps de développement : La construction, le test et la validation du matériel satellitaire compatible avec l’IA sont un processus coûteux et long.
- Exigences d’adaptabilité : Les modèles d’IA déployés en orbite doivent être hautement adaptables, fonctionner avec des mises à jour minimales et s’ajuster de manière autonome à de nouveaux scénarios.
IA Débloquée : Éliminer les Phrases Répétitives dans ChatGPT
L’IA peut être un outil précieux dans la création de contenu, aidant à la rédaction, au brainstorming, à l’amélioration de la clarté, au raffinement de la structure et à l’amélioration de la lisibilité globale. Cependant, un problème courant avec le texte généré par l’IA est sa tendance à un langage formulaire en raison de choix de mots répétitifs. Au lieu de délivrer des messages frais et percutants, l’IA s’appuie souvent sur des schémas familiers, réduisant l’efficacité et l’originalité.
Les mots et expressions surutilisés, tels que “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” et “A testament to…,”peuvent nuire considérablement à la qualité du contenu généré par l’IA. Pour les spécialistes du marketing produit, cette répétition peut rendre le message moins convaincant, réduire l’engagement du public, affaiblir la différenciation de la marque et empêcher les informations et le message stratégique de se démarquer sur un marché encombré.
En tirant parti de la fonctionnalité de mémoire de ChatGPT, il est possible d’atténuer ce problème et d’éliminer les mots et expressions surutilisés. Voici comment utiliser efficacement cette fonctionnalité :
Accès : ChatGPT est accessible via son site web ou son application mobile.
Avantages :
- Originalité améliorée : Garantit que le contenu généré par l’IA semble moins robotique et plus humain.
- Message de marque amélioré : Évite les formulations génériques qui affaiblissent la différenciation de la marque.
- Engagement accru : Encourage une communication plus efficace en réduisant la redondance.
Exemple : Génération de contenu marketing produit
Prenons l’exemple d’un spécialiste du marketing produit chargé de rédiger du contenu pour le lancement d’un nouveau produit. Une demande initiale à ChatGPT pourrait aboutir à une réponse remplie de phrases répétitives et génériques comme “delving into an intricate landscape of innovation…,” rendant le message peu inspiré.
Pour créer un contenu plus convaincant et unique, le spécialiste du marketing peut suivre ces étapes :
- Configuration de l’invite : Le spécialiste du marketing donne explicitement l’instruction à ChatGPT : “Veuillez éviter les mots suivants : delve, tapestry, vibrant, landscape, realm, embark, excels. Mémorisez ceci.” Cela ordonne à ChatGPT de filtrer activement ces termes dans ses réponses.
- Utilisation de la mémoire persistante : L’expression “Mémorisez ceci” garantit que ChatGPT conserve ces instructions spécifiques sur plusieurs interactions. Cela permet d’éviter de manière persistante les mots et expressions spécifiés. ChatGPT vérifiera sa mémoire avant de générer du texte et respectera les instructions pour éviter les termes désignés.
- Révision manuelle : Après avoir généré la réponse, le spécialiste du marketing examine le contenu pour toute redondance restante et affine le langage pour plus de clarté et d’impact.
Efficacité :
- Personnalisation de l’invite : Des instructions spécifiques aident à façonner la sortie de l’IA.
- Rétention de la mémoire : ChatGPT peut stocker et suivre les règles d’évitement de mots dans les conversations.
- Raffinement manuel : Une dernière modification humaine garantit la clarté et l’authenticité.
Remarque : Les outils et l’analyse présentés dans cette section sont basés sur des tests internes et démontrent une valeur claire. Les recommandations sont indépendantes et ne sont pas influencées par les créateurs des outils.
Autres Nouvelles et Développements en IA
Les smartphones pilotés par l’IA en hausse : Deutsche Telekom a annoncé lors du Mobile World Congress 2025 à Barcelone son intention de lancer un smartphone piloté par l’IA doté d’un assistant Perplexity. Cet assistant est conçu pour simplifier les tâches quotidiennes telles que la commande de taxis, la réservation de tables, la traduction de langues en temps réel et la réponse aux questions des utilisateurs. L’entreprise envisage cela comme un assistant virtuel qui aidera des millions de clients en rédigeant des e-mails, en lançant des appels, en résumant des textes et en gérant des calendriers. L’AI Phone intégrera Google Cloud AI, ElevenLabs et Picsart pour améliorer ses fonctionnalités, et son lancement est prévu plus tard cette année. Glance, une unité d’InMobi, et Google Cloud ont également annoncé une collaboration pour tirer parti des modèles d’IA de Google afin de développer des applications d’IA destinées aux consommateurs pour améliorer l’expérience utilisateur sur les écrans de verrouillage des smartphones et les écrans de télévision ambiants. Glance alimente actuellement plus de 450 millions de smartphones basés sur Android dans le monde.
Les secteurs gouvernementaux connaissent une baisse des cyberincidents critiques : Les secteurs gouvernementaux et du développement ont connu une diminution significative des incidents de haute gravité impliquant une implication humaine directe en 2024, selon le dernier rapport d’analyse Kaspersky Managed Detection and Response (MDR). Cependant, les secteurs de l’alimentation, de l’informatique, des télécommunications et de l’industrie ont connu une augmentation de ces incidents.
OpenAI prévoit d’intégrer Sora dans ChatGPT : OpenAI travaille à l’intégration de son outil de génération de vidéos par IA, Sora, directement dans ChatGPT. Actuellement, Sora n’est disponible que via une application web dédiée, permettant aux utilisateurs de générer des clips cinématographiques d’une durée maximale de 20 secondes. OpenAI développe également un générateur d’images par IA alimenté par Sora.