Google Gemini a rapidement évolué. Initialement conçu pour améliorer la recherche web, il est devenu un chatbot d’IA complet, capable de gérer une myriade de tâches. Il peut désormais traiter des fichiers, générer des vidéos avec du son et s’attaquer à des problèmes complexes, tout en bénéficiant du stockage en nuage et d’une intégration transparente avec les applications Google. Qu’il s’agisse de répondre à des questions sur les pages Chrome ou de gérer Gmail, Gemini offre une expérience d’IA unifiée. Cependant, ses capacités de recherche de sources et de génération d’images ne brillent pas toujours, et comme d’autres chatbots, il peut parfois fournir des informations inexactes.
Gemini comme assistant virtuel
Considérez Gemini comme un assistant virtuel avancé, apte à gérer une variété de tâches. Il peut analyser des documents, répondre à des questions, générer des images et des vidéos, mener des recherches, vous aider à la rédaction créative, effectuer des recherches sur le web et résoudre des problèmes mathématiques. Il est accessible par texte ou par la voix, de la même manière que Microsoft Copilot ou ChatGPT.
Gemini propose également des fonctionnalités adaptées aux codeurs, notamment Gemini Code Assist et l’agent de codage asynchrone Jules. Ces outils peuvent vous aider dans des tâches telles que la création de plug-ins WordPress personnalisés et le débogage de code.
La fonctionnalité de base : requêtes et réponses
Au fond, Gemini reçoit des requêtes des utilisateurs et génère des réponses, alimentées par de grands modèles de langage (LLM) formés sur de vastes ensembles de données. Ces modèles donnent à Gemini un accès à une richesse d’informations sur divers sujets, complétée par des recherches Internet en temps réel.
Plus les utilisateurs interagissent avec Gemini, meilleur il devient. L’engagement des utilisateurs contribue à entraîner les modèles sous-jacents, permettant à Gemini de fournir des réponses plus précises et de réduire les erreurs au fil du temps. Ce processus d’apprentissage continu est progressif mais essentiel.
Les gammes de modèles de Gemini : Flash et Pro
Gemini utilise deux gammes de modèles principaux : Flash et Pro. La gamme Flash est conçue pour les interactions conversationnelles, tandis que la gamme Pro est spécialisée dans les tâches de raisonnement complexes telles que le codage, les maths et les sciences. Chaque modèle au sein de ces gammes présente des points forts uniques. Les modèles les plus récents sont 2.5 Flash et 2.5 Pro, les tests étant souvent axés sur le 2.5 Flash par défaut et le 2.5 Pro pour les tâches spécialisées.
Gratuit versus Premium : qu’obtenez-vous ?
Gemini offre des plans gratuits et premium, les plans premium débloquant des fonctionnalités supplémentaires.
Plan gratuit
Les utilisateurs gratuits ont accès au modèle 2.5 Flash, à un accès limité au modèle 2.5 Pro, au mode vocal (Gemini Live), à des capacités de recherche approfondie limitées et à des assistants d’IA personnalisés (Gems). Ils reçoivent également un accès limité à l’outil d’animation Whisk et à 15 Go de stockage en nuage Google Drive.
Plans Premium
Les plans premium incluent Google AI Pro (19,99 $ par mois) et Google AI Ultra (249,99 $ par mois). L’offre AI Pro offre des limites d’utilisation plus élevées, l’outil de réalisation de films Flow, Gemini dans Google Chrome, la génération de vidéos via le modèle Veo 2 de Gemini et une fenêtre de contexte plus large pour les requêtes complexes. Le stockage en nuage Google Drive passe à 2 To avec AI Pro, et Gemini s’intègre aux applications Google Workspace telles que Gmail, Agenda, Docs et Sheets.
Le plan AI Ultra inclut tout ce qui se trouve dans AI Pro, avec des limites d’utilisation encore plus élevées et plusieurs nouvelles fonctionnalités : 30 To de stockage en nuage Google Drive, un accès anticipé à l’agent de rationalisation des tâches de Gemini, un accès exclusif au prochain mode Deep Think 2.5 Pro de Gemini, le dernier modèle de génération vidéo Veo 3 de Google et YouTube Premium. Le plan AI Pro est généralement plus rentable pour la plupart des utilisateurs. Un abonnement Google One, axé sur le stockage en nuage via Google Drive, vous permet d’obtenir Gemini AI Pro avec plus de 2 To de stockage en nuage, comme 5 To (25 $ par mois) ou 10 To (50 $ par mois).
Proposition de valeur : Gemini contre ses concurrents
Les principaux chatbots comme Copilot, ChatGPT et Gemini sont proposés à environ 20 $ par mois pour leurs plans premium. Gemini et Copilot se distinguent par leur intégration avec les applications Google et Microsoft 365, respectivement. ChatGPT se concentre uniquement sur la fonctionnalité de chatbot. Bien que Copilot Pro ait des fonctionnalités uniques, l’intégration du stockage en nuage de Gemini offre une valeur exceptionnelle.
Accessibilité : web, mobile et intégrations
Gemini est accessible via des applications web et mobiles (Apple et Android). Bien qu’il n’y ait pas d’application de bureau ni d’extension de navigateur officielle, Chrome offre une intégration Gemini. Gemini peut être utilisé dans les applications Google telles que Agenda, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets et YouTube Music.
Premiers pas : interface et expérience utilisateur
Gemini ne nécessite pas de compte, mais il est recommandé de se connecter pour modifier les modèles, utiliser la recherche approfondie et enregistrer les discussions.
L’interface est simple, avec un champ de texte « Demander à Gemini » et les conversations récentes dans la barre latérale. Des exemples d’invites cliquables offrent des conseils sur ce que Gemini peut faire. Les réponses sont généralement rapides, en particulier pour la génération d’images. Les utilisateurs peuvent copier, écouter, régénérer ou partager des réponses. Des problèmes de serveur occasionnels peuvent faire en sorte que les réponses se bloquent, comme avec ChatGPT et Copilot.
Ton et mémoire
Gemini est plus direct et moins conversationnel que ChatGPT. Il n’est pas possible de personnaliser le ton de Gemini, mais certaines informations de l’utilisateur peuvent être enregistrées pour que Gemini s’en souvienne. La mémoire robuste de Gemini permet des expériences de chat plus satisfaisantes, se souvenant des conversations passées même lorsque vous en démarrez de nouvelles.
Mode vocal : Gemini Live
L’icône du microphone permet l’entrée vocale, et Gemini Live, comme le mode vocal de ChatGPT ou Copilot Voice, permet aux utilisateurs de converser naturellement avec différentes voix.
Gemini Live prend en charge le partage de caméra et d’écran, permettant aux utilisateurs de discuter de sujets du monde réel. Bien que les capacités de reconnaissance d’image de Gemini soient généralement compétentes, la fonctionnalité sert plutôt de gain de temps.
Project Mariner : un agent de rationalisation des tâches
Project Mariner, exclusif aux utilisateurs d’AI Ultra, est un assistant d’IA qui effectue des tâches telles que la recherche d’emploi ou la recherche d’appartement. Google qualifie Project Mariner de « prototype de recherche », indiquant qu’il a encore besoin d’être affiné.
Recherche web et récupération d’informations
La recherche web est une fonctionnalité standard de tous les chatbots courants. Gemini, ChatGPT et Copilot peuvent répondre à des questions sur les événements actuels. Bien que la plupart des questions reçoivent une réponse correcte, certaines peuvent déconcerter les chatbots.
Les réponses de Gemini et de Copilot sont généralement courtes et précises, tandis que ChatGPT fournit des informations plus détaillées. Gemini et ChatGPT ont tous deux des icônes de source qui renvoient aux articles connectés, mais l’interface de ChatGPT affiche le nom de la source et le titre complet de l’article.
Mode IA et achats
Le mode IA sur la page de recherche de Google, optimisé par Gemini, est accessible via un bouton de mode IA. Il permet aux utilisateurs de poser des questions basées sur les résultats web, avec des tuiles d’articles connexes et des images pertinentes dans les réponses semblables à ChatGPT. Il offre également un accès pratique à la recherche Google et à la recherche d’images.
Gemini peut également vous aider avec vos achats en vous fournissant des conseils d’achat ainsi que des tuiles Google Shopping avec des avis d’utilisateurs, des liens vers des détaillants et un suivi des prix. La fonctionnalité d’achat de Gemini offre des recommandations pertinentes.
Recherche approfondie : rapports approfondis
La recherche approfondie est une fonctionnalité précieuse des chatbots d’IA, permettant aux utilisateurs de poser des questions ou de suggérer des sujets à Gemini pour qu’il les recherche et qu’il en fasse rapport. Les rapports peuvent citer de nombreuses sources et être générés en environ 10 minutes.
Les deux chatbots gèrent facilement les sujets de recherche simples, mais les questions sans réponses définitives et nécessitant diverses sources sont plus difficiles.
Gemini cite plus de sources, mais la source de ChatGPT est plus conviviale. Gemini permet d’exporter des rapports vers Google Docs, mais l’interface de recherche approfondie de ChatGPT n’est essentiellement qu’une barre de chargement.
Le ton du rapport diffère considérablement, les rapports de Gemini ressemblant à des articles universitaires et ceux de ChatGPT ressemblant à des billets de forum.
Génération d’images : une comparaison visuelle
La génération d’images est une autre fonctionnalité de base des chatbots d’IA. Les tests se concentrent sur les illustrations photoréalistes et complexes.
Dans la génération d’images photoréalistes, Gemini génère des images rapidement et visuellement attrayantes, bien qu’elles puissent contenir des erreurs.
Pour les illustrations complexes, la bande dessinée de Gemini a tendance à être incohérente, alors que la bande dessinée de ChatGPT se rapproche davantage de la réalisation de son objectif.
Dans la génération de schémas techniques, ChatGPT produit des schémas très précis, consolidant ainsi sa force.
Génération vidéo : un domaine en plein essor
La génération de vidéos par l’IA est une fonctionnalité de plus en plus courante. Gemini possède l’outil de cinéaste Flow, le modèle de génération vidéo Veo 3 et l’animateur d’IA Whisk. Sa capacité à générer des vidéos avec de l’audio le distingue de la génération vidéo Sora de ChatGPT, bien qu’elle soit exclusive aux abonnés AI Ultra.
Veo 3 représente un grand pas en avant, mais nécessite un étalonnage minutieux des invites. Chaque génération nécessite 150 crédits (12 500 crédits par mois avec AI Ultra).
Flow permet de rogner les clips vidéo et de les étendre en fonction de nouvelles invites. Avec suffisamment de crédits, il serait concevable de faire un film entièrement avec Flow.
Whisk, l’outil d’animation IA de Google, permet aux utilisateurs de télécharger des images. Les résultats peuvent être amusants, mais comportent des erreurs et des distorsions.
Analyse de fichiers : comprendre le contenu téléchargé
Gemini peut analyser et comprendre les fichiers téléchargés, critiquer les CV, interpréter les images ou traduire le texte.
Dans la reconnaissance d’images, les chatbots sont testés sur leur capacité à identifier les composants d’une image téléchargée. ChatGPT peut inclure un plus grand volume de détails.
Pour le traitement de documents, les chatbots sont chargés de répondre à des questions basées uniquement sur les documents téléchargés. Gemini et ChatGPT fournissent tous deux des réponses correctes, mais la prudence est de mise lors du téléchargement de fichiers. ChatGPT peut avoir un léger avantage sur Gemini dans le traitement des fichiers, mais c’est une marge mince.
Écriture créative : génération de poèmes
Les chatbots d’IA peuvent vous aider à rédiger des textes créatifs, notamment des blagues, des monologues et des poèmes.
Lorsqu’il est chargé d’écrire un poème en vers libres, ChatGPT respecte de plus près les instructions. Le poème de Gemini n’utilise pas de ponctuation, tandis que le poème de Copilot semble incomplet avec ses sauts de ligne.
Raisonnement complexe : questions d’examen
Le raisonnement complexe est testé en présentant aux chatbots des questions d’examen de premier cycle en informatique, en mathématiques et en physique.
Les chatbots obtiennent de très bons résultats, répondant efficacement à toutes les questions de physique. ChatGPT renvoie le moins de réponses incorrectes dans l’ensemble.
Gemini dans Chrome : intégration transparente
Chrome intègre désormais Gemini. Les détenteurs de comptes payants peuvent cliquer sur l’icône Gemini pour ouvrir une fenêtre de chat, interagissant avec Gemini comme d’habitude et interrogeant le contenu de l’onglet actif. L’intégration de Gemini dans Chrome permet aux utilisateurs d’éliminer le besoin d’ouvrir un nouvel onglet pour demander quelque chose à Gemini grâce à une fonctionnalité semblable à Copilot Vision dans Edge, bien que la fonction Live de Gemini ne soit pas disponible dans son interface web.
Les réponses textuelles sont étonnamment rapides. La vitesse des réponses me fait me demander si Gemini a un certain niveau d’accès aux pages web avant que vous ne les partagiez avec lui.
Bien que Gemini dans Chrome ait quelques limitations ; Gemini ne peut pas comprendre les vidéos, et les réponses avec Live ne sont pas aussi rapides qu’elles le sont par texte, il est globalement utile en ce qu’il élimine le besoin de copier-coller. Cependant, à moins que vous n’utilisiez Gemini tout le temps, le temps que vous gagnez en l’ayant à portée de clic n’est peut-être pas si important. La fonctionnalité Live est également utile, me permettant de poser des questions sur ce que je regarde sans avoir à toucher un clavier.
Gemini dans Chrome a quelques restrictions sur ce qu’il peut voir et comprendre. Par conséquent, Gemini peut se sentir intrusif : Gemini peut voir et répondre aux questions concernant certains onglets une fois que vous les avez partagés.
Intégration des applications Google : productivité accrue
Les abonnés au plan AI Pro bénéficient des fonctionnalités d’IA dans toutes les applications Google, notamment Agenda, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets et YouTube Music.
Google met en évidence les intégrations sur le propre site de Gemini. Vous pouvez ajouter des événements à Google Agenda à partir d’un dépliant, générer des listes d’épicerie dans Google Keep ou laisser Gemini créer des listes de lecture dans YouTube Music. Gemini dans Docs, Gmail, Sheets et Slides ressemble à Copilot dans les applications Microsoft 365, créant des diapositives basées sur des invites, rédigeant des courriels, générant du texte et suggérant des formules.
Gemini dans Gmail se distingue, accordant à Gemini un accès complet à votre historique de courriels, lui permettant de rechercher des informations spécifiques ou de fournir des conseils de nettoyage de la boîte de réception. Cependant, ce n’est pas une fonctionnalité toute-puissante. Gemini ne peut pas tout faire. Cette intégration se sent comme une atteinte à la vie privée.
Selon le degré auquel vous utilisez les intégrations disponibles de Gemini ; il peut ne pas y en avoir qui répondent à vos demandes spécifiques. Cependant, cela peut être bénéfique en raison de la multitude de fonctionnalités.
Gems : experts en IA personnalisés
Les Gems sont des versions personnalisées de Gemini adaptées à des fins spécifiques. Les instructeurs peuvent ajouter des fichiers et créer un PC Builder Gem pour aider les constructeurs d’ordinateurs débutants.
Les réponses sont légèrement différentes de celles obtenues en parlant à Gemini. Ceux qui prévoient de parler à Gemini d’un sujet précis peuvent créer un Gem. Cependant, les Gems n’ont pas l’impression de tenir vraiment la promesse de Google.
Sécurité et confidentialité
Gemini n’est pas conscient et ne peut pas penser ou comprendre les choses comme un humain.
Le contenu pour adultes, les activités illégales, les images réalistes de personnes et les sujets tabous sont contraires aux politiques de Gemini. Gemini est le plus laxiste avec son système de filtrage.
Gemini a une fenêtre de contexte. La fenêtre de contexte de Gemini sur son forfait AI Pro peut gérer jusqu’à 1 500 pages de texte ou 30 000 lignes de code à la fois avec le forfait payant. Les abonnés peuvent rencontrer des obstacles si la version gratuite est utilisée de manière intensive.
Google recueille des données lorsque vous utilisez Gemini, notamment des fichiers, des informations de localisation, l’utilisation des produits et des conversations. Ces données sont utilisées pour améliorer les produits Google et les technologies d’apprentissage automatique.
Les utilisateurs peuvent désactiver l’activité des applications Gemini. Par défaut, Google stocke les données de conversation pendant 18 mois.
En ce qui concerne les intégrations Google Workspace de Gemini, telles que dans Gmail, Docs, Drive, Sheets et Slides, Google promet de ne pas utiliser les modèles entraînés, de ne pas les vendre ou de ne pas les utiliser pour des publicités ciblées.
Google a connu dans le passé des problèmes qui incluent des acteurs malveillants qui ont exploité des failles de Google Chrome, des régulateurs italiens qui ont cité Google pour ses pratiques en matière de données et la collecte de données sans consentement entraînant des pertes de milliards de dollars. Par conséquent, il est recommandé de ne pas partager de données sensibles.