Google’s integratie van Gemini in Chrome markeert wat lijkt op een eerste stap richting een meer agentisch tijdperk voor de techgigant. Deze nieuwe functie integreert de AI-assistent direct in je browser, waardoor deze je online activiteiten kan "zien" en samenvattingen en antwoorden kan bieden die gerelateerd zijn aan de inhoud op je scherm.
Een ochtend met Gemini in Chrome
Mijn experiment met Gemini in Chrome, deze nieuwe integratie, vulde mijn ochtend. In plaats van naar de speciale webapplicatie van de chatbot te navigeren, start een simpele klik op het nieuwe Gemini-icoon, handig geplaatst in de rechterbovenhoek van Chrome, een gesprek. Het bepalende kenmerk van deze integratie ligt in het vermogen van de browser om de inhoud die op je scherm wordt weergegeven te "zien" terwijl je op het web navigeert.
Deze integratie trof me als een eerste stap in Google’s grote visie om een meer agentische AI te creëren. Ik merkte vaak dat ik verlangde naar functionaliteiten buiten de huidige mogelijkheden. Momenteel is de toegang tot de vroege toegang versie van Gemini in Chrome beperkt tot abonnees van AI Pro of AI Ultra, die de Beta-, Dev- of Canary-versies van Chrome gebruiken.
Mijn eerste verkenning omvatte het gebruik van Gemini om artikelen op The Verge samen te vatten. Het strekte zich ook uit tot het ontdekken van gaming-gerelateerd nieuws op de homepage, waar de AI op treffende wijze Nintendo’s toevoeging van nieuwe Game Boy-spellen aan zijn Switch Online-service, de aanstaande Elden Ring-filmadaptatie en Valve’s significante Steam Deck-update benadrukte.
Gemini’s gezichtsveld is beperkt tot wat direct op elke webpagina wordt weergegeven. Als je een specifiek onderdeel op een pagina wilt samenvatten, zoals The Verge’s commentaarsectie, moet deze worden uitgebreid voordat de chatbot een antwoord geeft. Ook kan Gemini je door verschillende tabbladen volgen, maar verzamelt slechts informatie van één tabblad tegelijk.
Voor degenen die niet geneigd zijn te typen, biedt Gemini in Chrome een "Live"-functie, toegankelijk via een knop in de rechteronderhoek van het dialoogvenster. Activering hiervan stelt je in staat om verbaal vragen te stellen, waarbij Gemini hoorbaar antwoordt.
Ik vond dit vooral handig bij het bekijken van YouTube-video’s. Toen ik bijvoorbeeld een video over het verbouwen van een badkamer bekeek, vroeg ik: "Welk gereedschap gebruikt hij?" Gemini antwoordde: "Het lijkt erop dat hij een spijkerpistool gebruikt om houten stukken aan elkaar te bevestigen." Tijdens een andere video identificeerde Gemini correct een condensator op een moederbord, samen met de pincet en het heteluchtgereedschap dat de YouTuber gebruikte om het te verwijderen. Het heeft ook de mogelijkheden om samenvattingen van video’s en informatie over delen die je hebt overgeslagen te geven, maar ik ontdekte dat dit niet altijd klopt als een video geen gelabelde hoofdstukken heeft.
Een van de meest bruikbare toepassingen voor deze integratie is dat Gemini recepten uit YouTube-video’s haalt, wat betekent dat ik de recepten niet zelf hoefde op te schrijven of naar een link in de beschrijving hoefde te zoeken. Het kwam ook van pas toen ik het vroeg om de waterdichte tassen op een Amazon-zoekpagina aan te wijzen.
Inconsistenties en beperkingen
De prestaties van Gemini waren echter niet zonder inconsistenties. Toen hem werd gevraagd naar de locatie van MrBeast tijdens een video waarin hij zijn verkenning van oude Maya-steden liet zien, waaronder Chichén Itzá, antwoordde de AI: "Ik heb geen toegang tot real-time informatie, dus ik kan MrBeast’s exacte huidige locatie niet aanwijzen." Na het herformuleren van de vraag citeerde het nauwkeurig de locatie die in de beschrijving van de video werd genoemd: Mexico. Bij een andere gelegenheid, toen ik op zoek was naar een link om een specifieke tang te kopen die in een video te zien was, herhaalde Gemini zijn gebrek aan toegang tot real-time informatie, inclusief productlijsten of winkelvoorraden. Ondanks deze beperking bood het op verzoek wel links naar alternatieve producten aan.
Soms leek de lengte van Gemini’s antwoorden onevenredig met de beperkte ruimte die door het pop-upvenster in Chrome werd geboden. Hoewel het venster kan worden uitgebreid, maakt het aanzienlijk inbreuk op de toch al beperkte schermruimte van mijn 13-inch MacBook Air. Een primaire aantrekkingskracht van AI ligt in het vermogen om taken te versnellen door beknopte en relevante antwoorden te leveren, een belofte die Gemini niet altijd nakomt, tenzij expliciet gevraagd. Bovendien werden de repetitieve vervolgvragen van de AI, waarin werd gevraagd of ik aanvullende informatie over een bepaald onderwerp wenste, enigszins vermoeiend.
Het pad naar een agentische AI
Ondanks deze tekortkomingen is het gemakkelijk om je voor te stellen dat Google het gebruik van Gemini uitbreidt tot meer dan eenvoudige vragen en antwoorden. Google wil dat zijn AI "agentisch" wordt, wat betekent dat het taken namens jou kan uitvoeren, en Gemini in Chrome lijkt klaar om op een dag dit soort functies over te nemen. Nadat ik Gemini had gevraagd om het menu van een restaurant samen te vatten, dacht ik er zelfs over om het een afhaalbestelling te laten plaatsen - een agentische taak die het nog niet kan. In de toekomst zou ik het zelfs handig kunnen vinden door het pagina’s met betrekking tot reisonderzoek te laten bookmarken, of misschien zelfs YouTube-video’s van verschillende recepten te laten vinden en opslaan in mijn Watch Later-afspeellijst.
Google lijkt voortgang te boeken in de richting van het realiseren van deze visie met Project Mariner’s "Agent Mode", die is gepland voor de Gemini-app. Deze functie zal de AI in staat stellen om maximaal 10 taken tegelijkertijd af te handelen en onafhankelijk op het web te zoeken, wat mogelijk de weg vrijmaakt voor het integreren van deze mogelijkheden in de toekomst in Gemini in Chrome. Dit zou ertoe leiden dat Gemini meer betrokken zou raken bij webzoekopdrachten, waardoor het gemakkelijker wordt om taken en vragen te organiseren.
Potentiële toekomstige toepassingen
De mogelijkheden voor Gemini’s toekomstige toepassingen binnen Chrome zijn enorm en overtuigend. Stel je een scenario voor waarin de AI naadloos integreert met je online winkelervaring, proactief de beste deals identificeert, prijzen van verschillende retailers vergelijkt en zelfs de aankoop namens jou voltooit, allemaal met inachtneming van je vooraf gedefinieerde voorkeuren en budget. Dit niveau van integratie zou online winkelen transformeren van een potentieel vervelende klus in een gestroomlijnd en efficiënt proces.
Overweeg verder het potentieel van Gemini om een revolutie teweeg te brengen in online onderzoek. In plaats van handmatig talloze artikelen en websites door te spitten, kun je Gemini simpelweg de opdracht geven om informatie over een specifiek onderwerp te verzamelen, waarbij je de gewenste diepgang van de analyse, de voorkeursbronnen en het formaat waarin je de informatie gepresenteerd wilt zien, specificeert. Gemini zou dan een alomvattend rapport kunnen samenstellen, compleet met citaten en samenvattingen, waardoor je talloze uren aan vervelend onderzoek bespaart.
Op het gebied van productiviteit kan Gemini je ultieme persoonlijke assistent worden, die je planning beheert, je taken prioriteert en zelfs e-mails en presentaties ontwerpt op basis van je instructies. Stel je voor dat je je gedachten en ideeën dicteert aan Gemini, dat ze vervolgens zou omzetten in een gepolijste en professionele presentatie, compleet met relevante visuals en gegevens. Dit zou je bevrijden van de tijdrovende taak om presentaties helemaal opnieuw te creëren, waardoor je je kunt concentreren op de meer strategische aspecten van je werk.
Voor studenten kan Gemini dienen als een onschatbare leerbron, die gepersonaliseerde bijlessen geeft, vragen beantwoordt en zelfs helpt bij onderzoekopdrachten. Stel je voor dat je Gemini kunt vragen om een complex concept in eenvoudige bewoordingen uit te leggen, of om voorbeelden en illustraties te geven om je te helpen het materiaal beter te begrijpen. Dit zou leren boeiender en effectiever maken, en zou studenten in staat stellen de controle over hun eigen onderwijs te nemen.
Bezorgdheden en uitdagingen aanpakken
De integratie van AI in ons dagelijks leven roept echter ook legitieme zorgen op die proactief moeten worden aangepakt. Een van de meest dringende zorgen is het potentieel voor vooringenomenheid in AI-algoritmen. Als de gegevens die worden gebruikt om deze algoritmen te trainen bestaande maatschappelijke vooroordelen weerspiegelen, kan de AI deze vooroordelen bestendigen en zelfs versterken. Het is cruciaal om ervoor te zorgen dat AI-algoritmen worden getraind op diverse en representatieve datasets, en dat ze regelmatig op vooringenomenheid worden gecontroleerd.
Een andere zorg is het potentiële banenverlies veroorzaakt door AI-automatisering. Naarmate AI steeds beter in staat is om taken uit te voeren die voorheen door mensen werden gedaan, bestaat het risico dat veel banen zullen verdwijnen. Om dit risico te beperken, is het essentieel om te investeren in onderwijs- en trainingsprogramma’s die werknemers de vaardigheden bieden die ze nodig hebben om te gedijen in het tijdperk van AI. Dit omvat het bevorderen van vaardigheden zoals kritisch denken, probleemoplossing en creativiteit, die moeilijk te repliceren zijn voor AI.
Ten slotte zijn er ethische overwegingen met betrekking tot het gebruik van AI, met name op gebieden als privacy en veiligheid. Het is cruciaal om duidelijke richtlijnen en voorschriften op te stellen voor de ontwikkeling en implementatie van AI, zodat ervoor wordt gezorgd dat het op een verantwoorde wijze gebuert. Dit omvat het beschermen van de privacy van individuen, het voorkomen van misbruik van AI voor kwaadaardige doeleinden en het ervoor zorgen dat AI-systemen transparant en verantwoordelijk zijn.
De toekomst van AI-integratie
Google’s Gemini in Chrome is een veelbelovende stap in de richting van een meer geïntegreerde en intelligente browserervaring. Hoewel de huidige implementatie zijn beperkingen heeft, biedt het een glimp van het potentieel van AI om de manier waarop we met het web omgaan te transformeren. Naarmate AI-technologie zich blijft ontwikkelen, kunnen we nog meer geavanceerde en naadloze integraties van AI in ons dagelijks leven verwachten. De sleutel zal zijn om de ethische en maatschappelijke uitdagingen die met AI gepaard gaan proactief aan te pakken, zodat ervoor wordt gezorgd dat het wordt gebruikt om de mensheid als geheel ten goede te komen.
De evolutie van AI-integratie in browsers zoals Chrome vereist ook een herevaluatie van bestaande webstandaarden en beveiligingsprotocollen. Naarmate AI het vermogen krijgt om web content dieper te interpreteren en ermee om te gaan, kunnen er nieuwe kwetsbaarheden ontstaan die kunnen worden misbruikt door kwaadwillende actoren. Daarom is het cruciaal voor browserontwikkelaars en beveiligingsexperts om samen te werken aan het ontwikkelen van nieuwe beveiligingsmaatregelen die gebruikers kunnen beschermen tegen deze opkomende bedreigingen. Dit omvat het versterken van de verdediging tegen phishing-aanvallen, malware en andere vormen van online fraude.
Bovendien kan de toenemende afhankelijkheid van AI in browsers ook leiden tot het ontstaan van nieuwe vormen van digitale kloof. Individuen die geen toegang hebben tot snel internet of geavanceerde computerapparatuur lopen mogelijk een achterstand op, omdat ze de mogelijkheden van AI-gestuurde browsers niet volledig kunnen benutten. Om dit probleem aan te pakken, is het essentieel om te investeren in verbeteringen aan de infrastructuur en programma’s voor digitale geletterdheid die ervoor kunnen zorgen dat iedereen de kans krijgt om te profiteren van de vorderingen op het gebied van AI-technologie.
Daarnaast kan de integratie van AI in browsers ook een aanzienlijke impact hebben op de reclame-industrie. Naarmate AI beter wordt in het