Gemini in Chrome: Uno sguardo al futuro di Google

L’integrazione di Gemini in Chrome da parte di Google rappresenta un passo preliminare verso un’era più autonoma per il gigante tecnologico. Questa nuova funzione integra l’assistente AI direttamente nel browser, consentendogli di “vedere” la tua attività online e offrire riassunti e risposte relativi al contenuto sullo schermo.

Una mattinata con Gemini in Chrome

La mia sperimentazione con Gemini in Chrome, questa nuova integrazione, ha occupato la mia mattinata. Invece di navigare verso l’applicazione web dedicata del chatbot, un semplice clic sulla nuova icona di Gemini, comodamente situata nell’angolo in alto a destra di Chrome, avvia una conversazione. La caratteristica distintiva di questa integrazione risiede nella capacità del browser di “vedere” il contenuto visualizzato sullo schermo mentre navighi sul web.

Questa integrazione mi è sembrata un primo passo nella grande visione di Google di creare un’AI più “agentic”. Mi sono spesso ritrovato a desiderare funzionalità che andassero oltre le sue capacità attuali. Attualmente, l’accesso alla versione di accesso anticipato di Gemini in Chrome è limitato agli abbonati a AI Pro o AI Ultra, utilizzando le versioni Beta, Dev o Canary di Chrome.

La mia esplorazione iniziale ha comportato l’utilizzo di Gemini per riassumere articoli su The Verge. Si è esteso anche alla scoperta di notizie relative ai giochi sulla homepage, dove l’AI ha opportunamente evidenziato l’aggiunta di nuovi giochi per Game Boy da parte di Nintendo al suo servizio Switch Online, l’imminente adattamento cinematografico di Elden Ring e l’importante aggiornamento Steam Deck di Valve.

Il campo visivo di Gemini è limitato a ciò che viene visualizzato direttamente su ciascuna pagina web. Se desideri riassumere componenti specifici su una pagina, come la sezione commenti di The Verge, è necessario espanderla prima che il chatbot fornisca una risposta. Inoltre, Gemini può seguirti attraverso diverse schede, ma raccoglie informazioni solo da una scheda alla volta.

Per coloro che non sono inclini a digitare, Gemini in Chrome offre una funzione “Live”, accessibile tramite un pulsante nell’angolo in basso a destra della finestra di dialogo. L’attivazione di questa funzione ti consente di porre domande verbalmente, con Gemini che risponde in modo udibile.

L’ho trovato particolarmente utile quando guardavo video di YouTube. Quando stavo guardando, ad esempio, un video sulla ristrutturazione del bagno, ho chiesto: “Che strumento sta usando?”. Gemini ha risposto: “Sembra che stia usando una pistola sparachiodi per fissare insieme alcuni pezzi di legno”. Durante un altro video, Gemini ha identificato correttamente un condensatore su una scheda madre, insieme alle pinzette e allo strumento ad aria calda che lo YouTuber ha usato per rimuoverlo. Ha anche la capacità di fornire riassunti dei video e informazioni sulle parti che hai saltato, tuttavia, ho scoperto che questo non è sempre corretto se un video non ha capitoli etichettati.

Uno dei casi d’uso più importanti per questa integrazione è Gemini che estrae ricette da video di YouTube, il che significa che non ho dovuto annotare le ricette da solo o cercare un collegamento nella descrizione. Mi è stato anche utile quando gli ho chiesto di indicare le borse impermeabili su una pagina di ricerca di Amazon.

Incoerenze e limitazioni

Tuttavia, la performance di Gemini non è stata priva di incoerenze. Quando gli è stato chiesto della posizione di MrBeast durante un video che mostrava la sua esplorazione di antiche città Maya, tra cui Chichén Itzá, l’AI ha risposto: “Non ho accesso a informazioni in tempo reale, quindi non posso individuare l’esatta posizione attuale di MrBeast”. Dopo aver riformulato la domanda, ha citato con precisione la posizione menzionata nella descrizione del video: Messico. In un’altra occasione, quando cercavo un collegamento per acquistare pinze specifiche presenti in un video, Gemini ha ribadito la sua mancanza di accesso a informazioni in tempo reale, inclusi elenchi di prodotti o inventari di negozi. Nonostante questa limitazione, ha fornito prontamente collegamenti a prodotti alternativi su richiesta.

A volte, la lunghezza delle risposte di Gemini sembrava sproporzionata rispetto allo spazio limitato offerto dalla finestra pop-up in Chrome. Sebbene la finestra possa essere espansa, invade in modo significativo lo spazio sullo schermo già limitato del mio MacBook Air da 13 pollici. Un’attrazione principale dell’AI risiede nella sua capacità di accelerare le attività fornendo risposte concise e pertinenti, una promessa che Gemini non sempre mantiene a meno che non venga richiesto esplicitamente. Inoltre, le ripetute domande di follow-up dell’AI, che chiedevano se desiderassi ulteriori informazioni su un argomento particolare, sono diventate un po’ stancanti.

Il percorso verso un’AI “agentic”

Nonostante queste carenze, è facile immaginare che Google espanda l’uso di Gemini oltre semplici domande e risposte. Google vuole che la sua AI diventi “agentic”, il che significa che può eseguire attività per tuo conto, e Gemini in Chrome sembra destinato un giorno ad adottare questo tipo di funzionalità. Dopo aver chiesto a Gemini di riassumere il menu di un ristorante, ad esempio, ho anche pensato di chiedergli di effettuare un ordine di ritiro, un compito “agentic” che semplicemente non può ancora fare. In futuro, potrei persino vederlo tornare utile facendogli aggiungere ai segnalibri pagine relative alla ricerca di viaggi per me, o magari anche trovando e salvando video di YouTube di diverse ricette nella mia playlist Guarda più tardi.

Google sembra avanzare verso la realizzazione di questa visione con la “Modalità Agente” di Project Mariner prevista per l’app Gemini. Questa funzione consentirà all’AI di gestire fino a 10 attività contemporaneamente e di cercare autonomamente sul web, aprendo potenzialmente la strada all’incorporazione di queste funzionalità in Gemini in Chrome in futuro. Ciò porterebbe a Gemini a essere più coinvolto nelle ricerche sul web, rendendo più facile organizzare attività e query.

Potenziali applicazioni future

Le possibilità per le future applicazioni di Gemini all’interno di Chrome sono vaste e avvincenti. Immagina uno scenario in cui l’AI si integra perfettamente con la tua esperienza di shopping online, identificando in modo proattivo le migliori offerte, confrontando i prezzi tra diversi rivenditori e persino completando l’acquisto per tuo conto, il tutto aderendo alle tue preferenze e al tuo budget predefiniti. Questo livello di integrazione trasformerebbe lo shopping online da un compito potenzialmente noioso in un processo semplificato ed efficiente.

Inoltre, considera il potenziale di Gemini per rivoluzionare la ricerca online. Invece di setacciare manualmente innumerevoli articoli e siti web, potresti semplicemente incaricare Gemini di raccogliere informazioni su un argomento specifico, specificando la profondità di analisi desiderata, le fonti preferite e il formato in cui desideri che le informazioni vengano presentate. Gemini potrebbe quindi compilare un rapporto completo, completo di citazioni e riassunti, risparmiandoti innumerevoli ore di ricerca noiosa.

Nel campo della produttività, Gemini potrebbe diventare il tuo assistente personale definitivo, gestendo i tuoi impegni, dando priorità alle tue attività e persino redigendo e-mail e presentazioni in base alle tue istruzioni. Immagina di dettare i tuoi pensieri e le tue idee a Gemini, che poi li trasformerebbe in una presentazione raffinata e professionale, completa di elementi visivi e dati pertinenti. Questo ti libererebbe dal compito che richiede tempo di creare presentazioni da zero, permettendoti di concentrarti sugli aspetti più strategici del tuo lavoro.

Per gli studenti, Gemini potrebbe fungere da risorsa di apprendimento inestimabile, fornendo tutoraggio personalizzato, rispondendo a domande e persino assistendo con compiti di ricerca. Immagina di poter chiedere a Gemini di spiegare un concetto complesso in termini semplici o di fornire esempi e illustrazioni per aiutarti a capire meglio il materiale. Ciò renderebbe l’apprendimento più coinvolgente ed efficace e consentirebbe agli studenti di prendere il controllo della propria istruzione.

Affrontare preoccupazioni e sfide

Tuttavia, l’integrazione dell’IA nella nostra vita quotidiana solleva anche legittime preoccupazioni che devono essere affrontate in modo proattivo. Una delle preoccupazioni più urgenti è il potenziale di parzialità negli algoritmi di IA. Se i dati utilizzati per addestrare questi algoritmi riflettono i pregiudizi sociali esistenti, l’IA potrebbe perpetuare e persino amplificare questi pregiudizi. È fondamentale garantire che gli algoritmi di IA siano addestrati su set di dati diversi e rappresentativi e che siano regolarmente sottoposti a controlli per individuare pregiudizi.

Un’altra preoccupazione è il potenziale per lo spostamento di posti di lavoro causato dall’automazione dell’IA. Man mano che l’IA diventa sempre più capace di svolgere compiti che prima venivano svolti dagli esseri umani, c’è il rischio che molti posti di lavoro vengano eliminati. Per mitigare questo rischio, è essenziale investire in programmi di istruzione e formazione che forniscano ai lavoratori le competenze di cui hanno bisogno per prosperare nell’era dell’IA. Ciò include la promozione di competenze come il pensiero critico, la risoluzione dei problemi e la creatività, che sono difficili da replicare per l’IA.

Infine, ci sono considerazioni etiche sull’uso dell’IA, in particolare in aree come la privacy e la sicurezza. È fondamentale stabilire linee guida e regolamenti chiari che disciplinano lo sviluppo e l’implementazione dell’IA, garantendo che venga utilizzata in modo responsabile ed etico. Ciò include la protezione della privacy degli individui, la prevenzione dell’uso improprio dell’IA per scopi dannosi e la garanzia che i sistemi di IA siano trasparenti e responsabili.

Il futuro dell’integrazione dell’IA

Gemini in Chrome di Google è un passo promettente verso un’esperienza di navigazione più integrata e intelligente. Sebbene l’attuale implementazione abbia i suoi limiti, offre uno sguardo al potenziale dell’IA per trasformare il modo in cui interagiamo con il web. Mentre la tecnologia dell’IA continua a evolversi, possiamo aspettarci di vedere integrazioni ancora più sofisticate e fluide dell’IA nella nostra vita quotidiana. La chiave sarà affrontare in modo proattivo le sfide etiche e sociali associate all’IA, garantendo che venga utilizzata a beneficio dell’umanità nel suo insieme.

L’evoluzione dell’integrazione dell’IA in browser come Chrome richiede anche una rivalutazione degli standard web e dei protocolli di sicurezza esistenti. Man mano che l’IA acquisisce la capacità di interpretare e interagire più a fondo con i contenuti web, potrebbero emergere nuove vulnerabilità che potrebbero essere sfruttate da malintenzionati. Pertanto, è fondamentale che gli sviluppatori dei browser e gli esperti di sicurezza collaborino allo sviluppo di nuove misure di sicurezza che possano proteggere gli utenti da queste minacce emergenti. Ciò include il rafforzamento delle difese contro attacchi di phishing, malware e altre forme di frode online.

Inoltre