Gemini w Chrome: Przyszłość Asystenta Google

Integracja Gemini z Chrome wydaje się wstępnym krokiem w kierunku ery bardziej agentowych rozwiązań firmy Google. Ta nowa funkcja osadza asystenta AI bezpośrednio w przeglądarce, umożliwiając mu „widzenie” Twojej aktywności online i oferowanie podsumowań oraz odpowiedzi związanych z zawartością ekranu.

Poranek z Gemini w Chrome

Moje eksperymenty z Gemini w Chrome, tą nowatorską integracją, zajęły mi cały poranek. Zamiast przechodzić do dedykowanej aplikacji internetowej chatbota, wystarczyło proste kliknięcie nowej ikony Gemini, wygodnie umieszczonej w prawym górnym rogu Chrome, aby rozpocząć rozmowę. Charakterystyczną cechą tej integracji jest zdolność przeglądarki do „widzenia” treści wyświetlanych na ekranie podczas nawigacji po Internecie.

Ta integracja wydała mi się początkowym krokiem w wielkiej wizji Google stworzenia bardziej agentowego AI. Często tęskniłem za funkcjami wykraczającymi poza jego obecne możliwości. Obecnie dostęp do wczesnej wersji Gemini w Chrome jest ograniczony do subskrybentów AI Pro lub AI Ultra, korzystających z wersji Beta, Dev lub Canary Chrome.

Moja początkowa eksploracja obejmowała wykorzystanie Gemini do podsumowywania artykułów na The Verge. Rozszerzyła się również na odkrywanie wiadomości związanych z grami na stronie głównej, gdzie AI trafnie podkreśliła dodanie przez Nintendo nowych gier Game Boy do swojej usługi Switch Online, nadchodzącą adaptację filmową Elden Ring i znaczącą aktualizację Steam Deck od Valve.

Pole widzenia Gemini ogranicza się do tego, co jest wyświetlane bezpośrednio na każdej stronie internetowej. Jeśli chcesz podsumować określony komponent na stronie, taki jak sekcja komentarzy The Verge, należy go rozwinąć przed udzieleniem odpowiedzi przez chatbota. Ponadto Gemini może podążać za Tobą przez kilka kart, ale zbiera informacje tylko z jednej karty naraz.

Dla tych, którzy nie lubią pisać, Gemini w Chrome oferuje funkcję „Na żywo”, dostępną za pomocą przycisku w prawym dolnym rogu okna dialogowego. Aktywowanie tej opcji pozwala na zadawanie pytań ustnie, a Gemini odpowiada dźwiękowo.

Uważam, że jest to szczególnie pomocne podczas oglądania filmów na YouTube. Kiedy oglądałem na przykład film o remoncie łazienki, zapytałem: „Jakiego narzędzia on używa?”. Gemini odpowiedział: „Wygląda na to, że używa gwoździarki do mocowania elementów drewnianych”. Podczas innego filmu Gemini poprawnie zidentyfikował kondensator na płycie głównej, a także pęsetę i narzędzie do gorącego powietrza, których YouTuber użył do jego usunięcia. Ma również możliwość tworzenia podsumowań filmów i informacji o pominiętych częściach, jednak odkryłem, że nie zawsze jest to poprawne, jeśli film nie ma oznaczonych rozdziałów.

Jednym z najbardziej przydatnych zastosowań tej integracji jest pobieranie przez Gemini przepisów z filmów na YouTube, co oznacza, że nie musiałem sam spisywać przepisów ani szukać linku w opisie. Przydatne okazało się również poproszenie go o wskazanie wodoodpornych toreb na stronie wyszukiwania Amazon.

Niejasności i ograniczenia

Jednak wydajność Gemini nie była pozbawiona niejasności. Zapytany o lokalizację MrBeasta podczas filmu przedstawiającego jego eksplorację starożytnych miast Majów, w tym Chichén Itzá, AI odpowiedział: „Nie mam dostępu do informacji w czasie rzeczywistym, więc nie mogę dokładnie określić aktualnej lokalizacji MrBeasta”. Po przeformułowaniu pytania dokładnie zacytował lokalizację wspomnianą w opisie filmu: Meksyk. Innym razem, szukając linku do zakupu konkretnych szczypiec przedstawionych w filmie, Gemini powtórzył swój brak dostępu do informacji w czasie rzeczywistym, w tym list produktów lub zapasów sklepów. Pomimo tego ograniczenia chętnie dostarczył linki do alternatywnych produktów na żądanie.

Czasami długość odpowiedzi Gemini wydawała się nieproporcjonalna do ograniczonej przestrzeni zapewnianej przez wyskakujące okienko w Chrome. Chociaż okno można rozwinąć, znacznie zmniejsza ono i tak ograniczoną przestrzeń ekranową mojego 13-calowego MacBooka Air. Główną atrakcją AI jest jego zdolność do przyspieszania zadań poprzez dostarczanie zwięzłych i trafnych odpowiedzi, obietnica, której Gemini nie zawsze spełnia, chyba że zostanie wyraźnie poproszony. Ponadto powtarzające się pytania uzupełniające AI, pytające, czy życzę sobie dodatkowych informacji na dany temat, stały się nieco męczące.

Ścieżka do agentowego AI

Pomimo tych niedociągnięć łatwo wyobrazić sobie, że Google rozszerza wykorzystanie Gemini poza proste pytania i odpowiedzi. Google chce, aby jego AI stał się „agentowy”, co oznacza, że może wykonywać zadania w Twoim imieniu, a Gemini w Chrome wydaje się gotowy do przyjęcia tego rodzaju funkcji pewnego dnia. Po poproszeniu Gemini o podsumowanie menu restauracji, na przykład, pomyślałem nawet o poproszeniu go o złożenie zamówienia na odbiór - zadanie agentowe, którego po prostu jeszcze nie może wykonać. W przyszłości widzę, że przydałoby się to, gdybym miał umieścić zakładki na stronach związanych z badaniami podróży, a może nawet znaleźć i zapisać filmy z różnymi przepisami na YouTube na mojej liście „Do obejrzenia później”.

Wygląda na to, że Google zmierza do realizacji tej wizji dzięki “Trybowi Agenta” Project Mariner, przeznaczonemu dla aplikacji Gemini. Ta funkcja umożliwi AI obsługę do 10 zadań jednocześnie i niezależne przeszukiwanie sieci, potencjalnie torując drogę do włączenia tych możliwości do Gemini w Chrome w przyszłości. To doprowadziłoby do większego zaangażowania Gemini w wyszukiwanie w Internecie, a także ułatwiło organizowanie zadań i zapytań.

Potencjalne przyszłe zastosowania

Możliwości przyszłych zastosowań Gemini w Chrome są ogromne i fascynujące. Wyobraź sobie scenariusz, w którym AI płynnie integruje się z Twoimi zakupami online, proaktywnie identyfikując najlepsze oferty, porównując ceny u różnych sprzedawców, a nawet dokonując zakupu w Twoim imieniu, a wszystko to przy zachowaniu Twoich wcześniej zdefiniowanych preferencji i budżetu. Ten poziom integracji przekształciłby zakupy online z potencjalnie żmudnego obowiązku w usprawniony i wydajny proces.

Ponadto, weź pod uwagę potencjał Gemini do zrewolucjonizowania badań online. Zamiast ręcznego przeglądania niezliczonych artykułów i stron internetowych, możesz po prostu zlecić Gemini zgromadzenie informacji na określony temat, określając żądaną głębię analizy, preferowane źródła i format, w jakim chcesz, aby informacje były prezentowane. Gemini mógłby wówczas sporządzić kompleksowy raport, wraz z cytatami i podsumowaniami, oszczędzając Ci niezliczone godziny żmudnych badań.

W dziedzinie produktywności Gemini mógłby stać się Twoim najlepszym osobistym asystentem, zarządzającym Twoim harmonogramem, ustalającym priorytety Twoich zadań, a nawet przygotowującym e-maile i prezentacje na podstawie Twoich instrukcji. Wyobraź sobie, że dyktujesz Gemini swoje myśli i pomysły, które następnie przekształca je w dopracowaną i profesjonalną prezentację, wraz z odpowiednimi wizualizacjami i danymi. To uwolniłoby Cię od czasochłonnego zadania tworzenia prezentacji od zera, pozwalając skupić się na bardziej strategicznych aspektach Twojej pracy.

Dla studentów Gemini mógłby służyć jako nieocenione źródło wiedzy, zapewniając spersonalizowane korepetycje, odpowiadając na pytania, a nawet pomagając w zadaniach badawczych. Wyobraź sobie, że możesz poprosić Gemini o wyjaśnienie złożonej koncepcji w prostych słowach lub o podanie przykładów i ilustracji, które pomogą Ci lepiej zrozumieć materiał. To sprawiłoby, że nauka byłaby bardziej wciągająca i skuteczna, a także umożliwiłaby studentom przejęcie kontroli nad własną edukacją.

Rozwiązywanie problemów i wyzwań

Jednak integracja AI z naszym codziennym życiem wzbudza również uzasadnione obawy, którymi należy zająć się proaktywnie. Jednym z najbardziej palących problemów jest potencjalne występowanie błędów w algorytmach AI. Jeśli dane wykorzystywane do szkolenia tych algorytmów odzwierciedlają istniejące uprzedzenia społeczne, AI może utrwalać, a nawet wzmacniać te uprzedzenia. Niezbędne jest zapewnienie, aby algorytmy AI były szkolone na różnorodnych i reprezentatywnych zestawach danych oraz aby były regularnie sprawdzane pod kątem błędów.

Kolejnym problemem jest potencjalne wypieranie miejsc pracy spowodowane automatyzacją AI. Wraz z tym, jak AI staje się coraz bardziej zdolna do wykonywania zadań, które wcześniej wykonywali ludzie, istnieje ryzyko, że wiele miejsc pracy zostanie zlikwidowanych. Aby złagodzić to ryzyko, niezbędne jest inwestowanie w programy edukacyjne i szkoleniowe, które wyposażają pracowników w umiejętności potrzebne im do rozwoju w erze AI. Obejmuje to rozwijanie umiejętności takich jak krytyczne myślenie, rozwiązywanie problemów i kreatywność, które są trudne do replikacji przez AI.

Wreszcie, istnieją względy etyczne dotyczące wykorzystania AI, szczególnie w obszarach takich jak prywatność i bezpieczeństwo. Niezbędne jest ustanowienie jasnych wytycznych i przepisów regulujących rozwój i wdrażanie AI, zapewniając, że jest ona wykorzystywana w sposób odpowiedzialny i etyczny. Obejmuje to ochronę prywatności osób fizycznych, zapobieganie niewłaściwemu wykorzystywaniu AI do celów złośliwych oraz zapewnienie, że systemy AI są przejrzyste i rozliczalne.

Przyszłość integracji AI

Gemini w Chrome od Google to obiecujący krok w kierunku bardziej zintegrowanego i inteligentnego przeglądania. Chociaż obecna implementacja ma swoje ograniczenia, oferuje wgląd w potencjał AI do przekształcenia sposobu, w jaki wchodzimy w interakcje z siecią. Wraz z dalszym rozwojem technologii AI możemy spodziewać się jeszcze bardziej zaawansowanych i bezproblemowych integracji AI z naszym codziennym życiem. Kluczem będzie proaktywne zajęcie się etycznymi i społecznymi wyzwaniami związanymi z AI, zapewniając, że jest ona wykorzystywana z korzyścią dla całej ludzkości.

Ewolucja integracji AI w przeglądarkach takich jak Chrome wymaga również ponownej oceny istniejących standardów internetowych i protokołów bezpieczeństwa. Wraz z tym, jak AI zyskuje zdolność do głębszego interpretowania i interakcji z zawartością Internetu, mogą pojawić się nowe luki, które mogą być wykorzystywane przez złośliwe podmioty. Dlatego też kluczowe jest, aby twórcy przeglądarek i eksperci ds. bezpieczeństwa współpracowali nad opracowaniem nowych środków bezpieczeństwa, które mogą chronić użytkowników przed tymi nowymi zagrożeniami. Obejmuje to wzmocnienie obrony przed atakami phishingowymi, złośliwym oprogramowaniem i innymi formami oszustw online.

Ponadto, rosnące poleganie na AI w przeglądarkach może również prowadzić do tworzenia nowych form podziału cyfrowego. Osoby, które nie mają dostępu do szybkiego Internetu lub zaawansowanych urządzeń komputerowych, mogą być w gorszej sytuacji, ponieważ nie będą w stanie w pełni wykorzystać możliwości przeglądarek zasilanych przez AI. Aby rozwiązać ten problem, niezbędne jest inwestowanie w ulepszenia infrastruktury i programy umiejętności cyfrowych, które mogą zapewnić, że każdy ma możliwość czerpania korzyści z postępów w technologii AI.

Dodatkowo, integracja AI z przeglądarkami może również mieć znaczący wpływ na branżę reklamową. Wraz z tym, jak AI staje się lepsza w rozumieniu preferencji i zachowań użytkowników, może być wykorzystywana do dostarczania bardziej ukierunkowanych i spersonalizowanych reklam. Chociaż potencjalnie może to prowadzić do bardziej istotnych i angażujących reklam, budzi również obawy dotyczące prywatności i bezpieczeństwa danych. Kluczowe jest, aby organy regulacyjne i zainteresowane strony z branży ustanowiły jasne wytyczne i przepisy regulujące wykorzystanie AI w reklamie, zapewniając ochronę prywatności użytkowników oraz odpowiedzialne wykorzystywanie danych.