Doroczna konferencja dla programistów Google I/O, dwudniowe wydarzenie w dniach 20-21 maja, posłużyło jako platforma do zaprezentowania przyszłości Gemini i jego integracji z różnymi aspektami życia codziennego. Reflektory skierowane były bezpośrednio na sztuczną inteligencję, a Gemini przejął prowadzenie.
Rozszerzająca się obecność Gemini
Volvo integruje Gemini w swoich pojazdach
Volvo ogłosiło plany włączenia Gemini do swoich samochodów, umożliwiając kierowcom prowadzenie rozmów ze sztuczną inteligencją, pozostając jednocześnie skupionym na drodze. Ta integracja pozwala kierowcom używać poleceń głosowych do wysyłania wiadomości, tłumaczenia ich na różne języki, konsultowania się z instrukcją obsługi samochodu lub uzyskiwania informacji o miejscu docelowym.
Google zamierza wprowadzić Gemini AI do pojazdów z Android Auto w nadchodzących miesiącach, a następnie do samochodów z wbudowanym Google jeszcze w tym roku. Volvo, ze swoimi pojazdami wyposażonymi w wbudowany Google, będzie jednym z pierwszych, które doświadczą tej integracji.
Integracja Gemini w Chrome
Google pogłębia połączenie między swoją sztuczną inteligencją a przeglądarką, wprowadzając Gemini do Chrome na komputerach stacjonarnych dla użytkowników anglojęzycznych. Dostęp do tej funkcji wymaga subskrypcji Google AI Pro (19,99 USD miesięcznie) lub Google AI Ultra (249,99 USD miesięcznie). Dzięki tej integracji użytkownicy mogą łatwo poprosić Gemini o wyjaśnienie złożonych informacji lub podsumowanie treści na dowolnej stronie internetowej. Przyszłe wersje umożliwią Gemini pracę na wielu kartach i nawigację do witryn internetowych w imieniu użytkownika.
Gemini Live: Interaktywne quizy
Gemini ma możliwość generowania interaktywnych quizów. Podczas odpowiadania system oferuje natychmiastową informację zwrotną, wskazując obszary wymagające dalszej nauki. Tę funkcję można znaleźć zarówno na platformach stacjonarnych, jak i mobilnych. Studenci w USA, Brazylii, Indonezji, Japonii i Wielkiej Brytanii mają prawo do bezpłatnego ulepszenia Gemini w roku akademickim.
Spersonalizowane inteligentne odpowiedzi
Subskrybenci Google Workspace są gotowi na otrzymanie pakietu ulepszeń w Gmailu, w tym spersonalizowanych inteligentnych odpowiedzi, które dostosowują się do „twojego typowego tonu" oraz opcji „czyszczenia skrzynki odbiorczej" w celu automatyzacji zarządzania pocztą. W nadchodzącym kwartale subskrybenci będą również mieli możliwość ograniczenia pomocy w pisaniu Gemini do określonych dokumentów.
Gemini Camera i udostępnianie ekranu
Google wprowadził możliwości udostępniania ekranu i wideo na żywo dla Gemini Live, odpowiedzi na tryb głosowy ChatGPT. Ta funkcja pozwala użytkownikom zadawać pytania dotyczące tego, co jest wyświetlane na ich ekranie, początkowo dostępne dla użytkowników aplikacji Gemini z Pixel 9 i Galaxy S25. Google ogłosił na I/O, że jest dostępne dla wszystkich użytkowników Androida i iOS za pośrednictwem aplikacji Gemini.
Narzędzia i funkcje oparte na sztucznej inteligencji
Project Astra: Asystent AI następnej generacji
Project Astra, zaprezentowany na I/O 2024, został zaprojektowany jako asystent AI następnej generacji, który może postrzegać otaczający Cię świat. Astra została zintegrowana z kamerą i możliwościami udostępniania ekranu aplikacji Gemini. Google ulepszył wyjście głosowe Astry, aby było bardziej naturalne dzięki natywnemu audio, ulepszonej pamięci i dodanej kontroli komputera.
Jedna z demonstracji zilustrowała mężczyznę szukającego pomocy Astry w naprawie roweru, od znajdowania samouczków na YouTube i wyciągania szczegółów z e-maili po dzwonienie do warsztatu w celu zapytania o konkretną część.
Inna demonstracja pokazała uczennicę, która skierowała telefon na zadanie matematyczne i poprosiła Astrę o pomoc. Daje jej wskazówki i wraca do niej później, gdy student wraca do problemu. Pomimo faktu, że użytkownik sumiennie odrabia sam zadanie domowe, można zauważyć, że może to również pomóc dzieciom prześlizgnąć się przez zadanie bez odrabiania pracy.
Project Mariner: Upraszczanie banalnych zadań
Project Mariner ma na celu pomóc w czasochłonnych, ale stosunkowo prostych zadaniach. W filmie wprowadzającym menedżer projektu Google prosi Marinera o pobranie listy firm, które wpisała do Arkuszy Google, i znalezienie ich danych kontaktowych. Aktualizacje z ostatnich kilku miesięcy oznaczają, że Mariner może teraz obsługiwać do 10 różnych zadań jednocześnie. Ci agenci mogą pomóc Ci w wyszukiwaniu informacji, dokonywaniu rezerwacji, kupowaniu rzeczy, przeprowadzaniu badań i nie tylko. Na razie jest ograniczony do planu Google AI Ultra za 250 USD miesięcznie w USA, ale dostęp rozszerzy się w ciągu roku.
Jules: Autonomiczny agent kodowania
Google udostępnia wersję beta swojego agenta kodowania Julesa. Jules wykorzystuje Gemini 2.5 Pro i może wykonywać zadania, takie jak pisanie testów, tworzenie nowych funkcji, naprawianie błędów i dostarczanie dzienników zmian audio. Działa w tle i pozostaje aktywny, dopóki nie będzie gotowy do sprawdzenia jego pracy. Chociaż obecnie jest bezpłatny, Google planuje pobierać za niego opłaty, gdy „platforma dojrzeje".
Flow: Filmowanie oparte na sztucznej inteligencji
Flow to narzędzie do tworzenia filmów oparte na sztucznej inteligencji, przeznaczone do pomocy początkującym filmowcom w modelach Veo, Imagen i Gemini. Zawiera sterowanie kamerą, narzędzie do tworzenia scen i bibliotekę treści Flow TV. Flow jest obecnie dostępny dla subskrybentów Google AI Pro i Google AI Ultra w USA; pierwszy otrzymuje 100 generacji miesięcznie, podczas gdy drugi otrzymuje najwyższe limity użytkowania i wczesny dostęp do Veo 3 z natywnym generowaniem dźwięku, wprowadzając dźwięki otoczenia i dialogi postaci bezpośrednio do tworzenia wideo. Klip otwierający pokazany na I/O został stworzony w całości za pomocą Veo 3.
Przeglądy wideo: Przekształcanie danych w wideo
NotebookLM wykorzystuje sztuczną inteligencję do organizowania dokumentów w przewodnik do nauki, a nawet podcast. Na I/O wprowadzono Video Overviews, które przekształcają zrzuty danych w filmy obsługujące „pliki PDF, zdjęcia i inne".
Tryb AI dla wszystkich
Google wprowadza narzędzia wspomagające wyszukiwanie oparte na sztucznej inteligencji do sposobu, w jaki pobierają informacje. Obejmuje to tryb AI dla wszystkich i wyniki wyszukiwania Google dostosowane do Twojej przeszłej aktywności w wyszukiwarce i sieci, w tym zawartość Twojej skrzynki Gmail ze spersonalizowanymi inteligentnymi odpowiedziami. Nowe opcje zakupów obejmują opcję wirtualnego przymierzania i agenta handlowego.
Automatyczne zmiany haseł w Chrome
Chrome już pomaga śledzić hasła i ostrzega, jeśli Twoje hasło zostało naruszone, jest słabe lub jest używane w usługach. Na I/O Google zaprezentował opcję „automatycznej zmiany hasła", która wyświetla monit o zmianę hasła w przeglądarce, gdy znajdzie naruszone hasło. Zmniejsza to tarcie i pomaga utrzymać bezpieczeństwo konta użytkownikom, bez konieczności przeszukiwania ustawień konta lub porzucania procesu w połowie. Spodziewaj się go w obsługiwanych witrynach internetowych jeszcze w tym roku.
Technologia rozszerzonej rzeczywistości (XR)
Inteligentne okulary Android XR
Android XR jest wciąż we wczesnej fazie rozwoju z obiecującym potencjałem sprzętowym wynikającym ze zmieniającego się nastawienia do inteligentnych okularów.
Urządzenie XReal Project Aura XR
XReal zaprezentował Project Aura, urządzenie rozszerzonej rzeczywistości (XR) stworzone dla platformy Android XR. Jest to drugie urządzenie Android XR firmy i jest to „optyczne przezroczyste (OST) urządzenie XR", które jest podłączone, lekkie i kinowe. Jest zasilany przez chipset Qualcomm Snapdragon XR „zoptymalizowany pod kątem przetwarzania przestrzennego".
Zestaw słuchawkowy Samsung Project Moohan XR
Project Moohan firmy Samsung, zestaw słuchawkowy korzystający z platformy Android XR, pojawi się jeszcze w tym roku. Dzięki Gemini urządzenie będzie „łatwiejsze w użyciu i bardziej wydajne dzięki zrozumieniu tego, co widzisz, i podejmowaniu działań w Twoim imieniu".
Firma współpracuje z markami takimi jak Gentle Monster i Warby Parker, aby tworzyć „stylowe okulary z Androidem XR". Kering Eyewear dołączy w przyszłości.
Inne godne uwagi ogłoszenia
Tłumaczenie mowy w czasie rzeczywistym w Google Meet
Google badał tłumaczenie na żywo w czacie wideo od kilku lat i ujawnił swoje „tłumaczenie mowy w Google Meet w czasie zbliżonym do rzeczywistego [dla] naturalnych, swobodnych rozmów". Tłumaczenia między angielskim i hiszpańskim są teraz dostępne w wersji beta, a w ciągu najbliższych kilku tygodni oczekuje się większej liczby języków, z dostępem dla kont firmowych jeszcze w tym roku.
Google Beam: Zmiana nazwy Project Starline
Project Starline, hiperrealistyczne rozwiązanie do wideokonferencji firmy, zostało przemianowane na Google Beam. „Wykorzystuje szereg kamer internetowych, aby uchwycić Cię z różnych kątów. Następnie wykorzystuje sztuczną inteligencję do łączenia tych strumieni wideo i renderowania Cię na wyświetlaczu pola świetlnego 3D — ze śledzeniem głowy z dokładnością do milimetra i przy 60 klatkach na sekundę". Google współpracuje z HP, aby wprowadzić na rynek pierwsze urządzenia Google Beam jeszcze w tym roku.
Plan Google AI Ultra
Dla zaawansowanych użytkowników AI Google oferuje teraz AI Ultra za 249,99 USD miesięcznie (po 50% zniżce przez pierwsze trzy miesiące) w USA. Plan obejmuje najwyższe limity użytkowania w Deep Research w aplikacji Gemini, generowanie wideo z Veo 2 i wczesny dostęp do modelu Veo 3 z 30 TB przestrzeni dyskowej. AI Ultra oferuje również nowe narzędzie do tworzenia filmów AI Flow i dostęp do Project Mariner.
Funkcje Androida 16
Android 16, kończący zastępowanie Asystenta Google przez Gemini Live, nie wymagające subskrypcji odgałęzienie platformy Gemini AI, rozszerzy się teraz na samochody, telewizory i zestawy słuchawkowe rozszerzonej rzeczywistości.
Android 16 obsługuje tryb zaawansowanej ochrony Google jako ustawienie na poziomie urządzenia. Pozwala to „aktywować najsilniejsze zabezpieczenia Google dla urządzeń mobilnych, zapewniając większy spokój ducha, że jesteś chroniony przed najbardziej wyrafinowanymi zagrożeniami", mówi Il-Sung Lee, Group Product Manager ds. bezpieczeństwa Androida.
Android 16 prezentuje nowy słownik projektowy o nazwie Material 3 Expressive, iterację projektu „Material You", który został wprowadzony w Androidzie 12 w 2021 roku. Wiceprezes Google ds. produktu i UX dla platformy Android, Mindy Brooks, opisuje go jako „bardziej płynne, naturalne i sprężyste animacje". Ponadto nowe funkcje to elementy sprzężenia dotykowego, takie jak „niezwykle satysfakcjonujące dudnienie haptyczne" podczas odrzucania powiadomienia.