Gemini в Chrome: Бъдещето на Google

Интеграцията на Gemini в Chrome от Google бележи очевидна първа стъпка към по-автономна ера за технологичния гигант. Тази нова функция вгражда AI асистента директно в браузъра ви, позволявайки му да “вижда” вашата онлайн активност и да предлага резюмета и отговори, свързани със съдържанието на вашия екран.

Едно утро с Gemini в Chrome

Моите експерименти с Gemini в Chrome, тази нова интеграция, заеха цялата ми сутрин. Вместо да навигирам до специализираното уеб приложение на чатбота, просто щракване върху новата икона на Gemini, удобно разположена в горния десен ъгъл на Chrome, инициира разговор. Определящата характеристика на тази интеграция се крие в способността на браузъра да “вижда” съдържанието, показано на вашия екран, докато навигирате в интернет.

Тази интеграция ме порази като първоначална стъпка в голямата визия на Google за създаване на по-автономен AI. Често се оказвах, че копнея за функционалности отвъд настоящите му възможности. В момента достъпът до Gemini в ранната версия на Chrome е ограничен до абонатите на AI Pro или AI Ultra, използващи бета, Dev или Canary версии на Chrome.

Първоначалното ми проучване включваше използването на Gemini за обобщаване на статии в The Verge. То също така се простира до разкриването на новини, свързани с игрите, на началната страница, където AI уместно подчерта добавянето на нови Game Boy игри от Nintendo към своята Switch Online услуга, предстоящата филмова адаптация на Elden Ring и значителната актуализация на Steam Deck на Valve.

Зрителното поле на Gemini е ограничено до това, което се показва директно на всяка уеб страница. Ако искате да обобщите конкретен компонент на страница, като например секцията за коментари на The Verge, тя трябва да бъде разширена, преди чатботът да предостави отговор. Също така, Gemini може да ви следва през няколко раздела, но събира информация само от един раздел в даден момент.

За тези, които не са склонни да пишат, Gemini в Chrome предлага функцията “Live”, достъпна чрез бутон в долния десен ъгъл на диалоговия прозорец. Активирането на тази функция ви позволява да задавате въпроси устно, като Gemini отговаря звуково.

Установих, че това е особено полезно, когато гледам видеоклипове в YouTube. Когато гледах, например, видеоклип за преустройство на баня, попитах: “Какъв инструмент използва той?” Gemini отговори: “Изглежда, че използва пистолет за пирони, за да закрепи някои дървени парчета заедно.” По време на друг видеоклип Gemini правилно идентифицира кондензатор на дънна платка, заедно с пинсетите и инструмента за горещ въздух, които YouTuber използва, за да го премахне. Той също така има възможности да дава резюмета на видеоклипове и информация за части, които сте пропуснали, но открих, че това не винаги е правилно, ако видеоклипът няма обозначени глави.

Един от най-полезните случаи на употреба за тази интеграция е извличането на рецепти от Gemini от видеоклипове в YouTube, което означава, че не трябваше да записвам рецептите сам или да търся връзка в описанието. Също така ми беше полезно, когато го помолих да посочи водоустойчивите чанти на страница за търсене в Amazon.

Непоследователности и ограничения

Въпреки това, представянето на Gemini не мина без своите непоследователности. Когато бях подканен за местоположението на MrBeast по време на видеоклип, показващ неговото изследване на древни градове на маите, включително Чичен Ица, AI отговори: “Нямам достъп до информация в реално време, така че не мога да определя точното текущо местоположение на MrBeast.” След като префразирах въпроса, той точно цитира местоположението, споменато в описанието на видеоклипа: Мексико. В друг случай, когато търсех връзка за закупуване на конкретни клещи, показани във видеоклип, Gemini повтори липсата си на достъп до информация в реално време, включително продуктови обяви или стокови наличности. Въпреки това ограничение, той с готовност предостави връзки към алтернативни продукти при поискване.

Понякога дължината на отговорите на Gemini изглеждаше несъразмерна с ограниченото пространство, предоставено от изскачащия прозорец в Chrome. Докато прозорецът може да бъде разширен, той значително навлиза в вече ограниченото екранно пространство на моя 13-инчов MacBook Air. Основната привлекателност на AI се крие в способността му да ускори задачите чрез предоставяне на кратки и уместни отговори, обещание, което Gemini не винаги изпълнява, освен ако не бъде изрично подканен. Освен това повтарящите се последващи въпроси на AI, питащи дали искам допълнителна информация по определена тема, станаха донякъде уморителни.

Пътят към автономен AI

Въпреки тези недостатъци, лесно е да си представим, че Google ще разшири използването на Gemini отвъд простите въпроси и отговори. Google иска неговият AI да стане “автономен”, което означава, че може да изпълнява задачи от ваше име, а Gemini в Chrome изглежда готов един ден да възприеме тези видове функции. След като помолих Gemini да обобщи менюто на ресторант, например, дори помислих да го помоля да направи поръчка за вземане - автономна задача, която той просто не може да направи все още. В бъдеще дори бих могъл да си го представя полезен, като му позволя да запазва страници, свързани с изследване на пътувания за мен, или дори да намира и запазва видеоклипове на различни рецепти в моя плейлист “Гледай по-късно”.

Google изглежда напредва към реализирането на тази визия с “Режим на агент” на Project Mariner, предвиден за приложението Gemini. Тази функция ще даде възможност на AI да обработва до 10 задачи едновременно и независимо да търси в интернет, потенциално проправяйки пътя за включване на тези възможности в Gemini в Chrome в бъдеще. Това ще доведе до по-голямо участие на Gemini в търсения в интернет и ще улесни организирането на задачи и заявки.

Потенциални бъдещи приложения

Възможностите за бъдещи приложения на Gemini в Chrome са огромни и завладяващи. Представете си сценарий, в който AI безпроблемно се интегрира с вашето онлайн пазаруване, активно идентифицира най-добрите оферти, сравнява цените между различни търговци на дребно и дори завършва покупката от ваше име, докато се придържа към вашите предварително зададени предпочитания и бюджет. Това ниво на интеграция ще превърне онлайн пазаруването от потенциално досадна работа в рационализиран и ефикасен процес.

Освен това, помислете за потенциала на Gemini да революционизира онлайн изследванията. Вместо ръчно да пресявате безброй статии и уебсайтове, можете просто да възложите на Gemini да събира информация по конкретна тема, като посочите желаната дълбочина на анализ, предпочитаните източници и формата, в която искате да бъде представена информацията. След това Gemini може да състави изчерпателен отчет, пълен с цитати и резюмета, спестявайки ви безброй часове тромави изследвания.

В сферата на производителността Gemini може да се превърне във ваш върховен личен асистент, управляващ вашия график, приоритизиращ вашите задачи и дори изготвящ имейли и презентации въз основа на вашите инструкции. Представете си, че диктувате вашите мисли и идеи на Gemini, който след това ще ги превърне в полирана и професионална презентация, пълна със съответните визуални елементи и данни. Това ще ви освободи от отнемащата време задача да създавате презентации от нулата, което ще ви позволи да се съсредоточите върху по-стратегическите аспекти на вашата работа.

За студентите Gemini може да служи като безценен учебен ресурс, предоставяйки персонализирани уроци, отговаряйки на въпроси и дори помагайки с изследователски задачи. Представете си, че имате възможност да помолите Gemini да обясни сложна концепция с прости думи или да даде примери и илюстрации, за да ви помогне да разберете по-добре материала. Това ще направи ученето по-ангажиращо и ефективно и ще даде възможност на студентите да поемат контрол върху собственото си образование.

Разглеждане на опасения и предизвикателства

Въпреки това, интегрирането на AI в нашето ежедневие също поражда легитимни опасения, които трябва да бъдат разгледани проактивно. Едно от най-належащите опасения е потенциалът за пристрастия в AI алгоритмите. Ако данните, използвани за обучение на тези алгоритми, отразяват съществуващите обществени пристрастия, AI може да увековечи и дори да засили тези пристрастия. От решаващо значение е да се гарантира, че AI алгоритмите са обучени на разнообразни и представителни набори от данни и че те се одитират редовно за пристрастия.

Друго опасение е потенциалът за изместване на работни места, причинено от AI автоматизация. Тъй като AI става все по-способен да изпълнява задачи, които преди това са били извършвани от хора, съществува риск много работни места да бъдат елиминирани. За да се смекчи този риск, е от съществено значение да се инвестира в образователни и обучителни програми, които оборудват работниците с уменията, от които се нуждаят, за да процъфтяват в ерата на AI. Това включва насърчаване на умения като критично мислене, решаване на проблеми и креативност, които са трудни за възпроизвеждане от AI.

И накрая, има етични съображения относно използването на AI, особено в области като поверителност и сигурност. От решаващо значение е да се установят ясни насоки и разпоредби, регулиращи разработването и внедряването на AI, като се гарантира, че той се използва по отговорен и етичен начин. Това включва защита на поверителността на хората, предотвратяване на злоупотребата с AI за злонамерени цели и гарантиране, че AI системите са прозрачни и отговорни.

Бъдещето на AI интеграцията

Gemini в Chrome от Google е обещаваща стъпка към едно по-интегрирано и интелигентно изживяване при сърфиране. Въпреки че текущата имплементация има своите ограничения, тя предлага поглед към потенциала на AI да трансформира начина, по който взаимодействаме с уеб. Тъй като AI технологията продължава да се развива, можем да очакваме да видим още по-сложни и безпроблемни интеграции на AI в нашето ежедневие. Ключът ще бъде в проактивното справяне с етичните и социални предизвикателства, свързани с AI, като се гарантира, че той се използва в полза на човечеството като цяло.

Еволюцията на AI интеграцията в браузъри като Chrome също налага преоценка на съществуващите уеб стандарти и протоколи за сигурност. Тъй като AI придобива способността да интерпретира и
взаимодейства с уеб съдържание по-дълбоко, могат да се появят нови уязвимости, които могат да бъдат експлоатирани от злонамерени актьори. Ето защо е от решаващо значение разработчиците на браузъри и експертите по сигурността да си сътрудничат за разработването на нови мерки за сигурност, които могат да защитят потребителите от тези нововъзникващи заплахи. Това включва укрепване на защитата срещу фишинг атаки, зловреден софтуер и други форми на онлайн измами.

Освен това нарастващата зависимост от AI в браузърите може също да доведе до създаването на нови форми на цифрово разделение. Хората, които нямат достъп до високоскоростен интернет или усъвършенствани компютърни устройства, могат да бъдат в неравностойно положение, тъй като няма да могат да използват пълноценно възможностите на браузърите, захранвани от AI. За да се справим с този проблем, е от съществено значение да се инвестира в подобрения на инфраструктурата и програми за цифрова грамотност, които могат да гарантират, че всеки има възможност да се възползва от напредъка в AI технологията.

В допълнение, интегрирането на AI в браузърите може също да окаже значително влияние върху рекламната индустрия. Тъй като AI става по-добър в разбирането на предпочитанията и поведението на потребителите, той може да бъде използван за предоставяне на по-целенасочени и персонализирани реклами. Въпреки че това потенциално може да доведе до по-подходящо и ангажиращо рекламно изживяване, то също така повдига опасения относно поверителността и сигурността на данните. От решаващо значение е регулаторните органи и заинтересованите страни в индустрията да установят ясни насоки и разпоредби, регулиращи използването на AI в рекламата, като се гарантира, че поверителността на потребителите е защитена и че данните се използват отговорно.