Gemini в Chrome: взгляд в будущее Google

Интеграция Gemini в Chrome от Google знаменует собой, по-видимому, предварительный шаг к более агентоориентированной эре для технологического гиганта. Эта новая функция встраивает AI-помощника непосредственно в ваш браузер, позволяя ему "видеть" вашу онлайн-активность и предлагать резюме и ответы, связанные с контентом на вашем экране.

Утро с Gemini в Chrome

Мое экспериментирование с Gemini в Chrome, этой новой интеграцией, заняло мое утро. Вместо того, чтобы переходить в специальное веб-приложение чат-бота, простой щелчок по новому значку Gemini, удобно расположенному в правом верхнем углу Chrome, инициирует разговор. Определяющей характеристикой этой интеграции является способность браузера "видеть" контент, отображаемый на вашем экране при навигации в Интернете.

Эта интеграция поразила меня как первый шаг в грандиозном видении Google по созданию более агентоориентированного AI. Я часто испытывал тоску по функциональным возможностям, выходящим за рамки его текущих возможностей. В настоящее время доступ к Gemini в версии раннего доступа Chrome ограничен подписчиками AI Pro или AI Ultra, использующими Beta, Dev или Canary версии Chrome.

Мое первоначальное исследование включало использование Gemini для обобщения статей на The Verge. Он также распространился на раскрытие новостей, связанных с играми, на главной странице, где AI уместно осветил добавление Nintendo новых игр Game Boy в свою службу Switch Online, предстоящую экранизацию Elden Ring и значительное обновление Steam Deck от Valve.

Поле зрения Gemini ограничено тем, что отображается непосредственно на каждой веб-странице. Если вы хотите суммировать конкретный компонент на странице, например, раздел комментариев The Verge, его необходимо развернуть, прежде чем чат-бот предоставит ответ. Кроме того, Gemini может следить за вами через несколько вкладок, но собирает информацию только с одной вкладки за раз.

Для тех, кто не склонен к набору текста, Gemini в Chrome предлагает функцию "Live", доступную с помощью кнопки в правом нижнем углу диалогового окна. Активация этой функции позволяет вам устно задавать вопросы, на которые Gemini отвечает слышимо.

Я нашел это особенно полезным при просмотре видео на YouTube. Когда я смотрел, например, видео о ремонте ванной комнаты, я спросил: "Какой инструмент он использует?" Gemini ответил: "Похоже, он использует пневматический пистолет для крепления деревянных частей". Во время другого видео Gemini правильно идентифицировал конденсатор на материнской плате, а также пинцет и инструмент горячего воздуха, которые YouTuber использовал для его удаления. Он также имеет возможности предоставлять резюме видео и информацию о частях, которые вы пропустили, однако я обнаружил, что это не всегда правильно, если в видео нет помеченных глав.

Одним из наиболее полезных вариантов использования этой интеграции является извлечение Gemini рецептов из видео на YouTube, а это означает, что мне не нужно было записывать рецепты самостоятельно или искать ссылку в описании. Это также пригодилось, когда я попросил его указать водонепроницаемые сумки на странице поиска Amazon.

Несоответствия и ограничения

Однако производительность Gemini не была без своих несоответствий. Когда AI спросили о местонахождении MrBeast во время видео, демонстрирующего его исследование древних городов майя, включая Чичен-Ицу, AI ответил: "У меня нет доступа к информации в режиме реального времени, поэтому я не могу точно определить текущее местоположение MrBeast". После перефразирования вопроса он точно указал местоположение, упомянутое в описании видео: Мексика. В другом случае, когда я искал ссылку для покупки конкретных плоскогубцев, представленных в видео, Gemini повторил отсутствие доступа к информации в режиме реального времени, включая списки продуктов или складские запасы магазинов. Несмотря на это ограничение, он охотно предоставлял ссылки на альтернативные продукты по запросу.

Временами длина ответов Gemini казалась несоразмерной ограниченному пространству, предоставляемому всплывающим окном в Chrome. Хотя окно можно расширить, оно значительно посягает на и без того ограниченное экранное пространство моего 13-дюймового MacBook Air. Основная привлекательность AI заключается в его способности ускорять задачи, предоставляя краткие и уместные ответы, обещание, которое Gemini не всегда выполняет, если только об этом не попросят явно. Кроме того, повторные последующие вопросы AI, спрашивающие, нужна ли мне дополнительная информация по определенной теме, стали несколько утомительными.

Путь к агентоориентированному AI

Несмотря на эти недостатки, легко представить, что Google расширит использование Gemini за рамки простых вопросов и ответов. Google хочет, чтобы его AI стал "агентоориентированным", что означает, что он может выполнять задачи от вашего имени, и Gemini в Chrome, похоже, однажды будет готов принять эти виды функций. Например, после того, как я попросил Gemini составить краткое описание меню ресторана, я даже подумал о том, чтобы попросить его сделать заказ на самовывоз — агентоориентированную задачу, которую он просто не может пока выполнить. В будущем я даже мог бы увидеть, как это пригодится, если бы он занес в закладки страницы, связанные с исследованием путешествий для меня, или, может быть, даже нашел и сохранил видео на YouTube с различными рецептами в мой плейлист "Смотреть позже".

Google, похоже, продвигается к реализации этого видения с помощью "Agent Mode" Project Mariner, запланированного для приложения Gemini. Эта функция позволит AI обрабатывать до 10 задач одновременно и самостоятельно искать в Интернете, что потенциально откроет путь для включения этих возможностей в Gemini в Chrome в будущем. Это приведет к более активному участию Gemini в веб-поисках и облегчит организацию задач и запросов.

Потенциальные будущие применения

Возможности для будущих приложений Gemini в Chrome огромны и убедительны. Представьте себе сценарий, в котором AI легко интегрируется с вашим опытом онлайн-покупок, активно определяя лучшие предложения, сравнивая цены в разных розничных магазинах и даже совершая покупку от вашего имени, и все это в соответствии с вашими заранее определенными предпочтениями и бюджетом. Этот уровень интеграции превратит онлайн-покупки из потенциально утомительной работы в упорядоченный и эффективный процесс.

Кроме того, рассмотрите потенциал Gemini для революции в онлайн-исследованиях. Вместо того, чтобы вручную просматривать бесчисленные статьи и веб-сайты, вы можете просто поручить Gemini собрать информацию по конкретной теме, указав желаемую глубину анализа, предпочтительные источники и формат, в котором вы хотите, чтобы информация была представлена. Затем Gemini может составить всеобъемлющий отчет, в комплекте с цитатами и резюме, экономя вам бесчисленные часы утомительных исследований.

В сфере производительности Gemini может стать вашим главным личным помощником, управляя вашим расписанием, определяя приоритеты ваших задач и даже составляя электронные письма и презентации на основе ваших инструкций. Представьте, что вы диктуете свои мысли и идеи Gemini, который затем преобразует их в отшлифованную и профессиональную презентацию, дополненную релевантными визуальными эффектами и данными. Это освободит вас от трудоемкой задачи создания презентаций с нуля, чтопозволит вам сосредоточиться на более стратегических аспектах вашей работы.

Для студентов Gemini может служить бесценным учебным ресурсом, предоставляя индивидуализированное обучение, отвечая на вопросы и даже помогая с исследовательскими заданиями. Представьте, что вы можете попросить Gemini объяснить сложную концепцию простыми словами или предоставить примеры и иллюстрации, чтобы помочь вам лучше понять материал. Это сделает обучение более увлекательным и эффективным и позволит студентам взять под контроль свое собственное образование.

Решение проблем и задач

Однако интеграция AI в нашу повседневную жизнь также вызывает законные опасения, которые необходимо решать на упреждающей основе. Одной из самых насущных проблем является потенциальная предвзятость в алгоритмах AI. Если данные, используемые для обучения этих алгоритмов, отражают существующие общественные предубеждения, AI может увековечить и даже усилить эти предубеждения. Крайне важно обеспечить, чтобы алгоритмы AI обучались на разнообразных и репрезентативных наборах данных, и чтобы они регулярно проверялись на предвзятость.

Еще одна проблема — потенциальное вытеснение рабочих мест, вызванное автоматизацией AI. Поскольку AI становится все более способным выполнять задачи, которые ранее выполнялись людьми, существует риск того, что многие рабочие места будут устранены. Чтобы смягчить этот риск, крайне важно инвестировать в программы образования и обучения, которые обеспечат работникам навыки, необходимые для процветания в эпоху AI. Это включает в себя развитие таких навыков, как критическое мышление, решение проблем и креативность, которые трудно воспроизвести AI.

Наконец, существуют этические соображения, касающиеся использования AI, особенно в таких областях, как конфиденциальность и безопасность. Крайне важно установить четкие принципы и правила, регулирующие разработку и развертывание AI, гарантируя, что он используется ответственным и этичным образом. Это включает в себя защиту конфиденциальности отдельных лиц, предотвращение неправомерного использования AI в злонамеренных целях и обеспечение прозрачности и подотчетности систем AI.

Будущее интеграции AI

Gemini в Chrome от Google — это многообещающий шаг к более интегрированному и интеллектуальному просмотру веб-страниц. Хотя текущая реализация имеет свои ограничения, она дает представление о потенциале AI для преобразования способов нашего взаимодействия с Интернетом. Поскольку технология AI продолжает развиваться, мы можем ожидать увидеть еще более сложные и бесшовные интеграции AI в нашу повседневную жизнь. Ключевым моментом будет упреждающее решение этических и социальных проблем, связанных с AI, гарантируя, что он используется на благо всего человечества.

Эволюция интеграции AI в браузеры, такие как Chrome, также требует переоценки существующих веб-стандартов и протоколов безопасности. Поскольку AI приобретает способность глубже интерпретировать веб-контент и взаимодействовать с ним, могут появиться новые уязвимости, которые могут быть использованы злоумышленниками. Поэтому крайне важно, чтобы разработчики браузеров и эксперты по безопасности сотрудничали в разработке новых мер безопасности, которые могли бы защитить пользователей от этих возникающих угроз. Это включает в себя усиление защиты от фишинговых атак, вредоносного ПО и других форм онлайн-мошенничества.

Кроме того, растущая зависимость от AI в браузерах также может привести к созданию новых форм цифрового разрыва. Люди, у которых нет доступа к высокоскоростному Интернету или передовым вычислительным устройствам, могут оказаться в невыгодном положении, поскольку они не смогут в полной мере использовать возможности браузеров на основе AI. Чтобы решить эту проблему, крайне важно инвестировать в улучшение инфраструктуры и программы цифровой грамотности, которые могут гарантировать, что каждый имеет возможность извлечь выгоду из достижений в технологии AI.

Кроме того, интеграция AI в браузеры может также оказать значительное влияние на рекламную индустрию. Поскольку AI лучше понимает предпочтения и поведение пользователей, его можно использовать для предоставления более таргетированной и персонализированной рекламы. Хотя это потенциально может привести к более релевантному и привлекательному рекламному опыту, это также вызывает опасения по поводу конфиденциальности и безопасности данных. Крайне важно, чтобы регулирующие органы и заинтересованные стороны отрасли установили четкие принципы и правила, регулирующие использование AI в рекламе, гарантируя, что конфиденциальность пользователей защищена и что данные используются ответственно.