Расширенная память: универсальное обновление
Способность Gemini запоминать информацию о пользователе, такую как предпочтения, интересы и рабочие детали, больше не является эксклюзивной функцией для подписчиков Gemini Advanced. Эта функция, первоначально представленная в ноябре прошлого года, теперь доступна всем пользователям Gemini.
Это улучшение памяти позволяет пользователям предоставлять Gemini конкретные детали своей жизни. Это может быть что угодно: от вашего имени и имен членов вашей семьи до информации о конкретном проекте, над которым вы работаете. Основным преимуществом этой функции является ее эффективность. Вам больше не нужно будет повторно вводить одну и ту же информацию. Это приводит к более персонализированным и релевантным ответам от Gemini.
Google предоставил несколько примеров, иллюстрирующих, как пользователи могут использовать эту функцию:
- Языковые предпочтения: Укажите Gemini использовать простой язык, избегать технических жаргонизмов.
- Диетические ограничения: Сообщите Gemini о своих диетических предпочтениях, например, о том, что вы вегетарианец, чтобы избежать получения неподходящих предложений.
- Требования к переводу: Запросите, чтобы Gemini включал переводы на определенный язык, например, на испанский, после каждого ответа.
- Планирование путешествий: При планировании поездок попросите Gemini включать стоимость за день в свои предложения.
- Предпочтения в кодировании: Укажите предпочитаемый язык программирования, например JavaScript, чтобы обеспечить релевантные ответы, связанные с кодом.
- Стиль ответа: Укажите свое предпочтение коротким, лаконичным ответам.
Важно отметить, что каждая часть сохраненной информации должна быть добавлена вручную. Для этого перейдите в меню настроек и найдите опцию ‘Saved info’. Похоже, что эта функция сначала появится в версии для настольных компьютеров, но в конечном итоге она будет доступна как на настольных, так и на мобильных платформах приложений. Этот шаг демократизирует мощную функцию, позволяя всем пользователям испытать более персонализированное и эффективное взаимодействие с ИИ. Способность запоминать контекст превращает Gemini из реактивного инструмента в проактивного помощника, предвосхищая потребности пользователей и оптимизируя взаимодействие.
Gemini Live обретает зрение: новое измерение для премиум-пользователей
На недавнем Mobile World Congress Google представил инновационное дополнение к Gemini Live: способность ‘видеть’. Эта функция, выпуск которой запланирован на конец этого месяца, первоначально будет эксклюзивной для платных пользователей Gemini Advanced.
Эта функция ‘зрения’ работает двумя способами: она может анализировать контент на вашем экране или обрабатывать информацию из прямой видеотрансляции. Когда вы открываете Gemini, будет доступна кнопка ‘Share screen with Live’. Нажатие этой кнопки предоставляет два варианта: поделиться текущим экраном или начать прямую видеотрансляцию. Это открывает целый мир возможностей, позволяя вам задавать Gemini вопросы о вашем непосредственном окружении или о контенте, отображаемом на экране вашего телефона.
Представьте, что вы можете навести камеру на объект и попросить Gemini предоставить информацию о нем. Или поделиться документом на своем экране и получить мгновенный анализ и обратную связь. В этом и заключается сила новых визуальных возможностей Gemini Live.
Демонстрационное видео показало практическое применение этой функции. В одном сценарии пользователь искал предложения по одежде на основе пары брюк, отображаемых на экране. Gemini ответил рекомендуемым верхом, а затем, по дальнейшему запросу, предложил куртку. Другой пример продемонстрировал использование живого видео, где пользователь попросил Gemini помочь выбрать цвет глазури для недавно созданной вазы. Когда Gemini был представлен дисплей с доступными вариантами, он впечатляюще определил ‘первый слева во втором ряду’, продемонстрировав замечательное понимание контекста и пространственных отношений.
Эта возможность визуального ввода выводит Gemini Live за рамки традиционного взаимодействия с ИИ на основе текста и голоса. Она вводит новое измерение понимания, позволяя ИИ воспринимать и интерпретировать физический мир. Это открывает захватывающие возможности для различных приложений, от помощи в реальном времени с повседневными задачами до более сложных сценариев решения проблем. Способность анализировать визуальную информацию в режиме реального времени позиционирует Gemini Live как передовой инструмент для пользователей, которым нужен более интуитивно понятный и интерактивный опыт работы с ИИ.
Последствия этих обновлений далеко идущие. Для бесплатных пользователей расширенная функция памяти обеспечивает уровень персонализации, ранее предназначенный для премиум-подписчиков. Это означает более индивидуальный и эффективный опыт работы с ИИ для всех, независимо от их статуса подписки. Для пользователей Gemini Advanced добавление визуальных возможностей к Gemini Live представляет собой значительный шаг вперед во взаимодействии с ИИ. Способность ‘видеть’ и понимать физический мир открывает новую сферу возможностей, делая Gemini еще более мощным и универсальным инструментом.
Эти обновления подчеркивают приверженность Google постоянному совершенствованию в области искусственного интеллекта. Расширяя доступ к расширенным функциям и внедряя революционные новые возможности, Google укрепляет позиции Gemini как ведущей платформы ИИ. Акцент на персонализации и визуальном понимании демонстрирует четкое понимание потребностей пользователей и стремление раздвинуть границы возможного с помощью ИИ.
Интеграция памяти и зрения в Gemini — это не просто добавление новых функций; речь идет о фундаментальном изменении способа взаимодействия пользователей с ИИ. Речь идет о создании более интуитивного, отзывчивого и, в конечном счете, более полезного компаньона ИИ. По мере того, как эти функции развертываются, и пользователи начинают изучать их потенциал, мы можем ожидать появления еще более инновационных приложений, что еще больше укрепит роль Gemini в формировании будущего ИИ.
Расширенная память способствует непрерывному диалогу, устраняя необходимость в повторяющихся объяснениях. Это создает более естественное и плавное взаимодействие, похожее на общение со знающим помощником, который помнит прошлые разговоры. С другой стороны, способность ‘видеть’ устраняет разрыв между цифровым и физическим мирами. Она позволяет Gemini взаимодействовать с окружающей средой пользователя так, как раньше было невообразимо, открывая двери для широкого спектра практических применений.
Рассмотрим потенциальное влияние на доступность. Для людей с нарушениями зрения способность Gemini Live описывать окружающую среду может быть преобразующей. Или представьте себе преимущества для образования, когда учащиеся могут получать объяснения сложных визуальных концепций в режиме реального времени. Возможности огромны и продолжают расширяться по мере развития технологии.
Более того, эти достижения, вероятно, подстегнут дальнейшие инновации в индустрии ИИ. По мере того, как другие компании будут видеть возможности Gemini, они будут стремиться разрабатывать свои собственные конкурирующие технологии, что приведет к быстрому ускорению развития ИИ в целом. Эта конкурентная среда в конечном итоге приносит пользу конечному пользователю, снижая затраты и увеличивая доступ к все более сложным инструментам ИИ.
Эволюция Gemini является свидетельством силы непрерывных инноваций и неустанного стремления к созданию ИИ, который действительно понимает и помогает пользователям значимыми способами. Это путешествие далеко не закончено, и мы можем ожидать еще более захватывающих событий в ближайшие годы. Будущее ИИ формируется этими достижениями, и Gemini, несомненно, находится в авангарде этой преобразующей волны.