Chrome 中的 Gemini：窥见 Google 的智能未来 | zh-CN

Google 将 Gemini 集成到 Chrome，似乎标志着这家科技巨头朝着更加智能化的时代迈出了初步的一步。这项新功能将 AI 助手直接嵌入到你的浏览器中，使其能够“看到”你的在线活动，并提供与屏幕上内容相关的摘要和答案。

Chrome 中与 Gemini 共度的上午

我对 Chrome 中 Gemini 的实验，这项新颖的集成，占据了我整个上午的时间。无需导航到聊天机器人的专用 Web 应用程序，只需简单点击 Chrome 右上角新增的 Gemini 图标，即可启动对话。这项集成的决定性特征在于浏览器能够在你浏览 Web 时“看到”屏幕上显示的内容。

在我看来，这次集成是 Google 创造更智能 AI 宏伟愿景的初步尝试。我经常发现自己渴望超越其当前功能的功能。目前，只有 AI Pro 或 AI Ultra 的订阅者才能访问 Chrome 版 Gemini 的早期访问版本，并且需要使用 Chrome 的 Beta、Dev 或 Canary 版本。

我的初步探索包括使用 Gemini 总结 The Verge 上的文章。它还扩展到在主页上发现与游戏相关的新闻，AI 巧妙地突出了 Nintendo 将新的 Game Boy 游戏添加到其 Switch Online 服务、即将上映的 Elden Ring 电影改编以及 Valve 重要的 Steam Deck 更新。

Gemini 的视野仅限于直接显示在每个网页上的内容。如果你希望总结页面上的特定组件，例如 The Verge 的评论区，则必须先展开该组件，然后聊天机器人才能提供响应。此外，Gemini 可以跟随你浏览多个选项卡，但一次只能从一个选项卡收集信息。

对于那些不愿打字的人来说，Chrome 中的 Gemini 提供了一个“实时”功能，可以通过对话框右下角的按钮访问。激活此功能后，你可以口头提出问题，Gemini 会以听得见的方式做出回应。

我发现这在观看 YouTube 视频时特别有帮助。例如，当我在观看一个浴室改造视频时，我问：“他用的是什么工具？”Gemini 回答说：“看起来他正在使用一个钉枪将一些木块固定在一起。”在另一个视频中，Gemini 正确地识别了主板上的一个电容器，以及 YouTube 用户用来移除它的镊子和热风工具。它还具有提供视频摘要和有关你跳过的部分的信息的功能，但是，我发现如果视频没有标记章节，这并不总是正确的。

此集成最常用的用例之一是 Gemini 从 YouTube 视频中提取食谱，这意味着我不必自己写下食谱或在描述中搜索链接。当我要求它指出 Amazon 搜索页面上的防水袋时，它也派上了用场。

不一致性和局限性

然而，Gemini 的表现并非没有不一致之处。当被问及 MrBeast 在展示他探索古代玛雅城市（包括奇琴伊察）的视频中的位置时，AI 回答说：“我无法访问实时信息，因此我无法确定 MrBeast 的确切当前位置。”在重新措辞问题后，它准确地引用了视频描述中提到的位置：墨西哥。另一次，当寻求购买视频中出现的特定钳子的链接时，Gemini 重申了它无法访问实时信息，包括产品列表或商店库存。尽管有此限制，但它在接到请求后立即提供了替代产品的链接。

有时，Gemini 的回复长度似乎与 Chrome 弹出窗口提供的有限空间不成比例。虽然窗口可以展开，但它会大大侵占我 13 英寸 MacBook Air 已经有限的屏幕空间。AI 的主要吸引力在于它能够通过提供简洁而相关的答案来加快任务速度，但 Gemini 并非始终能兑现这一承诺，除非明确提示。此外，AI 重复性的后续问题，询问我是否需要有关特定主题的更多信息，变得有些令人厌烦。

通往智能 AI 的道路

尽管存在这些缺点，但很容易设想Google 将 Gemini 的使用范围扩展到简单的问答之外。Google 希望其 AI 变得“智能”，这意味着它可以代表你执行任务，而 Chrome 中的 Gemini 似乎有望在未来采用此类功能。例如，在要求 Gemini 总结一家餐厅的菜单后，我甚至考虑让它下达取货订单——这是一项它目前无法完成的智能任务。将来，我甚至可以看到它派上用场，它可以为我添加与旅行研究相关的页面书签，或者甚至找到并保存不同食谱的 YouTube 视频到我的稍后观看播放列表中。

Google 似乎正在通过 Project Mariner 的“Agent Mode”来实现这一愿景。此功能将使 AI 能够同时处理多达 10 个任务，并独立搜索 Web，从而可能为将来将这些功能集成到 Chrome 中的 Gemini 铺平道路。这将导致 Gemini 更多地参与 Web 搜索，并使其更容易组织任务和查询。

未来的潜在应用

Gemini 未来在 Chrome 中的应用前景广阔且引人注目。想象一下这样一种场景，AI 无缝集成到你的在线购物体验中，主动识别最佳交易、比较不同零售商的价格，甚至代表你完成购买，所有这些都符合你预定义的偏好和预算。这种集成水平将使在线购物从一项可能繁琐的家务转变为一个简化而高效的过程。

此外，考虑一下 Gemini 彻底改变在线研究的潜力。你无需手动筛选无数的文章和网站，只需让 Gemini 收集有关特定主题的信息，指定所需的分析深度、首选来源以及你希望信息呈现的格式。然后，Gemini 可以编写一份包含引文和摘要的综合报告，从而为你节省无数繁琐的研究时间。

在生产力方面，Gemini 可以成为你的终极私人助理，管理你的日程安排、确定任务的优先级，甚至根据你的指示起草电子邮件和演示文稿。想象一下将你的想法和想法口述给 Gemini，然后它将它们转化为一个经过润色且专业的演示文稿，其中包含相关的视觉效果和数据。这将使你从头开始创建演示文稿的耗时任务中解放出来，使你能够专注于工作更具战略性的方面。

对于学生来说，Gemini 可以作为一种宝贵的学习资源，提供个性化的辅导、回答问题，甚至协助完成研究作业。想象一下，能够要求 Gemini 用简单易懂的术语解释一个复杂的概念，或者提供示例和插图来帮助你更好地理解材料。这将使学习更具吸引力并更有效，并且使学生能够掌控自己的教育。

解决担忧和挑战

然而，将 AI 集成到我们的日常生活中也引发了必须积极解决的合理担忧。最紧迫的担忧之一是 AI 算法中存在偏见的可能性。如果用于训练这些算法的数据反映了现有的社会偏见，AI 可能会延续甚至放大这些偏见。必须确保 AI 算法在各种具有代表性的数据集上进行训练，并且定期对其偏见进行审核。

另一个担忧是 AI 自动化可能导致工作岗位流失。随着 AI 越来越能够执行以前由人类完成的任务，许多工作岗位可能会被淘汰。为了减轻这种风险，必须投资于教育和培训计划，使工人掌握在 AI 时代蓬勃发展所需的技能。这包括培养批判性思维、解决问题和创造力等技能，这些技能是 AI 难以复制的。

最后，存在与 AI 使用相关的伦理考虑，尤其是在隐私和安全等领域。必须制定明确的指导方针和法规，规范 AI 的开发和部署，确保以负责任和符合伦理的方式使用 AI。这包括保护个人的隐私、防止滥用 AI 进行恶意目的，并确保 AI 系统是透明和负责任的。

AI 集成的未来

Google 的 Chrome 中的 Gemini 是朝着更集成和更智能的浏览体验迈出的有希望的一步。虽然目前的实现存在局限性，但它让我们看到了 AI 改变我们与 Web 交互方式的潜力。随着 AI 技术不断发展，我们可以期待看到 AI 更复杂和无缝地集成到我们的日常生活中。关键在于积极应对与 AI 相关的伦理和社会挑战，确保它被用于造福全人类。

AI 在 Chrome 等浏览器中的集成演变也需要重新评估现有的 Web 标准和安全协议。随着 AI 越来越能够更深入地解释和与 Web 内容交互，可能会出现新的漏洞，这些漏洞可能会被恶意行为者利用。因此，浏览器开发人员和安全专家必须合作开发新的安全措施，以保护用户免受这些新兴威胁。这包括加强对网络钓鱼攻击、恶意软件和其他形式的在线欺诈的防御。

此外，在浏览器中越来越依赖 AI 也可能导致新的数字鸿沟的产生。无法访问高速互联网或高级计算设备的人可能处于不利地位，因为他们无法充分利用 AI 驱动的浏览器的功能。为了解决这个问题，必须投资于基础设施改善和数字扫盲计划，以确保每个人都有机会从 AI 技术的进步中受益。

此外，将 AI 集成到浏览器中也可能对广告行业产生重大影响。随着 AI 越来越擅长了解用户的偏好和行为，它可以用来投放更有针对性和个性化的广告。虽然这可能会带来更相关和引人入胜的广告体验，但它也引发了对隐私和数据安全的担忧。对于监管机构和行业利益相关者来说，必须制定明确的指导方针和法规，规范 AI 在广告中的使用，确保用户的隐私得到保护，并且负责任地使用数据。

更新于 2025-05-27

# Agent # Google # Gemini