增强记忆:通用升级
Gemini 现在可以保留用户特定的信息,例如偏好、兴趣和工作相关细节,这项功能不再是 Gemini Advanced 订阅用户的专属。这项功能最初于去年 11 月推出,现已向所有 Gemini 用户开放。
这种记忆增强允许用户向 Gemini 提供有关他们生活的具体细节。这可以是任何信息,从你的名字和家庭成员的名字到你正在进行的特定项目的信息。此功能的主要优点是其效率。你不再需要重复输入相同的信息。 这使得 Gemini 能够提供更加个性化和相关的回复。
Google 提供了几个示例来说明用户如何利用此功能:
- 语言偏好: 指示 Gemini 使用简单的语言,避免使用技术术语。
- 饮食限制: 告知 Gemini 你的饮食偏好,例如素食主义者,以避免收到不合适的建议。
- 翻译要求: 要求 Gemini 在每次回复后包含特定语言(如西班牙语)的翻译。
- 旅行计划: 在计划旅行时,要求 Gemini 在其建议中包含每日费用。
- 编码偏好: 指定你首选的编码语言(例如 JavaScript),以确保获得相关的代码回复。
- 回复风格: 表明你偏好简短、简洁的回复。
需要注意的是,每条保存的信息都需要手动添加。为此,请导航到设置菜单并找到“Saved info”选项。桌面版本似乎首先获得此功能,但最终它将在桌面和移动应用程序平台上都可用。这一举措使一项强大的功能民主化,允许所有用户体验更个性化和高效的 AI 交互。记住上下文的能力将 Gemini 从一个被动工具转变为一个主动助手,预测用户需求并简化交互。
Gemini Live 获得视觉:高级用户的全新维度
在最近的世界移动通信大会上,Google 公布了 Gemini Live 的一项创新功能:’看见’的能力。此功能计划于本月晚些时候发布,最初将仅供付费的 Gemini Advanced 用户使用。
这种’看见’功能有两种操作方式:它可以分析屏幕上的内容或处理来自实时视频源的信息。当你打开 Gemini 时,将会有一个“Share screen with Live”按钮。点击此按钮会显示两个选项:共享你当前的屏幕或启动实时视频。这开启了一个充满可能性的世界,允许你向 Gemini 询问有关你周围环境或手机屏幕上显示的内容的问题。
想象一下,你可以将相机对准一个物体,并向 Gemini 询问有关它的信息。或者共享屏幕上的文档并立即收到分析和反馈。这就是 Gemini Live 新视觉功能的力量。
一段演示视频展示了此功能的实际应用。在一个场景中,用户根据屏幕上显示的一条裤子寻求服装建议。Gemini 回应了一个推荐的上衣,然后在进一步请求后又建议了一件夹克。另一个例子突出了实时视频的使用,用户要求 Gemini 协助选择新制作的花瓶的釉色。当呈现可用的选项时,Gemini 令人印象深刻地识别出“第二排左边第一个”,展示了对上下文和空间关系的非凡理解。
这种视觉输入能力将 Gemini Live 提升到传统的基于文本和语音的 AI 交互之上。它引入了一个新的理解维度,允许 AI 感知和解释物理世界。这为各种应用开辟了令人兴奋的可能性,从日常任务的实时协助到更复杂的问题解决场景。实时分析视觉信息的能力使 Gemini Live 成为寻求更直观和交互式 AI 体验的用户的尖端工具。
这些升级的影响是深远的。对于免费用户,增强的记忆功能带来了以前仅供高级订阅者使用的个性化水平。这意味着每个人都可以获得更量身定制和高效的 AI 体验,无论他们的订阅状态如何。对于 Gemini Advanced 用户,Gemini Live 增加视觉功能代表了 AI 交互的重大飞跃。’看见’和理解物理世界的能力开辟了一个新的可能性领域,使 Gemini 成为一个更强大和多功能的工具。
这些更新强调了 Google 在人工智能领域持续改进的承诺。通过扩大对高级功能的访问并引入突破性的新功能,Google 正在巩固 Gemini 作为领先 AI 平台的地位。对个性化和视觉理解的关注表明了对用户需求的清晰理解,以及对推动 AI 可能性边界的奉献。
将记忆和视觉集成到 Gemini 中不仅仅是添加新功能;这是关于从根本上改变用户与 AI 交互的方式。这是关于创建一个更直观、响应更快,最终更有帮助的 AI 伴侣。随着这些功能的推出和用户开始探索它们的潜力,我们可以期待看到更多创新应用的出现,进一步巩固 Gemini 在塑造 AI 未来中的作用。
增强的记忆功能促进了持续的对话,消除了重复解释的需要。这创造了一种更自然和流畅的交互,类似于与一位记得过去对话的知识渊博的助手交谈。另一方面,’看见’能力弥合了数字世界和物理世界之间的差距。它允许 Gemini 以以前无法想象的方式与用户的环境互动,为广泛的实际应用打开了大门。
考虑一下对可访问性的潜在影响。对于有视觉障碍的人来说,Gemini Live 描述周围环境的能力可能是变革性的。或者想象一下对教育的好处,学生可以实时收到复杂视觉概念的解释。可能性是巨大的,并且随着技术的不断发展而不断扩大。
此外,这些进步可能会刺激 AI 行业的进一步创新。随着其他公司见证 Gemini 的能力,他们将被驱动开发自己的竞争技术,从而导致 AI 整体开发的快速加速。这种竞争格局最终有利于最终用户,降低成本并增加对日益复杂的 AI 工具的访问。
Gemini 的演变证明了持续创新的力量,以及不懈追求创造真正理解并以有意义的方式帮助用户的 AI。这是一段远未结束的旅程,我们可以期待在未来几年看到更多令人兴奋的发展。AI 的未来正在被这些进步所塑造,而 Gemini 无疑处于这一变革浪潮的最前沿。