Gemini解锁指南：免费与付费功能详解 | zh-CN

谷歌的 Gemini 应用，自 2025 年 5 月起，以三种不同的层级提供服务，满足了从普通用户到专业人士的不同需求。免费用户可以体验到一系列功能，而每月支付 19.99 美元的 Google AI Pro 会员，则能解锁更多高级特性。对于追求极致体验的用户，每月 249.99 美元的 Google AI Ultra 订阅，更是提供了包括前沿技术在内的所有功能。

Gemini 模型：核心驱动力

Gemini 应用的核心在于其强大的模型。所有用户都可以“通用访问” 2.5 Flash 模型，这是当前默认的模型。免费用户可以“有限访问” Gemini 2.5 Pro（预览版）。谷歌表示，这款仍在测试中的模型专为“推理、数学和代码”而设计，Canvas 功能将从中受益。

Google AI Pro 订阅者则可获得“扩展访问” 2.5 Pro（预览版）。谷歌对模型限制的解释如下：

Gemini 应用对高级模型有更多的提示和聊天限制。如果在给定时间内达到特定模型的容量限制，您可以切换到其他模型，直到达到该限制或您的容量限制刷新。使用 Google AI Pro 或 Google AI Ultra 的 Gemini 应用用户对高级模型的容量限制更高。

Google AI Ultra则提供了对 2.5 Pro（预览版）的“最高访问”权限。此外，Ultra 订阅者将在“未来几周内”获得 2.5 Pro 的 Deep Think 模式，Agent Mode 则是另一项即将推出的功能。

上下文窗口：记忆的深度

上下文窗口决定了模型能够记住多少信息，从而影响对话的连贯性和深入程度。免费层级的上下文窗口适用于所有模型，为 32,000 个 tokens，约合 50 页文本。

Google AI Pro 和 AI Ultra 用户则拥有惊人的 100 万 tokens 的长上下文窗口，相当于 1,500 页文本或 30,000 行代码。这意味着，模型能够理解更长的对话历史，从而提供更相关和更精准的回复。 100万tokens的上下文窗口极大的提升了Gemini在处理复杂任务时的能力。比如，软件工程师可以上传整个项目代码，让Gemini分析代码结构，找出潜在的bug，或者提出优化建议。研究人员可以将大量的学术论文导入Gemini，让其提炼关键论点，比较不同研究之间的差异，甚至帮助撰写综述文章。内容创作者可以导入已经写好的文章草稿，让Gemini检查语法错误，提出改进意见，或者生成不同风格的标题和摘要。教育工作者则可以用它来批改大量的学生作业, 并提供个性化的反馈. 如此巨大的上下文窗口，不仅仅意味着Gemini可以"记住"更多的信息，更重要的是，它能够理解信息之间的关系，进行更深入的推理，从而提供更有价值的帮助。

文件上传与分析：扩展你的工具箱

免费用户可以将文档和幻灯片上传到 Gemini 应用，以获取摘要、见解并提出问题。支持的文件格式包括：

文档文件：DOC、DOCX、PDF、RTF、DOT、DOTX、HWP、HWPX
Google 文档创建的文件
纯文本文件：TXT
演示文稿文件：PPTX
Google 幻灯片创建的演示文稿

然而，如果需要上传电子表格和其他数据文件，并进行分析和可视化（通过图表），则需要升级到 Google AI Pro 或 AI Ultra。

电子表格文件：XLS、XLSX
Google 表格创建的电子表格
表格数据文件：CSV、TSV

同样，上传代码文件夹和代码仓库的功能也需要订阅。谷歌强调，您可以从数千行代码中获得见解，进行智能更改，调试错误并优化代码以获得最佳性能。

代码文件包括 C、CPP、PY、JAVA、PHP、SQL 和 HTML

文件上传与分析是 Gemini 一个非常实用的功能。免费用户虽然只能上传文档和幻灯片，但依然可以利用 Gemini 快速提取关键信息，进行内容总结。比如，学生可以上传老师发布的课件，让 Gemini 提炼重点，帮助快速理解课程内容；上班族可以上传会议纪要，让 Gemini 整理出行动项，方便后续跟进。而对于订阅用户来说，可以上传电子表格和代码文件，无疑打开了更多的可能性。数据分析师可以上传大量的 CSV 文件，让 Gemini 快速生成可视化图表，发现数据中的规律；程序员可以上传整个项目代码，让 Gemini 检查代码风格，找出潜在的性能瓶颈。这些功能极大的提高了工作效率，让用户可以将精力集中在更具创造性的任务上。甚至，对于科研工作者，文件上传这个功能可以帮助他们分析实验数据，推断实验结果，并将报告中出现的数据可视化呈现。

参考历史聊天：构建连续的对话

免费用户可以使用“保存的信息”功能，为每次对话指定聊天偏好（例如“我是素食主义者”或“使回复简洁”），而无需在每个提示中添加说明。

Google AI Pro 和 AI Ultra 则更进一步，Gemini 可以查看您过去的聊天记录，从而为当前的对话提供信息。要触发此功能，请“提及过去聊天的Topic或时间范围”，并且可以使用此功能来总结以前的聊天。在“来源和相关内容”部分将会注明何时使用了“以前的聊天”。

参考历史聊天功能使得Gemini可以更好地理解用户的意图，提供更加个性化的服务。对于免费用户来说，"保存的信息"功能可以让他们在每次与Gemini对话时，无需重复输入一些常用的偏好设置。例如，一个对外汉语老师可以设定"回复为针对零基础学生的表述方式", 这样在后续的AI辅助备课环节, 只需要输入当天的课程主题，就可以得到非常容易理解的教案内容。而订阅用户则可以利用 Gemini 查看过去的聊天记录功能，构建一个更加连续的对话体验。如果用户曾经向 Gemini 咨询过某个项目的进展情况，那么在后续的对话中，Gemini可以自动回顾之前的对话内容，从而更好地理解用户当前的问题，并给出更具针对性的建议。想象一下，你正在用 Gemini 辅助写小说，今天你忘记了昨天设定的主角性格，只需要提及“昨天主角的性格设定”，Gemini 就会回顾当时的聊天记录,并给出总结. 这极大的提升了 Gemini 的实用性,使用户可以更容易地将其融入到日常工作和生活中。

深度研究：探索知识的边界

Gemini 的首个代理功能允许用户提出问题，并获得一个多点研究计划，他们可以进一步自定义该计划。获得批准后，Gemini 将搜索网络、分析其发现的内容并撰写报告。在 I/O 2025 上，文件和图像可以上传到深度研究中，从而将用户和公共知识结合起来，以获得最终结果。

免费用户：“有限访问”深度研究，现在由 Gemini 2.5 Flash 提供支持
Google AI Pro：使用 2.5 Pro 进行“扩展访问”
Google AI Ultra：“最高访问”

深度研究是 Gemini 的一个非常强大的功能，它允许用户进行更加深入的知识探索。免费用户可以体验到这项功能的基本用法，即提出问题，然后获得 Gemini 生成的多点研究计划和报告。订阅用户则可以享受到更高级的功能，例如上传文件和图像，将个人知识与公共知识结合，以得到更加个性化的研究结果。例如，一名对某个领域感兴趣的业余爱好者，可以上传自己搜集到的一些资料，然后让Gemini进行深度研究，从而快速了解这个领域的最新进展和研究方向。一名市场营销人员，可以将自己公司的一些内部数据上传到 Gemini，然后让 Gemini 分析市场趋势，制定更有效的营销策略。深度研究不仅仅是一个信息检索工具，更是一个知识创造工具，它能够帮助用户发现新的知识，解决复杂的问题。

音频概述：聆听不同的视角

免费用户：有限访问
Google AI Pro：扩展访问
Google AI Ultra：最高访问

音频概述功能可以使 Gemini 更加灵活和易于使用。无论是听播客，还是浏览讲座，音频概述功能都可以帮助用户快速抓住重点，提高效率。免费用户可以体验到这项功能的基本用法，订阅用户则可以享受到更高级的功能。例如，学生可以利用音频概述功能，快速复习课堂录音，提炼重点知识；上班族可以利用音频概述功能，整理会议录音，生成会议纪要。音频概述功能不仅能够节省时间，还能够帮助用户更好地理解音频内容，提高学习和工作效率。通过与文字、图片、视频等多种数据类型有机结合, Gemini 已经真正成为了一个全能型的助手。

图像生成：创造视觉奇迹

所有用户都可以“通用访问”图像生成，包括创建带有人物的图像。自 I/O 2025 以来，Gemini 应用使用 Imagen 4，以获得更高的质量、更丰富的细节和更好的文本/排版。

此外，还有本机图像编辑功能，您可以通过文本提示来优化图片（包括生成的图片和您上传的图片）。

图像生成是 Gemini 的一个非常有趣的功能，它允许用户通过文本描述来创造出各种各样的图像。所有用户都可以免费使用这项功能，并且可以生成带有人物的图像。 Gemini 还提供了图像编辑功能，用户可以通过文本提示来优化图像。例如，设计师可以使用 Gemini 快速生成一些设计灵感，或者制作一些简单的设计素材；市场营销人员可以使用 Gemini 制作一些广告图片，或者优化产品图片；自媒体创作者可以使用 Gemini 制作一些有趣的表情包，或者制作一些精美的配图。 Imagen 4 的加持，带来了更高质量，更清晰，细节更丰富的图像生成效果。
自发布以来，AI绘画的能力也在飞速发展，一方面，使用者可以通过调整关键词来实现生成图像的精细控制；另一方面，AI也逐渐学习了人体结构和光影关系，这使得AI生成的人物也越来越逼真。
图像生成，是助力各行业的强大AI工具。

视频生成：将想象变为现实

免费用户：不可用
Google AI Pro：使用 Veo 2 生成 8 秒 720p 的剪辑
Google AI Ultra：由 Veo 3 提供支持，剪辑具有声音（效果、噪音等）

这两个视频都使用相同的提示：“从一个长满草的悬崖到沙滩的航拍镜头，海浪拍打着海岸，一个突出的海蚀柱从海滩附近的海面上升起，沐浴在温暖的金色日出或日落的光芒中，捕捉了剧烈的海拔变化和太平洋海岸线宁静的美丽。”

视频生成功能是 Gemini 的一个非常令人期待的功能，它允许用户通过文本描述来创造出短视频。目前，这项功能只对订阅用户开放。 Google AI Pro 用户可以使用 Veo 2 生成 8 秒 720p 的剪辑，而 Google AI Ultra 用户则可以使用 Veo 3 生成带有声音的剪辑。视频生成在未来的应用前景非常广泛，例如，电影制片人可以使用 Gemini 快速生成一些场景片段，或者制作一些特效镜头；广告公司可以使用 Gemini 制作一些广告片，或者制作一些产品宣传片；自媒体创作者可以使用 Gemini 制作一些短视频，或者制作一些 vlog 片段。可以遇见，随着技术的发展，视频生成的质量将会越来越高，生成的视频时长将会越来越长，这将给视频行业带来颠覆性的变革。基于文本提示生成视频，是对于当前视觉内容生产方式的一次巨大革新。
用户只需要输入一段描述，就可以快速生成一段符合要求的视频，这极大的降低了视频制作的门槛，也让更多的人可以参与到视频内容的创作中来。
Veo 3的加入，更是增加了生成视频的真实感，效果、噪音等声音环境的加入，让视频更加生动，充满细节。

其他功能：更多 possibilities

Gems：用于构建 Gemini 的自定义版本，用于执行具有预定义说明的特定任务。可以理解为自定义的AI机器人，赋予其特定人设和能力，可以更高效的完成特定任务。例如，创建一个专门用于生成营销文案的Gemini，或者一个专门用于代码debug的Gemini。Gems让AI的应用更加个性化和专业化。
Gemini Live
- 摄像头和屏幕共享。这个功能使得Gemini不仅仅是一个文本工具，而可以成为一个视觉助手，帮助用户进行远程演示、教学或者协同工作。想象一下，你可以通过Gemini Live向同事展示你的设计稿，并实时听取他们的反馈；或者你可以用Gemini Live来远程指导家人如何使用智能手机。

Gems 是一个非常创新的功能，它允许用户构建 Gemini 的自定义版本，用于执行具有预定义说明的特定任务。可以将 Gems 理解为自定义的 AI 机器人，赋予其特定人设和能力，可以更高效的完成特定任务。例如，创建一个专门用于生成营销文案的 Gemini，或者一个专门用于代码 debug 的 Gemini。 Gems 让 AI 的应用更加个性化和专业化。

Gemini Live 是一个非常实用的功能，它允许用户使用摄像头和屏幕共享来进行实时协作。这个功能使得 Gemini 不仅仅是一个文本工具，而可以成为一个视觉助手，帮助用户进行远程演示、教学或者协同工作。想象一下，你可以通过 Gemini Live 向同事展示你的设计稿，并实时听取他们的反馈；或者你可以用 Gemini Live 来远程指导家人如何使用智能手机。远程协作是目前重要的工作模式，Gemini Live无疑为协同办公提供了新的思路。

总而言之，Gemini提供的功能和服务，可以满足不同类型用户的需求，无论你是希望免费体验基本功能的普通用户，还是需要强大工具来提高工作效率的专业人士，都可以在Gemini找到适合自己的方案。随着技术的不断发展，Gemini未来还将推出更多令人期待的新功能，让我们拭目以待。 Gemini的出现，标志着AI技术正快速融入我们的生活和工作，它不再是一个遥不可及的概念，而是我们手中的一个强大工具，可以帮助我们解决问题，提高效率，创造价值。我们有理由期待，在未来的发展中，Gemini能够不断突破创新，为我们带来更多惊喜。

更新于 2025-06-01

# Agent # Google # Gemini