谷歌的 Gemini 应用,自 2025 年 5 月起,以三种不同的层级提供服务,满足了从普通用户到专业人士的不同需求。免费用户可以体验到一系列功能,而每月支付 19.99 美元的 Google AI Pro 会员,则能解锁更多高级特性。对于追求极致体验的用户,每月 249.99 美元的 Google AI Ultra 订阅,更是提供了包括前沿技术在内的所有功能。
Gemini 模型:核心驱动力
Gemini 应用的核心在于其强大的模型。所有用户都可以“通用访问” 2.5 Flash 模型,这是当前默认的模型。免费用户可以“有限访问” Gemini 2.5 Pro(预览版)。谷歌表示,这款仍在测试中的模型专为“推理、数学和代码”而设计,Canvas 功能将从中受益。
Google AI Pro 订阅者则可获得“扩展访问” 2.5 Pro(预览版)。谷歌对模型限制的解释如下:
Gemini 应用对高级模型有更多的提示和聊天限制。如果在给定时间内达到特定模型的容量限制,您可以切换到其他模型,直到达到该限制或您的容量限制刷新。使用 Google AI Pro 或 Google AI Ultra 的 Gemini 应用用户对高级模型的容量限制更高。
Google AI Ultra则提供了对 2.5 Pro(预览版)的“最高访问”权限。此外,Ultra 订阅者将在“未来几周内”获得 2.5 Pro 的 Deep Think 模式,Agent Mode 则是另一项即将推出的功能。
上下文窗口:记忆的深度
上下文窗口决定了模型能够记住多少信息,从而影响对话的连贯性和深入程度。免费层级的上下文窗口适用于所有模型,为 32,000 个 tokens,约合 50 页文本。
Google AI Pro 和 AI Ultra 用户则拥有惊人的 100 万 tokens 的长上下文窗口,相当于 1,500 页文本或 30,000 行代码。这意味着,模型能够理解更长的对话历史,从而提供更相关和更精准的回复。 100万tokens的上下文窗口极大的提升了Gemini在处理复杂任务时的能力。比如,软件工程师可以上传整个项目代码,让Gemini分析代码结构,找出潜在的bug,或者提出优化建议。研究人员可以将大量的学术论文导入Gemini,让其提炼关键论点,比较不同研究之间的差异,甚至帮助撰写综述文章。内容创作者可以导入已经写好的文章草稿,让Gemini检查语法错误,提出改进意见,或者生成不同风格的标题和摘要。教育工作者则可以用它来批改大量的学生作业, 并提供个性化的反馈. 如此巨大的上下文窗口,不仅仅意味着Gemini可以"记住"更多的信息,更重要的是,它能够理解信息之间的关系,进行更深入的推理,从而提供更有价值的帮助。
文件上传与分析:扩展你的工具箱
免费用户可以将文档和幻灯片上传到 Gemini 应用,以获取摘要、见解并提出问题。支持的文件格式包括:
- 文档文件:DOC、DOCX、PDF、RTF、DOT、DOTX、HWP、HWPX
- Google 文档创建的文件
- 纯文本文件:TXT
- 演示文稿文件:PPTX
- Google 幻灯片创建的演示文稿
然而,如果需要上传电子表格和其他数据文件,并进行分析和可视化(通过图表),则需要升级到 Google AI Pro 或 AI Ultra。
- 电子表格文件:XLS、XLSX
- Google 表格创建的电子表格
- 表格数据文件:CSV、TSV
同样,上传代码文件夹和代码仓库的功能也需要订阅。谷歌强调,您可以从数千行代码中获得见解,进行智能更改,调试错误并优化代码以获得最佳性能。
- 代码文件包括 C、CPP、PY、JAVA、PHP、SQL 和 HTML
文件上传与分析是 Gemini 一个非常实用的功能。免费用户虽然只能上传文档和幻灯片,但依然可以利用 Gemini 快速提取关键信息,进行内容总结。比如,学生可以上传老师发布的课件,让 Gemini 提炼重点,帮助快速理解课程内容;上班族可以上传会议纪要,让 Gemini 整理出行动项,方便后续跟进。而对于订阅用户来说,可以上传电子表格和代码文件,无疑打开了更多的可能性。数据分析师可以上传大量的 CSV 文件,让 Gemini 快速生成可视化图表,发现数据中的规律;程序员可以上传整个项目代码,让 Gemini 检查代码风格,找出潜在的性能瓶颈。这些功能极大的提高了工作效率,让用户可以将精力集中在更具创造性的任务上。 甚至,对于科研工作者,文件上传这个功能可以帮助他们分析实验数据,推断实验结果,并将报告中出现的数据可视化呈现。
参考历史聊天:构建连续的对话
免费用户可以使用“保存的信息”功能,为每次对话指定聊天偏好(例如“我是素食主义者”或“使回复简洁”),而无需在每个提示中添加说明。
Google AI Pro 和 AI Ultra 则更进一步,Gemini 可以查看您过去的聊天记录,从而为当前的对话提供信息。要触发此功能,请“提及过去聊天的Topic或时间范围”,并且可以使用此功能来总结以前的聊天。在“来源和相关内容”部分将会注明何时使用了“以前的聊天”。
参考历史聊天功能使得Gemini可以更好地理解用户的意图,提供更加个性化的服务。对于免费用户来说,"保存的信息"功能可以让他们在每次与Gemini对话时,无需重复输入一些常用的偏好设置。例如, 一个对外汉语老师可以设定"回复为针对零基础学生的表述方式", 这样在后续的AI辅助备课环节, 只需要输入当天的课程主题,就可以得到非常容易理解的教案内容。 而订阅用户则可以利用 Gemini 查看过去的聊天记录功能,构建一个更加连续的对话体验。如果用户曾经向 Gemini 咨询过某个项目的进展情况,那么在后续的对话中,Gemini可以自动回顾之前的对话内容,从而更好地理解用户当前的问题,并给出更具针对性的建议。 想象一下,你正在用 Gemini 辅助写小说,今天你忘记了昨天设定的主角性格, 只需要提及“昨天主角的性格设定”,Gemini 就会回顾当时的聊天记录,并给出总结. 这极大的提升了 Gemini 的实用性,使用户可以更容易地将其融入到日常工作和生活中。
深度研究:探索知识的边界
Gemini 的首个代理功能允许用户提出问题,并获得一个多点研究计划,他们可以进一步自定义该计划。获得批准后,Gemini 将搜索网络、分析其发现的内容并撰写报告。在 I/O 2025 上,文件和图像可以上传到深度研究中,从而将用户和公共知识结合起来,以获得最终结果。
- 免费用户:“有限访问”深度研究,现在由 Gemini 2.5 Flash 提供支持
- Google AI Pro:使用 2.5 Pro 进行“扩展访问”
- Google AI Ultra:“最高访问”
深度研究是 Gemini 的一个非常强大的功能,它允许用户进行更加深入的知识探索。免费用户可以体验到这项功能的基本用法,即提出问题,然后获得 Gemini 生成的多点研究计划和报告。订阅用户则可以享受到更高级的功能,例如上传文件和图像,将个人知识与公共知识结合,以得到更加个性化的研究结果。例如,一名对某个领域感兴趣的业余爱好者,可以上传自己搜集到的一些资料,然后让Gemini进行深度研究,从而快速了解这个领域的最新进展和研究方向。一名市场营销人员,可以将自己公司的一些内部数据上传到 Gemini,然后让 Gemini 分析市场趋势,制定更有效的营销策略。 深度研究不仅仅是一个信息检索工具,更是一个知识创造工具,它能够帮助用户发现新的知识,解决复杂的问题。
音频概述:聆听不同的视角
- 免费用户:有限访问
- Google AI Pro:扩展访问
- Google AI Ultra:最高访问
音频概述功能可以使 Gemini 更加灵活和易于使用。无论是听播客,还是浏览讲座,音频概述功能都可以帮助用户快速抓住重点,提高效率。免费用户可以体验到这项功能的基本用法,订阅用户则可以享受到更高级的功能。例如,学生可以利用音频概述功能,快速复习课堂录音,提炼重点知识;上班族可以利用音频概述功能,整理会议录音,生成会议纪要。音频概述功能不仅能够节省时间,还能够帮助用户更好地理解音频内容,提高学习和工作效率。 通过与文字、图片、视频等多种数据类型有机结合, Gemini 已经真正成为了一个全能型的助手。
图像生成:创造视觉奇迹
所有用户都可以“通用访问”图像生成,包括创建带有人物的图像。自 I/O 2025 以来,Gemini 应用使用 Imagen 4,以获得更高的质量、更丰富的细节和更好的文本/排版。
此外,还有本机图像编辑功能,您可以通过文本提示来优化图片(包括生成的图片和您上传的图片)。
图像生成是 Gemini 的一个非常有趣的功能,它允许用户通过文本描述来创造出各种各样的图像。所有用户都可以免费使用这项功能,并且可以生成带有人物的图像。 Gemini 还提供了图像编辑功能,用户可以通过文本提示来优化图像。例如,设计师可以使用 Gemini 快速生成一些设计灵感,或者制作一些简单的设计素材;市场营销人员可以使用 Gemini 制作一些广告图片,或者优化产品图片;自媒体创作者可以使用 Gemini 制作一些有趣的表情包,或者制作一些精美的配图。 Imagen 4 的加持,带来了更高质量,更清晰,细节更丰富的图像生成效果。
自发布以来,AI绘画的能力也在飞速发展,一方面,使用者可以通过调整关键词来实现生成图像的精细控制;另一方面,AI也逐渐学习了人体结构和光影关系,这使得AI生成的人物也越来越逼真。
图像生成,是助力各行业的强大AI工具。
视频生成:将想象变为现实
- 免费用户:不可用
- Google AI Pro:使用 Veo 2 生成 8 秒 720p 的剪辑
- Google AI Ultra:由 Veo 3 提供支持,剪辑具有声音(效果、噪音等)
这两个视频都使用相同的提示:“从一个长满草的悬崖到沙滩的航拍镜头,海浪拍打着海岸,一个突出的海蚀柱从海滩附近的海面上升起,沐浴在温暖的金色日出或日落的光芒中,捕捉了剧烈的海拔变化和太平洋海岸线宁静的美丽。”
视频生成功能是 Gemini 的一个非常令人期待的功能,它允许用户通过文本描述来创造出短视频。目前,这项功能只对订阅用户开放。 Google AI Pro 用户可以使用 Veo 2 生成 8 秒 720p 的剪辑,而 Google AI Ultra 用户则可以使用 Veo 3 生成带有声音的剪辑。视频生成在未来的应用前景非常广泛,例如,电影制片人可以使用 Gemini 快速生成一些场景片段,或者制作一些特效镜头;广告公司可以使用 Gemini 制作一些广告片,或者制作一些产品宣传片;自媒体创作者可以使用 Gemini 制作一些短视频,或者制作一些 vlog 片段。可以遇见,随着技术的发展,视频生成的质量将会越来越高,生成的视频时长将会越来越长,这将给视频行业带来颠覆性的变革。 基于文本提示生成视频, 是对于当前视觉内容生产方式的一次巨大革新。
用户只需要输入一段描述,就可以快速生成一段符合要求的视频,这极大的降低了视频制作的门槛,也让更多的人可以参与到视频内容的创作中来。
Veo 3的加入,更是增加了生成视频的真实感, 效果、噪音等声音环境的加入, 让视频更加生动,充满细节。
其他功能:更多 possibilities
Gems: 用于构建 Gemini 的自定义版本,用于执行具有预定义说明的特定任务。可以理解为自定义的AI机器人,赋予其特定人设和能力,可以更高效的完成特定任务。例如,创建一个专门用于生成营销文案的Gemini,或者一个专门用于代码debug的Gemini。Gems让AI的应用更加个性化和专业化。
Gemini Live
- 摄像头和屏幕共享。这个功能使得Gemini不仅仅是一个文本工具,而可以成为一个视觉助手,帮助用户进行远程演示、教学或者协同工作。想象一下,你可以通过Gemini Live向同事展示你的设计稿,并实时听取他们的反馈;或者你可以用Gemini Live来远程指导家人如何使用智能手机。
Gems 是一个非常创新的功能,它允许用户构建 Gemini 的自定义版本,用于执行具有预定义说明的特定任务。可以将 Gems 理解为自定义的 AI 机器人,赋予其特定人设和能力,可以更高效的完成特定任务。例如,创建一个专门用于生成营销文案的 Gemini,或者一个专门用于代码 debug 的 Gemini。 Gems 让 AI 的应用更加个性化和专业化。
Gemini Live 是一个非常实用的功能,它允许用户使用摄像头和屏幕共享来进行实时协作。这个功能使得 Gemini 不仅仅是一个文本工具,而可以成为一个视觉助手,帮助用户进行远程演示、教学或者协同工作。想象一下,你可以通过 Gemini Live 向同事展示你的设计稿,并实时听取他们的反馈;或者你可以用 Gemini Live 来远程指导家人如何使用智能手机。 远程协作是目前重要的工作模式,Gemini Live无疑为协同办公提供了新的思路。
总而言之,Gemini提供的功能和服务,可以满足不同类型用户的需求,无论你是希望免费体验基本功能的普通用户,还是需要强大工具来提高工作效率的专业人士,都可以在Gemini找到适合自己的方案。随着技术的不断发展,Gemini未来还将推出更多令人期待的新功能,让我们拭目以待。 Gemini的出现,标志着AI技术正快速融入我们的生活和工作,它不再是一个遥不可及的概念,而是我们手中的一个强大工具,可以帮助我们解决问题,提高效率,创造价值。 我们有理由期待,在未来的发展中,Gemini能够不断突破创新,为我们带来更多惊喜。