谷歌的 Gemini 應用程式,自 2025 年 5 月起,以三種不同的層級提供服務,滿足了從普通用戶到專業人士的不同需求。免費用戶可以體驗到一系列功能,而每月支付 19.99 美元的 Google AI Pro 會員,則能解鎖更多高級特性。對於追求極致體驗的用戶,每月 249.99 美元的 Google AI Ultra 訂閱,更是提供了包括前沿技術在內的所有功能。
Gemini 模型:核心驅動力
Gemini 應用程式的核心在於其強大的模型。所有用戶都可以「通用訪問」 2.5 Flash 模型,這是當前預設的模型。免費用戶可以「有限訪問」 Gemini 2.5 Pro(預覽版)。谷歌表示,這款仍在測試中的模型專為「推理、數學和代碼」而設計,Canvas 功能將從中受益。
Google AI Pro 訂閱者則可獲得「擴展訪問」 2.5 Pro(預覽版)。谷歌對模型限制的解釋如下:
Gemini 應用程式對高級模型有更多的提示和聊天限制。如果在給定時間內達到特定模型的容量限制,您可以切換到其他模型,直到達到該限制或您的容量限制刷新。使用 Google AI Pro 或 Google AI Ultra 的 Gemini 應用程式用戶對高級模型的容量限制更高。
Google AI Ultra則提供了對 2.5 Pro(預覽版)的「最高訪問」權限。此外,Ultra 訂閱者將在「未來幾週內」獲得 2.5 Pro 的 Deep Think 模式,Agent Mode 則是另一項即將推出的功能。
上下文窗口:記憶的深度
上下文窗口決定了模型能夠記住多少信息,從而影響對話的連貫性和深入程度。免費層級的上下文窗口適用於所有模型,為 32,000 個 tokens,約合 50 頁文本。
Google AI Pro 和 AI Ultra 用戶則擁有驚人的 100 萬 tokens 的長上下文窗口,相當於 1,500 頁文本或 30,000 行代碼。這意味著,模型能夠理解更長的對話歷史,從而提供更相關和更精準的回覆。長上下文窗口對於處理複雜的任務至關重要,例如總結長篇文章、理解複雜的程式碼庫或參與長時間的深度討論。
文件上傳與分析:擴展你的工具箱
免費用戶可以將文件和幻燈片上傳到 Gemini 應用程式,以獲取摘要、見解並提出問題。支持的文件格式包括:
- 文檔文件:DOC、DOCX、PDF、RTF、DOT、DOTX、HWP、HWPX
- Google 文檔建立的文件
- 純文本文件:TXT
- 演示文稿文件:PPTX
- Google 幻燈片建立的演示文稿
然而,如果需要上傳電子表格和其他數據文件,並進行分析和可視化(通過圖表),則需要升級到 Google AI Pro 或 AI Ultra。這項功能對於數據分析師、研究人員和任何需要處理大量數據的人來說非常有用。
- 電子表格文件:XLS、XLSX
- Google 表格建立的電子表格
- 表格數據文件:CSV、TSV
同樣,上傳代碼文件夾和代碼倉庫的功能也需要訂閱。谷歌強調,您可以從數千行代碼中獲得見解,進行智能更改,調試錯誤並優化代碼以獲得最佳性能。這對於軟體工程師和開發人員來說是一項強大的工具,可以幫助他們更快地編寫、測試和部署代碼。
- 代碼文件包括 C、CPP、PY、JAVA、PHP、SQL 和 HTML
參考歷史聊天:構建連續的對話
免費用戶可以使用「保存的信息」功能,為每次對話指定聊天偏好(例如「我是素食主義者」或「使回覆簡潔」),而無需在每個提示中添加說明。這簡化了與 Gemini 的互動,使其更具個性化。
Google AI Pro 和 AI Ultra 則更進一步,Gemini 可以查看您過去的聊天記錄,從而為當前的對話提供信息。要觸發此功能,請「提及過去聊天的Topic或時間範圍」,並且可以使用此功能來總結以前的聊天。在「來源和相關內容」部分將會註明何時使用了「以前的聊天」。這使得與 Gemini 的互動更像與一個能夠記住之前的互動並據此調整回覆的真實夥伴互動。
深度研究:探索知識的邊界
Gemini 的首個代理功能允許用戶提出問題,並獲得一個多點研究計劃,他們可以進一步自定義該計劃。獲得批准後,Gemini 將搜索網路、分析其發現的內容並撰寫報告。在 I/O 2025 上,文件和圖像可以上傳到深度研究中,從而將用戶和公共知識結合起來,以獲得最終結果。
- 免費用戶:「有限訪問」深度研究,現在由 Gemini 2.5 Flash 提供支持
- Google AI Pro:使用 2.5 Pro 進行「擴展訪問」
- Google AI Ultra:「最高訪問」
這項功能對於研究人員、學生和任何需要快速、全面地了解特定主題的人來說都非常有價值。能夠上傳文件和圖像進一步擴展了深度研究的潛力,使其能夠處理更複雜的研究問題。
音頻概述:聆聽不同的視角
- 免費用戶:有限訪問
- Google AI Pro:擴展訪問
- Google AI Ultra:最高訪問
這項功能讓用戶可以快速摘要音頻內容,例如播客、講座或會議記錄。這對於需要在短時間內了解大量音頻信息的人們而言非常有用。
圖像生成:創造視覺奇跡
所有用戶都可以「通用訪問」圖像生成,包括創建帶有人物的圖像。自 I/O 2025 以來,Gemini 應用程式使用 Imagen 4,以獲得更高的品質、更豐富的細節和更好的文本/排版。
此外,還有本机图像编辑功能,您可以通过文本提示来优化图片(包括生成的图片和您上传的图片)。這項功能讓用戶可以輕鬆地創建和編輯圖像,無需使用複雜的圖像編輯軟體。
視頻生成:將想像變為現實
- 免費用戶:不可用
- Google AI Pro:使用 Veo 2 生成 8 秒 720p 的剪輯
- Google AI Ultra:由 Veo 3 提供支持,剪輯具有聲音(效果、噪音等)
這兩個視頻都使用相同的提示:「從一個長滿草的懸崖到沙灘的航拍鏡頭,海浪拍打著海岸,一個突出的海蝕柱從海灘附近的海面上升起,沐浴在溫暖的金色日出或日落的光芒中,捕捉了劇烈的海拔變化和太平洋海岸線寧靜的美麗。」
視頻生成是 Gemini 應用程式的一項令人興奮的新功能,讓用戶可以輕鬆地將他們的想法轉化為視覺內容。 Veo 3 的加入,以及對聲音的支持,使生成的視頻更加逼真和引人入勝。這項功能對於內容創作者、營銷人員和任何需要快速創建高品質視頻的人來說都非常有用。
其他功能:更多 Possibilities
Gems: 用於構建 Gemini 的自定義版本,用於執行具有預定義說明的特定任務。可以理解為自定義的AI機器人,賦予其特定人設和能力,可以更高效的完成特定任務。例如,創建一個專門用於生成營銷文案的Gemini,或者一個專門用於代碼debug的Gemini。Gems讓AI的應用更加個性化和專業化。Gems 讓使用者能夠根據自身需求定制 Gemini,大幅提升工作效率與應用場景。Gems 的潛力無窮,能夠滿足各種專業領域的需求,例如:法律、醫學、教育等。
Gemini Live
- 摄像头和屏幕共享。这个功能使得Gemini不仅仅是一个文本工具,而可以成为一个视觉助手,帮助用户进行远程演示、教学或者协同工作。想象一下,你可以通过Gemini Live向同事展示你的设计稿,并实时听取他们的反馈;或者你可以用Gemini Live来远程指导家人如何使用智能手机。Gemini Live 為遠程協作與教學帶來了全新的可能性,使用者能夠更直觀、更有效率地進行溝通與學習。透過螢幕分享,使用者可以即時演示與接收反饋,提升協同作業的效率。而透過遠端指導,使用者能夠協助親友解決技術問題,不再受限於距離。Gemini Live 將 AI 融入日常生活,打造更智慧、更便利的互動體驗。
總而言之,Gemini 提供的功能和服務,可以滿足不同類型用戶的需求,無論你是希望免費體驗基本功能的普通用戶,還是需要強大工具來提高工作效率的專業人士,都可以在 Gemini 找到適合自己的方案。隨著技術的不斷發展,Gemini 未來還將推出更多令人期待的新功能,讓我們拭目以待。從基本的文本生成到複雜的數據分析,從音訊摘要到影片生成,Gemini 正不斷拓展 AI 的疆界,為使用者帶來更豐富、更智慧的體驗。隨著 Gems 與 Gemini Live 等功能的推出,Gemini 不再只是一個單純的 AI 工具,而是成為使用者工作、學習與生活中的得力助手。未來,Gemini 將持續進化,整合更多創新技術,為使用者帶來更多驚喜與便利。