Google Gemini:深入你數位生活的AI強者

Google Gemini 已從網路搜尋增強工具迅速發展成一個功能全面的 AI 聊天機器人,能夠處理各式各樣的任務。它現在可以處理檔案、生成帶有聲音的影片,並能解決複雜的問題,同時還能受益於雲端儲存以及與 Google 應用程式的無縫整合。從回答關於 Chrome 頁面的問題到管理 Gmail,Gemini 提供了一種統一的 AI 體驗。然而,它的研究資料來源和圖像生成能力並非總是表現出色,而且與其他聊天機器人一樣,它有時也會提供不準確的資訊。

Gemini 作為虛擬助理

將 Gemini 視為一個精於處理各種任務的進階虛擬助理。它可以分析文件、回答問題、生成圖像和影片、進行研究、協助創意寫作、搜尋網路,以及解決數學問題。它可透過文字或語音存取,類似於 Microsoft Copilot 或 ChatGPT。

Gemini 還擁有專為程式設計師設計的功能,包括 Gemini Code Assist 和 Jules 非同步程式碼編寫代理。這些工具可以協助處理諸如建立自訂 WordPress 外掛程式和偵錯程式碼之類的任務。

核心功能:提示與回應

在其核心,Gemini 接收使用者提示並產生回應,由經過大量資料集訓練的大型語言模型 (LLM) 提供支援。這些模型為 Gemini 提供了跨各種主題的大量資訊存取權限,並輔以即時網路搜尋。

使用者與 Gemini 互動越多,它就變得越好。使用者參與有助於訓練底層模型,使 Gemini 能夠提供更準確的回應並隨著時間的推移減少錯誤。這種持續的學習過程是漸進的,但至關重要。

Gemini 的模型系列:Flash 和 Pro

Gemini 採用兩個主要模型系列:Flash 和 Pro。Flash 系列專為對話互動而設計,而 Pro 系列則專門處理複雜的推理任務,例如程式碼編寫、數學和科學。這些系列中的每個模型都展現出獨特的優勢。最新的模型是 2.5 Flash 和 2.5 Pro,測試通常集中在預設的 2.5 Flash 和用於專門任務的 2.5 Pro 上。

免費版與付費版:你能得到什麼?

Gemini 提供免費和付費方案,付費方案解鎖額外功能。

免費方案

免費使用者可以存取 2.5 Flash 模型、有限的 2.5 Pro 模型存取權限、語音模式 (Gemini Live)、有限的深度研究能力,以及自訂 AI 助理 (Gems)。他們還可以獲得 Whisk 動畫工具和 15GB 的 Google Drive 雲端儲存空間的有限存取權限。

付費方案

付費方案包括 Google AI Pro(每月 $19.99 美元)和 Google AI Ultra(每月 $249.99 美元)。AI Pro 等級提供更高的使用限制、Flow 電影製作工具、Google Chrome 中的 Gemini、透過 Gemini 的 Veo 2 模型生成影片,以及用於複雜提示的更大的上下文視窗。Google Drive 雲端儲存空間透過 AI Pro 增加到 2TB,並且 Gemini 與 Google Workspace 應用程式(如 Gmail、Calendar、Docs 和 Sheets)整合。

AI Ultra 方案包含 AI Pro 中的所有內容,以及更高的使用限制和多個新功能:30TB 的 Google Drive 雲端儲存空間、搶先體驗 Gemini 的任務簡化代理、獨家存取 Gemini 即將推出的 2.5 Pro Deep Think 模式、Google 最新的 Veo 3 影片生成模型,以及 YouTube Premium。對於大多數使用者而言,AI Pro 方案通常更具成本效益。Google One 訂閱專注於透過 Google Drive 進行雲端儲存,可讓您以超過 2TB 的雲端儲存空間取得 Gemini AI Pro,例如 5TB(每月 $25 美元)或 10TB(每月 $50 美元)。

價值主張:Gemini 與競爭對手

主要的聊天機器人(如 Copilot、ChatGPT 和 Gemini)的付費方案定價約為每月 $20 美元。Gemini 和 Copilot 因其與 Google 和 Microsoft 365 應用程式的整合而脫穎而出。ChatGPT 僅專注於聊天機器人功能。雖然 Copilot Pro 具有獨特的功能,但 Gemini 的雲端儲存整合提供了卓越的價值。

可存取性:網路、行動裝置和整合

Gemini 可透過網路和行動應用程式(Apple 和 Android)存取。雖然沒有桌面應用程式或官方瀏覽器擴充功能,但 Chrome 提供了 Gemini 整合。Gemini 可在 Google 應用程式中使用,例如 Calendar、Docs、Drive、Gmail、Maps、Keep、Photos、Sheets 和 YouTube Music。

入門:介面與使用者體驗

Gemini 不需要帳戶,但建議登入以變更模型、使用深度研究和儲存聊天記錄。

介面很簡單,具有 “Ask Gemini” 文字欄位和側邊欄中的最近聊天記錄。可點擊的範例提示提供了關於 Gemini 可以做什麼的指南。回應通常很快,尤其是對於圖像生成。使用者可以複製、收聽、重新生成或分享回應。偶爾的伺服器問題可能會導致回應掛起,類似於 ChatGPT 和 Copilot。

語氣和記憶力

Gemini 比 ChatGPT 更直接且較少對話性。無法個人化 Gemini 的語氣,但可以儲存某些使用者資訊供 Gemini 記住。Gemini 的強大記憶力可以帶來更令人滿意的聊天體驗,即使在開始新的聊天時也能記住過去的聊天記錄。

語音模式:Gemini Live

麥克風圖示可啟用語音轉文字輸入,而 Gemini Live(如 ChatGPT 的語音模式或 Copilot Voice)可讓使用者以不同的聲音自然地交談。

Gemini Live 支援相機和螢幕共用,讓使用者可以討論真實世界的物件。雖然 Gemini 的圖像辨識功能通常很稱職,但該功能更多的是一種省時工具。

Project Mariner:任務簡化代理

Project Mariner 是 AI Ultra 使用者獨有的 AI 助理,可完成諸如求職或尋找公寓之類的任務。Google 將 Project Mariner 稱為 “研究原型”,表明它仍需要進一步完善。

網路搜尋與資訊檢索

網路搜尋是所有主流聊天機器人的標準功能。Gemini、ChatGPT 和 Copilot 可以回答關於時事的問題。雖然大多數問題都能得到正確回答,但有些問題可能會難倒聊天機器人。

Gemini 和 Copilot 的回應通常簡短而切中要點,而 ChatGPT 則提供更詳細的資訊。Gemini 和 ChatGPT 都有連結到相關文章的來源圖示,但 ChatGPT 的介面會顯示來源名稱和文章的完整標題。

AI 模式與購物

Google 搜尋頁面上的 AI 模式由 Gemini 提供支援,可透過 AI 模式按鈕存取。它允許使用者根據網路結果提出問題,在回應中顯示相關文章標題和相關圖片,類似於 ChatGPT。它還提供對 Google 搜尋和圖片搜尋的方便存取。

Gemini 還可以透過提供購買建議以及包含使用者評論、零售商連結和價格追蹤的 Google Shopping 標題來協助購物。Gemini 的購物功能提供相關建議。

深度研究:深入報導

深度研究是 AI 聊天機器人的寶貴功能,可讓使用者提出問題或建議主題供 Gemini 研究和報告。報告可以引用許多來源,並在大約 10 分鐘內產生。

兩個聊天機器人都輕鬆處理簡單的研究主題,但沒有明確答案且需要多元來源的問題更具挑戰性。

Gemini 引用了更多來源,但 ChatGPT 的來源更方便使用者使用。Gemini 允許將報告匯出到 Google Docs,但 ChatGPT 的深度研究介面本質上只是一個載入條。

報告語氣差異很大,Gemini 的報告類似於學術論文,而 ChatGPT 的報告類似於論壇貼文。

影像生成:視覺比較

影像生成是 AI 聊天機器人的另一項主要功能。測試著重於照片寫實和複雜的插圖。

在照片寫實影像生成中,Gemini 可以快速生成影像,並且在視覺上具有吸引力,儘管可能包含錯誤。

對於複雜的插圖,Gemini 的漫畫往往不連貫,而 ChatGPT 的漫畫則更接近實現其目標。

在技術圖表生成中,ChatGPT 產生高度準確的圖表,鞏固了其優勢。

影片生成:蓬勃發展的領域

AI 影片生成是一項日益主流的功能。Gemini 具備 Flow 電影製作工具、Veo 3 影片生成模型和 Whisk AI 動畫製作工具。它能夠生成帶有音訊的影片使其有別於 ChatGPT 的 Sora 影片生成,儘管它是 AI Ultra 訂閱者獨有的。

Veo 3 代表著一個重大的飛躍,但需要仔細的提示校準。每次生成需要 150 個積分(AI Ultra 每月 12,500 個積分)。

Flow 允許修剪影片片段並根據新提示擴展它們。如果有足夠的積分,可以想像一部電影可以完全使用 Flow 製作。

Whisk 是 Google 的 AI 動畫工具,可讓使用者上傳圖片。結果可能很有趣,但有錯誤和失真。

檔案分析:了解上傳的內容

Gemini 可以分析和理解上傳的檔案,評論履歷、解釋圖片或翻譯文字。

在圖像辨識中,我們測試聊天機器人識別上傳影像中元件的能力。ChatGPT 可以包含更多的細節。

對於文件處理,聊天機器人被要求僅根據上傳的文件回答問題。Gemini 和 ChatGPT 都提供正確的答案,但在上傳檔案時建議謹慎。ChatGPT 在處理檔案方面可能比 Gemini 略勝一籌,但差異很小。

創意寫作:詩歌生成

AI 聊天機器人可以協助創意寫作,包括笑話、獨白和詩歌。

當要求寫一首自由詩時,ChatGPT 更嚴格地遵守指示。Gemini 的詩沒有使用標點符號,而 Copilot 的詩因為換行而感覺不足。

複雜推理:考試題目

透過向聊天機器人展示電腦科學、數學和物理學的四年制大學考試題目來測試複雜推理。

聊天機器人表現非常出色,有效地回答了所有物理問題。ChatGPT 總體上返回的錯誤答案最少。

Chrome 中的 Gemini:無縫整合

Chrome 現在整合了 Gemini。付費帳戶持有者可以點擊 Gemini 圖示以開啟聊天視窗,像往常一樣與 Gemini 互動並查詢活動標籤頁的內容。Chrome 中的 Gemini 整合讓使用者無需開啟新的標籤頁即可透過類似於 Edge 中 Copilot Vision 的功能詢問 Gemini,儘管 Gemini 的 Live 功能在其網路介面中不可用。

文字回應速度令人印象深刻。回應速度讓人懷疑 Gemini 是否在您與之分享之前對網頁具有一定程度的存取權限。

雖然 Chrome 中的 Gemini 有一些限制;Gemini 無法理解影片,而且使用 Live 的回應不如透過文字的回應那麽快,但總體而言它很有用,因為它消除了複製和貼上的需要。但是,除非您一直使用 Gemini,否則您省下時間讓它點擊一下可能不是一件大事。Live 功能同樣有用,讓我可以在不需要觸碰鍵盤的情況下詢問我所看內容的問題。

Chrome 中的 Gemini 對它可以查看和理解的內容有一些限制。因此,Gemini 會讓人覺得具有侵入性,Gemini 可以查看並回應關於某些標籤頁的問題(一旦您與之分享)。

Google 應用程式整合:增強的生產力

AI Pro 方案訂閱者可以在 Google 的應用程式中使用 AI 功能,包括 Calendar、Docs、Drive、Gmail、Maps、Keep、Photos、Sheets 和 YouTube Music。

Google 在 Gemini 自己的網站上強調了這些整合。您可以根據傳單將事件新增到 Google Calendar,在 Google Keep 中產生購物清單,或讓 Gemini 在 YouTube Music 中策劃播放清單。Docs、Gmail、Sheets 和 Slides 中的 Gemini 鏡像了 Microsoft 365 應用程式中的 Copilot,根據提示建立投影片、起草電子郵件、生成文字和建議公式。

Gmail 中的 Gemini 脫穎而出,授予 Gemini 完整存取權限以存取您的電子郵件歷史記錄,允許它搜尋特定資訊或提供收件匣清除建議。但是,它並非萬能的功能。Gemini 無法完成所有操作。這種整合讓人感覺侵犯隱私。

取決於您使用 Gemini 可用整合的程度;可能沒有符合您特定需求的整合。但是,由於其眾多功能,它可能是有益的。

Gems:自訂 AI 專家

Gems 是針對特定目的量身訂製的 Gemini 自訂版本。教師可以新增檔案並建立 PC Builder Gem 以協助首次電腦組裝者。

回應與與 Gemini 交談略有不同。計畫與 Gemini 談論指定主題的人可以建立 Gem。但是,Gems 並不覺得它們真正兌現了 Google 的承諾。

安全與隱私

Gemini 沒有意識,無法像人類一樣思考或理解事物。

成人內容、非法活動、逼真人物圖片和禁忌主題違反了 Gemini 的政策,Gemini 對其過濾系統最寬鬆。

Gemini 有一個上下文視窗。Gemini 的 AI Pro 方案上的上下文視窗最多可一次處理 1,500 頁文字或 30,000 行程式碼(付費)。如果廣泛使用免費版本,訂閱者可能會遇到障礙。

當您使用 Gemini 時,Google 會收集數據,包括檔案、位置資訊、產品使用情況和聊天記錄。此數據用於改進 Google 產品和機器學習技術。

使用者可以關閉 Gemini 應用程式活動。預設情況下,Google 會儲存聊天數據 18 個月。

至於 Gemini 的 Google Workspace 整合,例如在 Gmail、Docs、Drive、Sheets 和 Slides 中,Google 承諾不會使用訓練模型、出售它或將其用於目標廣告。

Google 過去曾遇到過問題,包括利用 Google Chrome 漏洞的惡意行為者、義大利監管機構因其數據實踐而引用 Google,以及未經同意收集數據導致數十億的損失。因此,建議不要分享敏感數據。