Google 將 Gemini 整合到 Chrome 中,似乎標誌著該科技巨頭邁向更具主動性時代的初步步驟。 這項新功能將 AI 助理直接嵌入到您的瀏覽器中,使其能夠「看到」您的線上活動,並提供與螢幕上內容相關的摘要和答案。
在 Chrome 中與 Gemini 共度早晨
我花了一整個早上試用 Chrome 中的 Gemini 這種新穎的整合。 無需導航至聊天機器人的專用 Web 應用程式,只需點擊位於 Chrome 右上角的新 Gemini 圖示,即可開始對話。 這種整合的決定性特徵在於瀏覽器能夠在您瀏覽網路時「看到」螢幕上顯示的內容。
這種整合給我的印象是 Google 在創建更具主動性 AI 的宏偉願景中的初步進展。 我經常發現自己渴望超越其目前功能的更多功能。 目前,對 Chrome 中 Gemini 早期存取版本的訪問僅限於 AI Pro 或 AI Ultra 的訂閱者,他們使用 Chrome 的 Beta、Dev 或 Canary 版本。
我的初步探索包括使用 Gemini 總結 The Verge 上的文章。 它還擴展到在首頁上發現與遊戲相關的新聞,AI 恰如其分地強調了 Nintendo 向其 Switch Online 服務添加了新的 Game Boy 遊戲,即將上映的 Elden Ring 電影改編版以及 Valve 重大的 Steam Deck 更新。
Gemini 的視野範圍僅限於直接顯示在每個網頁上的內容。 如果您希望總結頁面上的特定元件,例如 The Verge 的評論部分,則必須先展開該元件,然後聊天機器人才能提供回應。 此外,Gemini 可以跟隨您瀏覽多個標籤頁,但一次只能從一個標籤頁收集資訊。
對於那些不喜歡打字的人來說,Chrome 中的 Gemini 提供了一個「即時」功能,可以透過對話方塊右下角的按鈕訪問。 啟動此功能後,您可以口頭提出問題,Gemini 會以聲音回應。
我發現這在觀看 YouTube 影片時特別有用。 例如,當我觀看浴室改造影片時,我問:「他使用的是什麼工具?」 Gemini 回應:「看起來他正在使用釘槍將一些木塊固定在一起。」 在另一個影片中,Gemini 正確地識別了主機板上的電容器,以及 YouTube 用戶用於移除它的鑷子和熱風工具。 它還具有提供影片摘要和有關您跳過的部分的資訊的功能,但是,我發現如果影片沒有標記章節,這並不總是正確的。
此整合最常用的案例之一是 Gemini 從YouTube 影片中提取食譜,這意味著我不必自己寫下食譜或在描述中搜尋連結。 當我要求它指出 Amazon 搜尋頁面上的防水袋時,它也很方便。
不一致和限制
然而,Gemini 的表現並非沒有不一致之處。 當被問及 MrBeast 在展示他探索古代瑪雅城市(包括奇琴伊察)的影片中的位置時,AI 回應說:「我無法訪問即時資訊,因此我無法準確指出 MrBeast 目前的確切位置。」 在重新措辭問題後,它準確地引用了影片描述中提到的位置:墨西哥。 在另一個場合,當尋找購買影片中精選的特定鉗子的連結時,Gemini 重申它無法訪問即時資訊,包括產品列表或商店庫存。 儘管有此限制,但它隨時應要求提供替代產品的連結。
有時,Gemini 回應的長度似乎與 Chrome 中彈出視窗提供的有限空間不成比例。 雖然可以展開視窗,但它會顯著侵占我 13 英寸 MacBook Air 上本已有限的螢幕空間。 AI 的主要吸引力在於它能夠透過提供簡潔明了的答案來加速完成任務,但 Gemini 並非總是能兌現這一承諾,除非明確提示。 此外,AI 重複的後續問題,詢問我是否需要有關特定主題的更多資訊,變得有些令人厭倦。
通往主動式 AI 的道路
儘管存在這些缺點,但很容易想像 Google 將 Gemini 的用途擴展到簡單的問答之外。 Google 希望其 AI 變得「主動式」,這意味著它可以代表您執行任務,而 Chrome 中的 Gemini 似乎有一天會採用這些功能。 例如,在要求 Gemini 總結餐廳的菜單後,我甚至考慮要求它下外賣訂單——這是一個它目前無法完成的主動式任務。 在未來,我甚至可以看到它派上用場,例如讓它為我書籤與旅行研究相關的網頁,或者甚至找到並將不同食譜的 YouTube 影片儲存到我的「稍後觀看」播放列表中。
Google 似乎正在透過 Project Mariner 的 Gemini 應用程式中預定的「代理模式」來實現這一願景。 此功能將使 AI 能夠同時處理多達 10 個任務並獨立搜尋網頁,這可能為將這些功能納入未來 Chrome 中的 Gemini 鋪平道路。 這將導致 Gemini 更多地參與網路搜尋,並使其更容易組織任務和查詢。
未來潛在應用
Gemini 未來在 Chrome 中的應用可能性是廣泛且引人注目的。 想像一下這樣一個場景:AI 無縫地整合到您的線上購物體驗中,主動識別最優惠的價格、比較不同零售商的價格,甚至代表您完成購買,同時遵守您預先定義的偏好和預算。 這種整合程度將把線上購物從一項可能繁瑣的家務轉變為簡化且高效的流程。
此外,考慮一下 Gemini 徹底改變線上研究的潛力。 您無需手動篩選無數的文章和網站,只需任務 Gemini 收集有關特定主題的資訊,指定所需的分析深度、首選來源以及您希望資訊呈現的格式。 然後,Gemini 可以編寫一份包含引文和摘要的綜合報告,從而節省您無數小時的繁瑣研究。
在生產力領域,Gemini 可以成為您終極的個人助理,管理您的日程安排、優先排序您的任務,甚至根據您的指示起草電子郵件和簡報。 想像一下將您的想法和想法口述給 Gemini,然後 Gemini 會將它們轉化為精美且專業的簡報,其中包含相關的視覺效果和數據。 這將使您擺脫從頭開始創建簡報的耗時任務,讓您可以專注於工作中更具策略性的方面。
對於學生來說,Gemini 可以作為一種寶貴的學習資源,提供個人化的輔導、回答問題,甚至協助完成研究作業。 想像一下,您可以要求 Gemini 用簡單的術語解釋一個複雜的概念,或提供範例和插圖來幫助您更好地理解材料。 這將使學習更具吸引力和有效性,並使學生能夠掌控自己的教育。
解決疑慮和挑戰
然而,AI 融入我們日常生活中也引發了一些合法的疑慮,必須主動解決。 最緊迫的疑慮之一是 AI 演算法中存在偏差的可能性。 如果用於訓練這些演算法的資料反映了現有的社會偏見,那麼 AI 可能會延續甚至放大這些偏見。 重要的是要確保 AI 演算法使用多元且具有代表性的資料集進行訓練,並定期進行偏差審核。
另一個疑慮是 AI 自動化可能導致的職位流失。 隨著 AI 越來越能夠執行以前由人類完成的任務,許多職位可能會被淘汰。 為了減輕這種風險,必須投資於教育和培訓計劃,使工人掌握在 AI 時代蓬勃發展所需的技能。 這包括培養批判性思維、解決問題和創造力等技能,這些技能很難被 AI 複製。
最後,在使用 AI 方面存在倫理方面的考量,尤其是在隱私和安全等領域。 必須建立明確的指導方針和法規來管理 AI 的開發和部署,確保以負責任和合乎道德的方式使用它。 這包括保護個人隱私、防止濫用 AI 進行惡意目的,並確保 AI 系統具有透明度和問責制。
AI 整合的未來
Google 在 Chrome 中推出的 Gemini 是朝著更整合和更智慧的瀏覽體驗邁出的有希望的一步。 雖然目前的實施有其局限性,但它讓我們看到了 AI 改變我們與 Web 互動方式的潛力。 隨著 AI 技術的不斷發展,我們可以期望看到 AI 更加複雜和無縫地整合到我們的日常生活中。 關鍵是要主動解決與 AI 相關的倫理和社會挑戰,確保以造福整個人類的方式使用它。
瀏覽器(如 Chrome)中 AI 整合的發展也需要重新評估現有的 Web 標準和安全協議。 隨著 AI 能夠更深入地解釋 Web 內容並與之互動,可能會出現新的漏洞,這些漏洞可能會被惡意行為者利用。 因此,瀏覽器開發人員和安全專家必須合作開發新的安全措施,以保護用戶免受這些新興威脅。 這包括加強對網路釣魚攻擊、惡意軟體和其他形式的線上詐騙的防禦。
此外,越來越多地依賴瀏覽器中的 AI 也可能導致新的數位鴻溝的產生。 無法存取高速網路或高級計算設備的個人可能會處於劣勢,因為他們將無法充分利用 AI 驅動的瀏覽器的功能。 為了解決這個問題,必須投資於基礎設施改進和數位素養計劃,以確保每個人都有機會從 AI 技術的進步中受益。
此外,將 AI 整合到瀏覽器中也可能對廣告產業產生重大影響。 隨著 AI 越來越善於了解用戶的偏好和行為,它可以被用來投放更有針對性和個人化的廣告。 雖然這可能會帶來更相關且更具吸引力的廣告體驗,但也引發了對隱私和資料安全的疑慮。 監管機構和產業利益相關者必須制定明確的指導方針和法規來管理 AI 在廣告中的使用,確保用戶的隱私得到保護並且負責任地使用資料。