Google 近期推出了一款突破性的應用程式 Edge Gallery,它賦予使用者直接在智慧型手機上執行大型語言模型 (LLM) 的能力,消除了對網路連線的需求。目前該應用程式僅適用於 Android 裝置,使用者可透過 Google AI Edge GitHub 儲存庫取得,而 iOS 版本預計在不久的將來發布。
根據 Google 的官方公告,Google AI Edge Gallery 是一個開源的 Android 應用程式,旨在作為開發人員的互動平台。該應用程式充當開發人員和技術愛好者的測試環境,讓他們可以探索邊緣 AI 的能力,邊緣 AI 指的是直接在裝置上執行 AI 演算法,而不是依賴雲端處理。
探索 Edge Gallery 應用程式
Edge Gallery 應用程式為使用者提供了一系列可供下載的模型,範圍從約 500MB 的精簡版本到約 4GB 的更複雜的模型。要存取這些模型,使用者需要登入 Hugging Face 平台並接受相關的使用條款。這些模型大多是開源的,可以免費使用。
可用的模型包括 Google 的 Gemma 3 和新推出的 Gemma 3n,以及阿里巴巴的 Qwen 2.5。下載後,使用者可以透過三個主要功能與這些模型互動:參與即時對話、上傳和解讀圖像,以及使用 Prompt Lab,這是一種單輪互動模式,使用者提供問題或陳述,並接收 AI 產生的回應。
離線功能的優勢
該應用程式的顯著特點在於其完全離線運作的能力。一旦安裝了模型,使用者就可以在不需要有效資料連線的情況下與其互動,使其成為遠端環境或連線能力有限的使用者的理想選擇。這種離線能力確保了對 AI 功能的不間斷存取,無論網路是否可用。
Gemma 3n:一款出色的模型
Edge Gallery 系列中的一個值得注意的產品是 Google 的 Gemma 3n 模型,該模型經過精心設計,可在智慧型手機上無縫運作,同時最大限度地減少記憶體消耗。儘管它被歸類為小型語言模型,但它在各種效能指標上表現出色。在 LMArena 文字任務排行榜中,Gemma 3n 取得了 1293 分。作為參考,OpenAI 的 o3-mini 模型得分略高,為 1329 分,而 o4-mini 模型則獲得了 1379 分。表現最佳的仍然是 Google 的 Gemini 2.5 Pro,得分為 1446 分。
離線模型的限制
與任何離線模型一樣,存在一些限制。AI 無法存取超出其訓練截止範圍的即時資料或事件。例如,Gemma 3n 的知識僅更新到 2024 年 6 月。此限制意味著該模型的回應可能無法反映最新的資訊或發展。
生成式 AI 的未來
透過直接將強大的 AI 功能整合到行動裝置中,Google 展示了其技術實力,並為生成式 AI 可以獨立於雲端連線運作的未來鋪平了道路。這種向邊緣 AI 的轉變有望在教育、醫療保健和娛樂等多個領域釋放 AI 應用程式的新可能性。
深入探討 Edge Gallery 的功能
Google AI Edge Gallery 應用程式標誌著在使人工智慧更易於存取和多功能方面邁出了重要的一步。透過讓使用者直接在智慧型手機上執行複雜的 AI 模型,Google 正在普及對先進技術的存取,並賦予使用者以新穎的方式利用 AI 力量的能力。
即時對話
即時對話功能允許使用者與 AI 模型進行動態對話。此功能可用於各種目的,例如集思廣益、練習語言技能或僅僅進行引人入勝的對話。AI 模型旨在提供連貫且在上下文中相關的回應,使互動感覺更自然和直觀。
圖像上傳和解讀
上傳和解讀圖像的能力開啟了廣泛的可能性。使用者可以上傳物件、場景甚至手寫文字的圖像,AI 模型將嘗試識別和解讀內容。此功能可用於物件識別、圖像分類甚至光學字元辨識 (OCR) 等任務。例如,使用者可以上傳一張花的圖片,AI 模型可以識別花的種類。
Prompt Lab
Prompt Lab 提供了一種單輪互動模式,使用者可以在其中輸入問題或陳述並接收 AI 產生的回應。此功能對於快速資訊檢索、創意寫作提示或產生對主題的不同觀點非常有用。AI 模型經過訓練,可提供全面且內容豐富的回應,使 Prompt Lab 成為教育和娛樂目的的寶貴工具。
邊緣運算的意義
Edge Gallery 應用程式是邊緣運算的一個主要範例,邊緣運算涉及在更接近來源(在本例中為智慧型手機)的位置處理資料。與傳統的雲端運算相比,邊緣運算具有多個優勢,包括減少延遲、提高隱私和改善可靠性。
降低延遲
透過在裝置本機處理資料,Edge Gallery 應用程式無需將資料傳送到遠端伺服器進行處理。這顯著降低了延遲,從而縮短了回應時間並提供了更無縫的使用者體驗。對於需要即時互動的應用程式(例如即時對話功能)而言,這一點尤其重要。
提高隱私
邊緣運算還可以透過將敏感資料保留在裝置上來提高隱私。這降低了資料洩露和未經授權存取的風險。就 Edge Gallery 應用程式而言,使用者資料在本機處理,不會傳輸到 Google 的伺服器(除非使用者選擇共用)。
提升可靠性
透過獨立於網路連線運作,Edge Gallery 應用程式比基於雲端的 AI 應用程式更可靠。這在網路連線有限或不可靠的地區尤其重要。即使使用者離線,該應用程式也可以繼續運作,確保不會中斷對 AI 功能的存取。
離線 AI 的更廣泛影響
離線 AI 模型(例如 Edge Gallery 應用程式中提供的那些模型)的開發,對廣泛的行業和應用具有重大影響。
教育
離線 AI 可以在網路連線有限的地區提供對個人化學習資源的存取。無論學生的位置或網路存取如何,他們都可以使用 AI 支援的輔導和教育工具。
醫療保健
離線 AI 可以透過提供對診斷工具和治療建議的存取,協助偏遠地區的醫療保健專業人員。這可以改善服務欠缺社群的照護品質。
緊急應變
離線 AI 可用於在網路連線中斷的災害情況下協助緊急應變人員。AI 支援的工具可以幫助應變人員評估損害、找到受害者並協調救援工作。
無障礙功能
對於網路存取有限或沒有網路存取權限的個人,離線 AI 可以提供對資訊、通訊工具和其他基本服務的存取。
開發離線 AI 模型的挑戰
雖然離線 AI 提供了許多優勢,但開發和部署這些模型也帶來了一些挑戰。
資源限制
與雲端伺服器相比,智慧型手機和其他行動裝置的處理能力和記憶體有限。這就需要開發更小、更高效的 AI 模型,才能在這些裝置上有效運作。
資料隱私
在裝置本機處理資料時,確保資料隱私至關重要。開發人員必須實施強大的安全措施,以保護使用者資料免受未經授權的存取。
模型更新
更新離線 AI 模型可能具有挑戰性,因為這些模型未連線到網際網路。開發人員必須找到有效且安全地發布模型更新的方法。
道德考量
與任何 AI 技術一樣,道德考量至關重要。開發人員必須確保負責任地使用離線 AI 模型,並且不會使偏見永久化或導致有害的結果。
展望未來
Google AI Edge Gallery應用程式代表了人工智慧領域的重大進步。透過讓使用者直接在智慧型手機上執行強大的AI模型,Google正在普及對AI的存取,並為一個AI更易於存取、多功能和可靠的未來鋪平了道路。隨著技術的不斷發展,我們很可能會在未來幾年內看到更多離線AI的創新應用。在不依賴持續網路連線的情況下利用AI能力,無疑將對我們生活的各個方面產生變革性的影響,從教育和醫療保健到緊急應變和無障礙功能。Edge Gallery應用程式只是對未來令人興奮的可能性的一瞥。離線AI的未來是光明的,它改善全球人民生活的潛力是巨大的。