阿里巴巴新AI模型：能讀懂你的情緒 | zh-TW

深入探討視覺情感智慧

人工智慧在理解人類輸入方面取得了顯著進展，無論是打字、口語還是隱含的訊息。但現在，前沿領域正轉向能夠視覺感知人類情感的 AI。

中國科技巨頭阿里巴巴正以其最新的開源 AI 模型 R1-Omni 推動這一邊界。該模型超越了傳統 AI 主要分析文本的局限性。R1-Omni 的設計目的是觀察你——它會仔細追蹤面部表情、肢體語言，甚至周圍的環境背景來推斷情緒。

在一個引人注目的演示中，阿里巴巴展示了 R1-Omni 從影片片段中識別情緒的能力。同時，該模型描述了對象的服裝和他們的位置。這種電腦視覺和情感智慧的融合代表了一次重大的飛躍。

雖然情緒檢測 AI 的概念並非全新——例如，Tesla 已經採用 AI 來檢測駕駛員的睡意——但阿里巴巴的模型提升了這項技術。通過提供一個開源套件中的情緒識別功能，任何人都可以免費下載，阿里巴巴將這種先進功能的訪問權民主化。

R1-Omni 發布的時機似乎具有戰略意義。就在上個月，OpenAI 推出了 GPT-4.5，強調其在對話中增強的情感細微差別檢測。然而，存在一個關鍵的區別：GPT-4.5 僅限於文本。它從書面輸入中推斷情緒，但缺乏視覺感知它們的能力。

此外，價格差異很大。GPT-4.5 只能通過付費訂閱（Plus 每月 20 美元，Pro 每月 200 美元）訪問，而阿里巴巴的 R1-Omni 在 Hugging Face（一個用於託管和共享 AI 模型的平台）上完全免費。

阿里巴巴的動機不僅僅是超越 OpenAI。自從另一家中國 AI 初創公司 DeepSeek 在某些基準測試中超越 ChatGPT，擾亂了整個行業以來，該公司就開始了一場積極的 AI 運動。這引發了中國主要科技巨頭之間的競爭，阿里巴巴處於領先地位。

阿里巴巴一直在嚴格地將其 Qwen 模型與 DeepSeek 進行基準測試，與 Apple 建立合作夥伴關係，將 AI 集成到中國的 iPhone 中，現在又推出了情感感知 AI，以保持對 OpenAI 的壓力。

重要的是要注意，R1-Omni 尚未具備讀心術的能力。雖然它可以識別情緒，但目前還不能對它們做出反應。然而，發展軌跡是明確的：如果 AI 已經可以辨別我們的快樂或煩惱，那麼它多久會開始根據我們的情緒定制其反應？這種前景既令人興奮又令人不安。

阿里巴巴的戰略不僅僅集中在情感 AI 上。該公司正在採取一種全面的方法，涵蓋人工智慧的各個方面。這包括：

阿里巴巴的努力是中國更大趨勢的一部分，中國政府和私營部門都在大力投資 AI 研究和開發。中國的目標是成為 AI 領域的全球領導者，像阿里巴巴這樣的公司在實現這一目標方面發揮著重要作用。

中美 AI 公司之間的競爭日益激烈，導致該領域的快速發展。這種競爭正在推動創新，並推動 AI 的可能性邊界。

隨著 AI 越來越有能力理解和回應人類的情緒，倫理考量變得至關重要。出現了一些關鍵問題：

解決這些倫理挑戰對於確保情緒感知 AI 的負責任開發和部署至關重要。

儘管存在倫理問題，但情緒感知 AI 有潛力徹底改變各個行業和應用：

情緒感知 AI 的發展仍處於早期階段，但潛力巨大。隨著技術的進步，我們可以期待看到更複雜的模型，可以準確地解釋和回應各種人類情緒。

這可能會導致一個 AI 不僅智能而且具有情感智慧的未來，能夠與人類建立更深層次、更有意義的聯繫。然而，我們必須謹慎行事，仔細考慮倫理影響，並確保這項技術用於造福人類。有益和侵入之間的界限越來越模糊。隨著 AI 越來越適應我們的感受，深思熟慮的開發和負責任的部署的需求變得越來越重要。

更新於 2025-03-14