中國正經歷AI Agents的蓬勃發展,這些複雜的系統旨在自主地為用戶執行任務。這一趨勢延續了去年對基礎模型(Foundation Models)的關注,這些大型語言模型(Large Language Models,LLMs)為大部分AI革命提供動力。現在,重點已轉向創建能夠處理廣泛功能的AI Agents,從管理電子郵件到規劃複雜的行程。
AI Agent新創公司的湧現
最近湧現了眾多中國新創公司,致力於構建能夠顯著提高生產力和便利性的一般用途數字工具。這些AI Agents旨在協助處理各種任務,包括回覆電子郵件、進行網路研究以規劃假期,甚至創建互動式網站。這些新創公司的崛起非常迅速,許多都是在過去幾個月內出現的,其靈感來自Manus的成功,這款AI Agent在社交媒體上引起了相當大的轟動。
與主要回應用戶查詢的大型語言模型(LLMs)不同,這些AI Agents建立在LLMs之上,採用結構化的、基於工作流程的方法來完成任務。這涉及與AI的一種不同交互模式,專注於管理和執行多步驟流程,例如預訂航班、組織日程安排和進行深入研究。這些Agents的區別在於它們能夠利用外部工具並保留指令,從而確保無縫且高效的用戶體驗。
中國在AI Agents領域的潛在領導地位
中國有充分的條件引領AI Agents的發展,這要歸功於其獨特的生態系統,該生態系統的特點是緊密集成的應用程式、快速的產品開發週期以及精通數位化的用戶群。這種環境特別有利於將AI嵌入到日常生活中,使使用者更容易採用這些工具並將其整合到日常例程中。
目前,中國領先的AI Agent新創公司主要針對國際市場。這主要是因為許多最先進的西方AI模型在中國的網路防火牆內無法使用。然而,這種情況正在發生變化,因為像ByteDance和Tencent這樣的主要科技公司正在開發自己的AI Agents。這些Agents可以直接整合到他們現有的超級應用程式中,利用其生態系統中龐大的數據和資源來增強日常生活中各個方面的自動化。
定義AI Agents的功能和效用的競賽正在加劇,雄心勃勃的新創公司和老牌科技巨頭都在探索如何有效地實施這些工具以及針對哪些用戶群體。這種競爭格局正在推動創新,並突破AI Agents可以實現的界限。
Manus:AI Agent領域的開路先鋒
由新創公司Butterfly Effect開發的Manus經歷了顯著的成長。該公司獲得了由美國風險投資公司Benchmark領投的7500萬美元融資,進行了全球巡迴展以推廣其產品,並顯著擴大了員工隊伍。
早在5月份公開發布之前,Manus就已成為通用、以消費者為中心的AI Agent應該能夠做到的基準。與專為特定業務任務設計的AI Agents不同,Manus旨在協助處理各種日常任務,例如規劃旅行、比較股票期權以及協助處理學校專案。
Manus提供了一個獨特的基於瀏覽器的沙盒環境,允許用戶實時監控Agent的活動。此功能使用戶能夠觀察Agent導航網頁、閱讀文章和編碼操作。此外,Manus主動尋求用戶的澄清,並保持長期記憶,為未來的任務提供背景資訊,從而增強其處理複雜和持續專案的能力。
根據Simular的共同創辦人兼CEO Ang Li的說法,Simular是一家專注於創建運行真實電腦的AI Agents的新創公司,Manus代表了AI Agent用戶體驗的重大進步。他認為,由於激烈的國內競爭,中國新創公司在設計消費產品方面具有明顯的優勢,這推動了快速創新和對產品細節的細緻關注。
競爭與全球雄心
AI Agent市場的競爭正在迅速加劇。Genspark和Flowith等新興參與者已經展示了與Manus相當或超過Manus的基準分數。這些新創公司與Manus有著共同的全球雄心,Genspark和Flowith都將國際市場作為其最初的重點。
由中國企業家領導的新創公司,如Manus、Genspark和Flowith,越來越有準備融入全球科技領域,並在國際範圍內有效競爭。行業專家和投資者認為,這些公司的特點是其敏捷性、高效的執行力以及快速開發創新產品的能力。
財務激勵也推動了海外發布。更高的客戶消費能力和有利的匯率使國際市場特別有吸引力。正如Manus共同創辦人Xiao Hong所指出的,以美元定價可能會產生顯著的收入倍數。這使得在國際市場運營具有很高的吸引力,即使文化差異可能會帶來一些挑戰。
中國市場的挑戰與機遇
在中國境內創建類似的AI Agent功能面臨著獨特的挑戰。由於地緣政治風險和監管複雜性,像OpenAI和Anthropic這樣的主要美國AI公司選擇避開中國大陸。這種缺席最初導致了一個黑市,用戶依靠VPN和第三方鏡像來訪問像ChatGPT和Claude這樣的工具。然而,這種差距刺激了DeepSeek、Doubao和Kimi等本地中國聊天機器人的增長,儘管對國外模型的需求仍然很大。
例如,Manus利用Anthropic的Claude Sonnet,它被廣泛認為是用於Agent任務的領先模型。Manus共同創辦人Zhang Tao一直讚揚Claude管理工具、記住上下文和進行多輪對話的能力,所有這些對於將AI從單純的聊天機器人轉變為有效的執行助理至關重要。
然而,對Sonnet的依賴意味著沒有VPN,Manus在中國境內實際上無法使用。從中國大陸IP地址訪問Manus的用戶將看到一條通知,告知團隊正在努力整合Qwen的模型,這是一個基於阿里巴巴開源模型的本地版本。
參與ByteDance的AI Agent開發的一位工程師表示,缺乏Claude Sonnet模型極大地限制了他們在中國的能力。他指出,雖然DeepSeek的開放模型可用,但它們仍然經常產生幻覺,並且沒有充分訓練現實世界的工作流程。開發人員普遍認為阿里巴巴的Qwen系列是最好的國內替代品,但切換到Qwen可能會導致性能下降。
史丹佛大學以人為本AI研究所的博士後研究員Jiaxin Pei樂觀地認為,這些性能差距會隨著時間的推移而縮小。他認為,將Agent功能整合到基礎LLMs中正在成為許多LLM開發人員的首要重點,並且這些功能的價值將推動快速進展。
專注於海外擴張
目前,Manus優先考慮在它可以輕鬆為用戶提供服務的市場中擴張。該公司表示,其主要重點是國際擴張,最近在舊金山、新加坡和東京開設了新辦事處。
儘管AI Agents的概念仍然相對較新,但中國以消費者為中心的AI應用程式市場已經擠滿了主要的科技公司。DeepSeek仍然是使用最廣泛的,而ByteDance的Doubao和Moonshot的Kimi也越來越受歡迎。然而,這些應用程式中的大多數仍然針對聊天和娛樂進行了優化,而不是任務執行。這種差距促使中國大型科技公司推出自己的用戶代理,這些代理目前的品質參差不齊,並且仍然被認為是不成熟的。
大型科技公司的回應:ByteDance和Zhipu AI
ByteDance目前正在測試Coze Space,這是一個由其Doubao模型系列驅動的AI Agent。Coze Space允許用戶在「計劃」和「執行」模式之間切換,使他們可以直接指導Agent的行為,或者允許它自主工作。它連接到14個流行的應用程式,包括GitHub、Notion和ByteDance的Lark辦公套件。早期評論表明,雖然該工具可能笨拙且失敗率很高,但它的目標是匹配Manus提供的功能。
Zhipu AI推出了AutoGLM Rumination,這是一個基於其ChatGLM模型的免費Agent。總部位於上海的Minimax推出了Minimax Agent。這兩種產品都具有與Manus類似的介面,並演示了基本任務,例如構建一個簡單的網站、規劃旅行、創建簡單的Flash遊戲或運行數據分析。
騰訊的超級應用程式策略
儘管在中國境內推出的大多數通用AI Agents的可用性有限,但主要公司計劃改變這種局面。在5月15日的財報電話會議上,騰訊總裁劉熾平暗示將有一個Agent直接將自動化整合到微信中,微信是中國最普及的應用程式。
微信被認為是最初的超級應用程式,它結合了消息傳遞、移動支付、新聞和數百萬個作為嵌入式應用程式運行的迷你程式。這些迷你程式為騰訊及其開發人員提供了訪問來自廣泛服務的數據的權限,從而在提供整合自動化方面具有顯著優勢。
互操作性挑戰
從歷史上看,中國的消費者互聯網一直因相互競爭的圍牆花園而支離破碎。例如,在微信中分享淘寶連結只會顯示為純文字,而沒有預覽卡片。與互操作性更強的西方互聯網不同,中國的科技巨頭通常抵制彼此整合,優先考慮平台戰爭,而犧牲了無縫的用戶體驗。
然而,迷你程式使微信在前所未有的範圍內接觸到以前抵制互操作性的服務,從健身房預訂到雜貨訂單。一個能夠導航這個生態系統的AI Agent可以繞過獨立新創公司面臨的許多整合挑戰。
阿里巴巴的AI努力
阿里巴巴是Qwen模型系列背後的電子商務巨頭,一直是中國AI競賽的領跑者,但在發布面向消費者的產品方面一直較為遲緩。儘管Qwen是2024年Hugging Face上下載次數最多的開源模型,但直到2025年初,它才為專用聊天機器人應用程式提供動力。3月,阿里巴巴將其雲端儲存和搜尋應用程式Quark重新命名為多合一的AI搜尋工具。到6月,Quark推出了DeepResearch,這是一個新的模式,標誌著迄今為止最具Agent意圖的努力。
中國AI Agents的未來
Simular的Li表示,中國科技產品歷來奉行多合一的超級應用程式方法,最新的中國AI Agents也反映了這一趨勢。他指出,美國的AI Agents更專注於服務特定的垂直領域。
史丹佛大學的研究員Pei認為,現有的科技巨頭在將通用AI Agents變為現實方面可能具有顯著的優勢,特別是那些具有跨服務的內置整合的科技巨頭。他認為,面向消費者的AI Agent市場仍處於早期階段,面臨著諸如身份驗證和責任等挑戰。然而,那些已經在廣泛服務中運營的公司自然更適合大規模部署Agents。