中國AI路徑:重實用整合,非純算力競賽

全球圍繞人工智能的討論,似乎常常聚焦於一場無休止的軍備競賽——誰能建構出最大、最強的大型語言模型(LLM)?近期的進展,例如中國 DeepSeek 等模型展現出的驚人能力,無疑助長了這種說法。在全球和國內經濟面臨挑戰的背景下,這樣的技術飛躍提供了一個誘人的未來潛力一瞥,或許也是一個亟需的增長催化劑。然而,若僅僅關注這些引人注目的 LLM,就如同見樹不見林。人工智能,以較不張揚但影響深遠的方式,多年來早已深深融入我們數位生活的結構之中。

想想那些主導線上互動和商業的無處不在的平台。若沒有精密的推薦演算法不斷為內容推送量身定制,TikTok 或其中國對應產品 Douyin,能否達到如此驚人的全球覆蓋率?同樣地,無論是像 Amazon、Shein 和 Temu 這樣的國際玩家,還是像淘寶和 JD.com 這樣的國內巨頭,其電子商務的成功遠不止於高效的採購和物流。AI 如同無形之手,巧妙地引導著我們的選擇。從我們考慮購買的書籍到我們採用的時尚潮流,我們的消費習慣越來越受到分析我們過去購買記錄、瀏覽歷史和點擊模式的系統所塑造。早在對話式 AI 能夠應要求創作優雅詩歌之前,像 Amazon 和 Google 這樣的公司就已率先使用 AI 來理解和預測消費者行為,從根本上改變了市場。這種更安靜、更普遍的 AI 形式數十年來一直在重塑商業和媒體消費,其運作往往低於我們的意識閾值。

大型語言模型的雙刃劍

像 DeepSeek 這樣強大 LLM 的出現,無疑代表了一個重要的技術里程碑。它們生成類人文本、翻譯語言,甚至創作如詩歌等創意內容的能力令人矚目。這些工具作為個人助理、研究輔助和創意夥伴,擁有巨大的潛力。想像一下利用這樣的模型來草擬電子郵件、總結冗長文件或進行腦力激盪——提升個人生產力的潛力顯而易見。

然而,這種能力伴隨著重大的警示,根源於這些模型運作的本質。LLM 建立在複雜的統計方法和龐大的神經網絡之上,這些網絡在巨大的數據集上進行訓練。它們擅長識別模式和預測最可能的詞語序列,但它們並不具備真正的理解或意識。這種統計基礎導致了一個關鍵的脆弱性:幻覺 (hallucinations)。當面對其訓練數據之外的主題,或需要細緻判斷的查詢時,LLM 可能會自信地生成聽起來合理但完全錯誤或誤導性的資訊。

可以將 LLM 不視為絕無謬誤的神諭,而或許是一位博覽群書、口才流利但有時會虛構事實的專家。雖然 DeepSeek 可能會譜寫一首動人的十四行詩,但依賴它進行關鍵的法律解釋、精確的醫療診斷或高風險的財務建議將是極不明智的。使其能夠生成流暢文本的統計概率引擎,也使其在缺乏確定知識時傾向於編造「事實」。雖然較新的架構和推理模型(如 DeepSeek 的 R1 或 OpenAI 傳聞中的 o1/o3)旨在緩解這個問題,但它們尚未完全消除。一個萬無一失、保證在任何情況下都準確的 LLM 仍然遙不可及。因此,雖然 LLM 可以成為個人的強大工具,但其使用必須輔以批判性評估,尤其是在基於其輸出的決策具有重大影響時。它們增強了人類的能力;它們不能在關鍵領域取代人類的判斷。

企業與政府AI實施的導航

儘管對於高風險、開放式查詢存在固有限制,LLM 仍為企業和政府機構提供了巨大的價值主張,尤其是在受控環境中。它們的優勢不在於取代決定性的決策,而在於簡化流程和提取洞見。關鍵應用包括:

  • 流程自動化: 處理例行任務,如數據輸入、客戶服務預篩選、文件摘要和報告生成。
  • 工作流程優化: 根據數據分析識別瓶頸、建議效率改進方案,以及管理複雜的專案時程。
  • 數據分析: 處理大量數據集以揭示趨勢、相關性和可能被人類忽略的異常情況,輔助戰略規劃和資源分配。

對於政府和企業使用而言,數據安全和保密性是一個關鍵方面。像 DeepSeek 這樣的開源模型的可用性在此處呈現出優勢。這些模型可能可以部署在專用、安全的政府或企業數位基礎設施內。這種「本地部署 (on-premises)」或「私有雲 (private cloud)」方法允許處理敏感或機密資訊,而無需將其暴露給外部伺服器或第三方提供商,從而降低了重大的隱私和安全風險。

然而,當考慮到面向公眾的政府應用時,情況就大不相同了,因為所提供的資訊必須具有權威性且絕對準確。想像一位公民向一個由 LLM 驅動的政府門戶網站查詢社會福利資格、稅收法規或緊急程序。即使 AI 在 99% 的時間裡生成完全正確的回應,剩下 1% 的誤導性或不準確答案也可能產生嚴重後果,侵蝕公眾信任、造成經濟困難,甚至危及安全。

這就必須實施強健的保障措施。潛在的解決方案包括:

  • 查詢過濾: 設計系統以識別超出預定義的安全、可驗證答案範圍的查詢。
  • 人工監督: 標記複雜、模糊或高風險的查詢,交由人類專家審核和回應。
  • 置信度評分: 編程讓 AI 表明其對答案的確定性程度,提示用戶對低置信度的回應尋求驗證。
  • 答案驗證: 在向公眾展示之前,將 AI 生成的回應與已知、準確資訊的策劃數據庫進行交叉引用。

這些措施凸顯了當前 LLM 技術固有的根本性張力:其令人印象深刻的生成能力與在關鍵情境下對準確性和可靠性的絕對要求之間的權衡。管理這種張力是在公共部門負責任地部署 AI 的關鍵。

邁向可信賴AI:知識圖譜方法

中國的做法似乎越來越側重於通過將 AI 整合到特定的、受控的應用中來應對這種張力,同時積極尋求增強可靠性的方法。一個引人注目的例子是在大灣區城市珠海展開的智慧城市計劃。該市政府最近對 Zhipu AI 進行了重大的戰略投資(約 5 億元人民幣或 6900 萬美元),表明了將先進 AI 嵌入城市基礎設施的承諾。

珠海的雄心超越了簡單的自動化。其目標是全面、分層地實施 AI,旨在實現公共服務的切實改善。這包括通過實時數據分析優化交通流量,整合各政府部門之間不同的數據流以進行更全面的決策,並最終為市民創造一個更高效、更靈敏的城市環境。

這項工作的核心是 Zhipu AI 的 GLM-4 通用語言模型。雖然它精通處理中英文任務並具備多模態能力(處理文本以外的資訊),但其關鍵的差異化因素在於其架構。Zhipu AI 是清華大學著名的知識工程實驗室 (Knowledge Engineering Group) 的衍生公司,它將結構化數據集和知識圖譜納入其學習過程。與主要從大量非結構化文本(如網站和書籍)中學習的傳統 LLM 不同,Zhipu AI 明確利用了經過策劃的高精度知識圖譜——即事實、實體及其關係的結構化表示。

該公司聲稱這種方法顯著降低了模型的幻覺率,據報導在最近的全球比較中達到了最低水平。通過將 AI 的統計推斷建立在經過驗證的結構化知識框架(正如「知識工程」的起源所暗示的那樣)之上,Zhipu AI 旨在構建一個更可靠的認知引擎。這代表著從純粹的統計模型向整合事實基礎的系統邁出的實際一步,從而增強了諸如珠海智慧城市項目中所設想的特定應用的可信賴性。

神經符號整合的探索

Zhipu AI 的例子暗示了人工智能演進中預期的一個更廣泛、更根本的轉變:統計神經網絡與符號邏輯推理的整合。雖然當前的 LLM 主要代表了神經網絡的勝利——擅長模式識別、處理感官數據和生成統計上可能的輸出——但下一階段可能涉及將這種「直覺」能力與傳統符號 AI 的結構化、基於規則的推理特性相結合。

這種神經符號整合 (neuro-symbolic integration) 常被描述為 AI 研究中的「聖杯」,正因為它有望結合兩者的優點:神經網絡的學習和適應能力,以及符號系統的透明度、可驗證性和明確推理。想像一個 AI,它不僅能識別數據中的模式,還能根據既定的規則、法律或邏輯原則解釋其推理過程。

實現無縫整合提出了許多複雜的挑戰,涵蓋理論框架、計算效率和實際實施。然而,構建強健的知識圖譜 (knowledge graphs) 代表了一個切實的起點。這些事實和關係的結構化數據庫提供了錨定神經網絡推斷所需的符號基礎。

可以設想在中國進行一項大規模、由國家資助的努力,或許呼應明代編纂百科全書式《永樂大典》的宏偉工程。通過在精確性不容妥協的關鍵領域——如醫學、法律、工程和材料科學——以數位方式編纂大量經過驗證的資訊,中國可以創建基礎性的知識結構。將未來的 AI 模型錨定在這些經過編纂的、結構化的知識基礎上,將是使其更可靠、更不易產生幻覺,並最終在關鍵應用中更值得信賴的重要一步,同時也可能在此過程中推動這些領域的前沿發展。

自動駕駛:中國的生態系優勢

或許最引人注目的、中國似乎準備好利用其對整合、可靠 AI 的關注的領域是自動駕駛 (autonomous driving)。此應用與通用語言模型不同,因為安全不僅是可取的,而且是至關重要的。在複雜、不可預測的真實世界環境中操作車輛,需要的遠不止模式識別;它需要基於交通法規、物理約束、倫理考量以及對其他道路使用者行為的預測性推理,做出瞬間決策。

因此,自動駕駛系統需要一個真正的神經符號架構

  • 神經網絡對於處理來自攝像頭、激光雷達 (lidar) 和雷達的大量感官數據,識別行人、自行車手和其他車輛等物體,以及理解周圍環境至關重要。
  • 符號邏輯對於實施交通規則(紅燈停、讓行權)、遵守物理限制(剎車距離、轉彎半徑)、在複雜場景中做出透明、可驗證的決策,甚至可能處理倫理困境(如不可避免的事故選擇,儘管這仍然是一個極其複雜的領域)至關重要。

自動駕駛汽車必須有效地融合數據驅動的「直覺」與基於規則的推理,以一致且可預測的方式行動,確保在動態情況下的自適應安全。它不能承受在較不關鍵的 AI 應用中可接受的那種「幻覺」或概率性錯誤。

在此,中國擁有一系列獨特的匯聚因素,為自動駕駛的開發和部署創造了一個肥沃的生態系統,可以說超越了其他全球大國:

  1. 世界領先的電動汽車 (EV) 供應鏈: 中國主導著電動汽車及其零部件,特別是電池的生產,提供了強大的工業基礎。
  2. 廣泛的充電基礎設施: 快速擴展的充電站網絡緩解了里程焦慮,並支持了廣泛的 EV 普及。
  3. 先進的 5G 網絡: 高帶寬、低延遲的通信對於車聯萬物 (V2X) 通信至關重要,能夠實現車輛與基礎設施之間的協調。
  4. 智慧城市整合: 像珠海這樣的計劃表明,願意將交通系統與更廣泛的城市數據網絡整合,優化交通流量並啟用先進的自動駕駛功能。
  5. 普遍的網約車服務: 消費者對網約車應用程序的高度接受為機器人出租車 (robotaxi) 服務創造了一個現成的市場,為自動駕駛汽車的商業化提供了清晰的路徑。
  6. 高 EV 採用率: 與許多西方國家相比,中國消費者更願意接受電動汽車,創造了一個龐大的國內市場。
  7. 支持性的監管環境: 雖然安全仍然是關鍵,但政府似乎支持自動駕駛技術的測試和部署,例如在武漢等城市已經進行的 robotaxi 運營就是證明。

與其他地區形成對比。美國,儘管有 Tesla 的開創性努力,但在已開發國家中,整體 EV 採用率顯著落後,這一趨勢可能因政策轉變而加劇。歐洲擁有強勁的 EV 採用率,但缺乏同樣集中的主導性國內 EV 製造商或專注於此整合的全球領先 AI 巨頭。

因此,中國的戰略優勢似乎不在於擁有單一最強大的 LLM,而在於協調這個複雜的生態系統。各個環節正在到位——從製造實力到數位基礎設施和消費者接受度——可能使自動駕駛汽車在十年內從利基測試走向主流應用,甚至可能在今年看到顯著的起飛。隨著這些車輛與不斷發展的智慧城市基礎設施無縫整合,其全部變革力量將被釋放。

轉移焦點:從計算能力到整合生態系

儘管美國和其他參與者似乎常常陷入一場「計算競賽」,專注於芯片霸權、龐大的伺服器基礎設施,以及通過越來越大的 LLM 實現基準領先,但中國似乎正在推行一種互補的、或許最終更具影響力的策略。該策略強調將 AI 整合到切實的、能改變社會的應用中,優先考慮可靠性和生態系統協同效應,尤其是在自動駕駛和智慧城市等領域。

這涉及有意識地轉向神經符號方法,針對特定的高價值、安全關鍵領域,而這些領域是純粹的統計模型力所不及的。真正的競爭優勢可能不在於任何單一的算法或模型,無論其能力或成本效益如何,而在於通過全面、整合的生態系統將 AI 融入物理和經濟景觀的能力。中國正在悄悄地朝著實用的、特定領域的神經符號整合邁進,目光超越了當前對 LLM 的迷戀,投向了可能從根本上重塑城市生活和交通的應用。AI 真實世界影響的未來,可能較少取決於聊天機器人的口才,而更多地取決於這些複雜的、嵌入 AI 的系統的可靠運行。