馬來西亞的機會:擁抱中國開源AI革命

今年初,DeepSeek R1大型語言模型 (LLM) 的問世,標誌著生成式人工智慧 (Gen AI) 迎來了轉型時刻。這不僅在技術上,也在商業和戰略層面實現了重大飛躍。 DeepSeek 證明,開發複雜的 LLM 的成本可以遠低於先前的預期,而且至關重要的是,這項創新並不局限於矽谷。

DeepSeek 的出現對馬來西亞的 AI 生態系統產生了深遠的影響,超越了美國和中國之間持續不斷的技術競爭,以及馬來西亞股市對數據中心熱情的暫時降溫。

開源的重要性

DeepSeek 的 LLM 的一個關鍵面向是它們基於開源技術。像 DeepSeek R1 這樣的模型在開源或開放權重許可證下可用,這意味著它們可以被自由下載、修改和使用。這種開源的性質對 LLM 的進化和商業化有著重大的影響。

多年來,百度、阿里巴巴和騰訊等中國科技巨頭一直在積極開發開源 AI 模型。這一戰略得到了中國大學和政府倡議的支持,採取了「開放式創新」的方法,旨在加速研發,並有可能在 AI 能力方面超越美國。

然而,對開源 AI 的承諾不僅僅限於中國。 Meta 和 Google 也出於競爭因素發布了開放權重 LLM。這背後的理由植根於「商品化互補品」的商業策略。如果一家公司嚴重依賴 Gen AI,那麼投資於開源替代方案可能比單純依賴 ChatGPT 等專有模型更有利。即使仍然使用專有 LLM,良好的開源模型也能削弱 OpenAI 等主要供應商的定價能力。

這種策略反映了伺服器和網路設備製造商 Oracle 採取的行動。 Oracle 支持開源 Linux 作業系統,以抑制微軟 Windows OS 的定價主導地位。

不管動機如何,高品質、開放權重 LLM 的可用性,大大降低了像馬來西亞這樣國家的成本,為創新打開了新的大門。

對政府和企業的好處

對於馬來西亞政府而言,開源 LLM 提供了運營自己的 AI 模型,而無需將敏感數據傳輸給商業第三方或外國的機會。這加強了數據自主權和主權。

對於馬來西亞公司,尤其是新創公司而言,開放權重 LLM 創造了一個公平的競爭環境。他們可以像中國和美國的同行一樣訪問相同的基本 LLM,從而促進創新和競爭。

解決文化和政治偏見

中國 AI 的崛起也突顯了一個重大的挑戰:文化和政治偏見。中國的 LLM 經常被訓練成反映中國共產黨 (CCP) 的歷史敘事和政治觀點,遵守中國大陸的審查規範。

即使沒有明確的審查,AI 模型本身也帶有訓練數據中存在的偏見。如果主要以英文文本進行訓練,這些模型將反映西方文化觀點和偏見。

好消息是,LLM 可以相對容易地重新訓練。與中國 LLM 接受保護措施以促進中共忠誠度的方式類似,其他開源專案已經證明,DeepSeek R1 可以進行後訓練,以減輕人們認為的偏見。

本地化和文化敏感性

這種經驗強調,像馬來西亞這樣的國家需要發展自己的能力來本地化、訓練和後訓練 LLM,以符合當地條件。沒有考慮到馬來西亞的種族和宗教敏感性、社會等級制度或當地俚語的模型,可能會表現不佳或產生有害內容。

馬來西亞已經具備一些 LLM 開發能力。例如,當地新創公司 Mesolitica 於 1 月發布了開源 MaLLaM LLM,它比 ChatGPT 等主流 LLM 更細緻地理解馬來語。

然而,馬來西亞決策者對開源 AI 的潛力以及本地 LLM 開發的重要性,仍然不明確。

國家 AI 戰略

2021 年起草的《國家 AI 路線圖》很少提及開源。同樣,新的國家 AI 辦公室 (NAIO) 最近的文件也沒有強調開源 AI。

雖然預測 AI 開發的未來仍然具有挑戰性,但當前一代 LLM 的開源性質為馬來西亞提供了一個趕上技術領導者的絕佳機會。

抓住機會

為了利用這一點,馬來西亞需要更新其政策,以適應更小和更經濟實惠的 LLM 的出現。這包括簡化這些模型的採用,使 Gen AI 更容易被中小企業使用,並實現本地部署,尤其是在網路存取受限的農村地區。

擴大馬來西亞開發 LLM 的能力,使其更符合當地語言並顧及當地文化至關重要。投資於 LLM 培訓,可能以當地大學為中心,可以被視為一種公共產品,培養國內人才並推動當地研發。

數據自主權和國家安全

託管自己的 LLM 對於確保國家數據自主權至關重要。 LLM 收集的數據可能很有價值,這些資訊不應被外國實體利用,而應由當地組織儲存和使用。

以下是關於馬來西亞如何具體利用開源 AI 運動的更詳細的分解:

  • 政策更新: 應審查和更新現有政策,以反映當前的 AI 格局,特別關注開源 LLM 的機會和好處。這包括簡化數據使用法規(同時保持適當的隱私保護),為開源 AI 研發提供資金和激勵措施,並促進在整個政府部門採用開源 AI 解決方案。

  • 人才發展投資: 建立一支技術熟練的勞動力至關重要。馬來西亞需要投資於專注於 AI、機器學習和自然語言處理的教育計畫和培訓計畫。這些計畫應強調開源工具和技術,確保畢業生有能力為當地 AI 生態系統做出貢獻。獎學金、研究經費和行業合作可以進一步鼓勵學生從事 AI 職業。

  • 大學主導的研究: 當地大學應站在 AI 研發的最前沿。政府可以提供資金,在大學建立 AI 研究中心,重點關注 LLM 客製化、文化適應以及為滿足馬來西亞的特定需求而開發新的開源 AI 工具等領域。大學和產業之間建立合作平台可以加速知識和技術的轉移。

  • 對新創公司和中小企業的支持: 開源 AI 為新創公司和中小企業提供了創新和競爭的重大機會。馬來西亞應向這些企業提供有針對性的支持,包括獲得資金、指導和技術專業知識。這種支持可能包括開發 AI 驅動產品和服務的補助金、專注於 AI 的育成中心和加速器,以及將新創公司與潛在客戶和投資者聯繫起來的計畫。

  • 數據治理框架: 建立健全的數據治理框架對於確保負責任和合乎道德地使用 AI 至關重要。此框架應解決數據隱私、安全性、偏見等問題,並應符合國際最佳實踐。它還應促進 AI 生態系統內部的數據共享,同時保護敏感資訊。這可以通過建立國家數據儲存庫和建立明確的數據訪問和使用指南來實現。

  • 公私合作夥伴關係: 公共部門和私營部門之間的合作對於推動 AI 創新至關重要。政府可以與私營公司合作,在醫療保健、教育和交通運輸等領域開發和部署 AI 解決方案。這些合作夥伴關係可以利用兩個部門的專業知識和資源,從而產生更有效和更具影響力的結果。

  • 國家 AI 基礎設施: 投資於國家 AI 基礎設施,包括高性能計算資源和數據儲存設施,對於支持 AI 研發至關重要。全國的研究人員、新創公司和企業都可以使用此基礎設施,為他們提供創新和競爭所需的工具。

  • LLM 的文化適應: 馬來西亞應投資於專注於調整開源 LLM 以反映該國獨特的文化和語言景觀的專案。這包括開發流利使用馬來語和其他當地語言的模型,並且對馬來西亞的多元文化和傳統敏感。這需要一個涉及語言學家、文化專家和 AI 工程師的多學科方法。

  • 網路安全考量: 隨著 AI 越來越多地整合到關鍵基礎設施中,網路安全必須成為重中之重。馬來西亞需要投資於 AI 專用網路安全解決方案的研發,並建立明確的網路安全系統指導方針。這包括開發用於檢測和減輕 AI 相關威脅的強大機制。

  • 推廣倫理 AI: 確保以道德和負責任的方式開發和使用 AI 至關重要。馬來西亞應建立一個國家 AI 倫理框架,概述指導 AI 開發和部署的原則和價值觀。該框架應解決公平、透明和問責制等問題。

通過採取這些積極的措施,馬來西亞可以利用開源 AI 的力量來推動經濟增長、改善公共服務,並解決該國一些最緊迫的挑戰。機遇之窗已經打開,馬來西亞必須果斷行動才能抓住它。致力於培養一個強大、包容和合乎道德的 AI 生態系統,對於實現這一變革性技術的全部潛力至關重要。重點應始終放在賦權、創新和長期可持續發展上。