Meta、NIC 及 AIV 攜手推動越南 AI 發展

越南 AI 發展的合作努力

3 月 14 日,在河內達成了一項具有里程碑意義的合作夥伴關係,標誌著越南人工智能 (AI) 向前邁出了重要一步。科技巨頭 Meta 與越南財政部下屬的國家創新中心 (NIC) 聯手啟動了 2025 年越南創新挑戰賽。這項合作已進入第三年,強調了對促進越南國內 AI 發展的持續承諾。

ViGen 專案:AI 發展的基石

2025 年的挑戰賽將重點放在 ViGen 專案上,這是一個具有深遠影響的雄心勃勃的計劃。ViGen 專注於創建一個大規模、高品質、開源的越南語資料集。此資料集專門設計用於訓練和開發大型語言模型 (LLMs) 的關鍵資源。

ViGen 的核心目標是顯著增強 AI 模型理解越南文化、語境和語言細微差別的能力。通過實現這一目標,該專案旨在釋放一波專門為越南蓬勃發展的數位經濟量身定制的突破性 AI 應用。

角色和責任:協同合作夥伴關係

ViGen 專案代表了專業知識和資源的協同作用,每個合作夥伴都扮演著不同的角色:

  • NIC: 國家創新中心負責監督、協調並確保該專案與越南更廣泛的國家發展戰略無縫銜接。
  • AI for Vietnam: 這個組織在 Meta 的技術和財政支持下,負責執行該計劃的特定組成部分。
  • 戰略合作夥伴: 該專案還受益於主要戰略合作夥伴的貢獻,包括 NVIDIA、Viettel 和越南科學院。這些合作夥伴為一個充滿活力和可持續的合作生態系統做出了貢獻。

賦予 AI 對越南語的深刻理解

ViGen 的核心是開發一個高品質、開源的越南語資料集,該資料集足夠大,可以促進尖端 AI 模型的訓練和評估。這項努力不僅僅是使 AI 系統能夠以自然的方式處理越南語。它還確保越南的道德標準和文化價值觀深深植根於 AI 發展的結構中。

國家優先事項:推動技術突破

NIC 副主任 Vo Xuan Hoai 強調了 AI 的變革潛力,他說:「AI 每天都在改變世界。」他進一步強調了 ViGen 專案對越南的至關重要性:「對於越南來說,開發高品質、開源的越南語資料集是推動技術突破、創新和國家數位轉型的關鍵優先事項。」

越南在全球 AI 格局中的角色

Meta 副總裁兼首席 AI 科學家 Yann LeCun 教授闡述了 ViGen 和越南創新挑戰賽的更廣泛意義。他指出,這些舉措不僅僅是技術進步。它們有力地肯定了越南在全球 AI 格局中新興的角色,同時在 AI 時代保護和推廣越南語和文化。

Yann LeCun 強調:「我們不僅僅是在創造技術,我們正在建設一個包容性的 AI 未來,並忠於當地的價值觀。」

Meta 的貢獻:為社區利益提供開放資料集

Meta 對 ViGen 專案的承諾延伸到在 AI 和 Data for Community Benefit 計劃下提供開放資料集。這些資料集包含大量資訊,包括有關流動性、社會聯繫和 AI 驅動的人口地圖的資料。這一貢獻有望推動 AI 研究和應用在各個領域的發展。

增強越南語在全球 AI 中的代表性

AI for Vietnam 的 CEO Tran Viet Hung 強調了 ViGen 將對越南語在全球 AI 資料集中的代表性產生的深遠影響。他還指出,ViGen 將積極為開放和可信資料倡議 (OTDI) 做出貢獻,OTDI 是全球 AI 夥伴關係的一個關鍵組成部分,AI for Vietnam 在其中發揮著至關重要的作用。

推出「亞太地區公共部門開源 AI 創新」手冊

除了 ViGen 專案,Meta 和 Deloitte 選擇越南作為亞太地區第一個推出重要手冊「亞太地區公共部門開源 AI 創新:利用 Llama 釋放轉型潛力」的國家。

本手冊旨在為公共機構提供寶貴的支持,使他們能夠有效地採用開源 AI。它作為實施精確適應當地條件和特定需求的 AI 模型的實用指南。

充分利用 AI 的潛力

Meta 公共政策總監 Sarim Aziz 強調了該公司對賦予越南組織和企業權力的承諾:「通過像 Llama 這樣的開源模型,Meta 希望幫助越南組織和企業充分利用 AI 的潛力。」

實際應用:改變政府運作

在活動中發布的一份報告展示了 Llama 模型如何在越南成功實施的兩個引人注目的例子:

  1. 科學技術部: 與 MISA 合作,該部開發了一個虛擬助理,大大減少了官員查找資訊所需的時間。這使得查找時間減少了 98%,顯著提高了工作效率。
  2. 司法部和 Viettel: 這些實體共同應用 Llama 創建了一個法律助理,簡化了文件研究的過程。此應用程式使文件研究時間減少了 30%。

開源 AI:數位轉型的驅動力

Deloitte 亞太區 AI 和資料能力負責人 Chris Lewin 強調了開源 AI 在推動公共部門數位轉型中的關鍵作用。他說:「通過這份報告,Deloitte 旨在幫助越南的管理機構和組織更深入地了解基於透明度和可信賴性原則的下一代 AI 應用。」

關鍵概念和倡議的詳細說明:

大型語言模型 (LLMs)

大型語言模型是許多 AI 進步的核心,是複雜的 AI 系統。它們在大量的文本和程式碼資料集上進行訓練,這使得它們能夠執行各種任務,包括:

  • 文本生成: 以多種格式創建人類品質的文本。
  • 翻譯: 準確地翻譯語言。
  • 問答: 為各種問題提供全面和資訊豐富的答案。
  • 摘要: 將大量文本濃縮成簡潔的摘要。
  • 程式碼生成: 以各種程式語言編寫程式碼。

LLM 的有效性在很大程度上取決於其訓練資料集的品質和大小。這就是 ViGen 專案專注於創建高品質、大規模越南語資料集變得至關重要的地方。

開源 AI

開源 AI 的概念是 ViGen 專案和更廣泛合作的核心。開源 AI 是指免費提供給公眾的 AI 模型、資料集和工具。這種方法提供了幾個優點:

  • 透明度: 底層程式碼和資料可供審查,從而提高信任度和問責制。
  • 協作: 全球的開發人員和研究人員可以為 AI 模型的改進和完善做出貢獻。
  • 創新: 開放訪問促進了更快的創新速度,因為任何人都可以基於現有模型和資料集進行構建。
  • 可訪問性: 開源 AI 降低了組織和個人的進入門檻,使 AI 技術更廣泛地可訪問。
  • 定制: 用戶可以調整和修改開源 AI 模型,以滿足其特定需求和要求。

越南創新挑戰賽

越南創新挑戰賽是一項年度計劃,旨在:

  • 識別和支持應對越南面臨的關鍵挑戰的創新解決方案。
  • 促進創新體系中利益相關者之間的合作和知識共享。
  • 促進尖端技術的開發和採用,特別是在 AI 領域。

資料集的重要性

資料集是 AI 的生命線。它們提供了 AI 模型用於學習和改進的原始材料。資料集的品質、大小和多樣性直接影響 AI 模型的性能和能力。

  • 品質: 高品質的資料集是準確、一致的,並且代表了它旨在捕獲的真實世界現象。
  • 大小: 較大的資料集通常會產生性能更好的 AI 模型,因為它們為模型提供了更多的學習範例。
  • 多樣性: 多樣化的資料集包含廣泛的範例,確保 AI 模型不會偏向特定群體或觀點。

文化和語言細微差別

ViGen 專案專注於捕捉越南文化和語言細微差別尤為重要。語言不僅僅是一種交流工具;它與文化、語境和身份深深交織在一起。

  • 文化語境: AI 模型需要了解語言使用的文化語境,才能準確解釋含義並避免誤解。
  • 語言細微差別: 越南語與任何語言一樣,都有其獨特的語言細微差別,包括習語、表達方式和語法結構,AI 模型必須能夠掌握這些細微差別。

通過將這些細微差別納入資料集,ViGen 旨在創建不僅流利越南語,而且具有文化敏感性和語境意識的 AI 模型。

道德標準和文化價值觀

將越南的道德標準和文化價值觀嵌入 AI 發展是 ViGen 專案的一個重要方面。這確保了 AI 技術與國家的價值觀和優先事項保持一致。

  • 道德考量: AI 發展引發了一系列道德考量,包括隱私、公平和問責制。
  • 文化價值觀: AI 系統應反映並尊重其部署所在社會的文化價值觀。

通過將這些考量納入資料集,ViGen 旨在促進越南 AI 的負責任和道德發展。