AI 聯盟的協作模式如何推動首年快速增長

開源 AI 的變革性轉變

過去,開源 AI 開發是一個分散的領域,經常導致模型表現不佳。在 2023 年之前,很少有非營利組織擁有足夠的資源來訓練 AI 模型,使其能力接近 GPT-2。大型科技公司主導著專有 AI 領域,而開源 AI 則主要應用於小眾領域。

2023 年標誌著一個轉捩點。多個具有寬鬆許可證的新基礎模型被發布,隨後 Meta 與 Microsoft 合作發布了其開源 Llama 2 模型。這一事件引發了一系列活動,六個月內創建了超過 10,000 個衍生模型。開源 AI 開發的新時代已經開始。

雄心勃勃的目標和傑出的指導委員會

在這樣的背景下,AI 聯盟從成立之初就設定了一系列令人印象深刻的目標。這些目標包括:

  • 促進開放協作
  • 建立 AI 的治理和護欄
  • 開發基準測試工具和明確的政策立場
  • 優先考慮廣泛的教育計劃
  • 培育強大的硬體生態系統

聯盟的實力更因其指導委員會的素質而得到加強,該委員會由知名的商業組織和大學組成。

會員標準:對開放性和協作的承諾

要成為 AI 聯盟的成員,組織必須滿足四個關鍵標準:

  1. 與使命一致: 潛在成員必須與培養安全、開放科學和創新的使命保持一致。
  2. 對項目的承諾: 成員必須致力於從事與聯盟使命相符的重大項目。
  3. 觀點的多樣性: 預期的成員必須願意為全球成員內部的觀點和文化多樣性做出貢獻,目前全球成員已超過 140 個組織,預計還會進一步增長。
  4. 聲譽: AI 聯盟尋求在 AI 開源社區中具有公認聲譽的教育工作者、建設者或倡導者。

成員分類:建設者、賦能者和倡導者

聯盟成員通常分為三類:

  • 建設者: 這些成員負責創建使用 AI 的模型、數據集、工具和應用程序。
  • 賦能者: 這些成員通過教程、用例和一般社區支持來促進開放 AI 技術的採用。
  • 倡導者: 這些成員強調 AI 聯盟生態系統的優勢,並在組織領導者、社會利益相關者和監管機構中培養公眾信任和安全。

六個關鍵重點領域:AI 生態系統的整體方法

AI 聯盟定義了其在六個關鍵重點領域的長期優先事項。然而,重要的是要注意,聯盟對整個 AI 生態系統採取整體方法,鼓勵社區成員和開發人員參與一個或多個領域,並隨著興趣或優先事項的變化而調整。

以下是六個關鍵重點領域的詳細介紹:

技能和教育

該領域致力於向廣大受眾提供 AI 知識,包括評估 AI 風險的消費者和商業領袖,以及構建 AI 應用程序的學生和開發人員。它旨在簡化在特定領域尋找專家指導的過程,並包括模型評估計劃。

2024 年,聯盟發布了’AI 基本能力指南’,這是一項綜合資源,來自一項廣泛的調查,旨在確定 AI 中的關鍵角色以及這些角色所需的技能。儘管最近才發布,該指南已經進行了九次修訂,並計劃進行後續調查以解決初始調查中發現的問題。

信任與安全

這個關鍵領域探討了所有 AI 應用程序成功所必需的信任和安全的基本要素。採用基準、工具和方法來確保模型和應用程序是高質量、安全和值得信賴的。這包括支持不斷發展的行為標準和對風險的有效反應。

該領域的工作組收集與信任和安全相關的最佳概念,並將用戶與他們所需的專業知識聯繫起來。在 AI 聯盟網站上發布的’開源 AI 信任和安全狀況 — 2024 年底版’調查強調了該領域的需求和成功。許多 AI 聯盟成員正在通過研發工作來解決研究和環境差距。

應用程序和工具

該小組專注於探索用於構建高效且強大的 AI 應用程序的工具和技術。它還在開發一個 AI 實驗室,以促進 AI 應用程序的實驗和測試,加速創新。

硬體支援

該領域致力於通過確保 AI 軟體堆疊與硬體無關來培育強大的 AI 硬體加速器生態系統。MLIR 和 Triton 等技術是實現高性能硬體可移植性的關鍵軟體工具。這些工具使組織能夠利用其首選硬體,提高靈活性和性能,同時減少對專有系統的依賴。

基礎模型和數據集

該領域專注於服務不足領域的模型,包括多語言、多模態、時間序列、科學和其他領域。例如,科學和特定領域的模型針對氣候變化、分子發現和半導體行業。

有效的模型和 AI 應用程序架構需要具有明確治理和使用權限的有用數據集。’開放可信數據倡議’正在闡明此類數據集的要求,並建立合規數據集的目錄。這項工作旨在很大程度上消除對法律、版權和隱私問題的擔憂。

倡導

倡導監管政策對於創建健康和開放的 AI 生態系統至關重要。所有 AI 政策和法規都應代表平衡而非偏頗的觀點。

深入探討信任與安全:2025 年倡議

信任與安全是 AI 聯盟內部一個重要且廣泛的領域,眾多專家致力於開發工具來檢測和減輕仇恨言論、偏見和其他有害內容。’信任與安全評估倡議’是 2025 年的一項重大任務,它提供了對整個評估範圍的統一視圖——不僅僅是安全,還包括性能和其他需要評估 AI 模型和應用程序有效性的領域。一個子項目正在探索特定領域的安全優先事項,例如健康、法律和金融。

在 2025 年中期,AI 聯盟計劃發布一個 Hugging Face 排行榜,使開發人員能夠:

  • 搜索最符合其需求的評估
  • 比較開放模型與這些評估的表現
  • 下載並部署這些評估以檢查他們自己的私有模型和 AI 應用程序

該倡議還將提供有關各種用例的重要安全和合規方面的指導。

支持本地 AI:與硬體無關的軟體堆疊

並非所有 AI 模型調用都將依賴託管的商業服務。某些情況需要氣隙解決方案。支持 AI 的智能邊緣設備正在推動在本地部署新的、小型且強大的模型,通常無需互聯網連接。為了支持這些用例並促進具有靈活硬體配置的大規模模型服務,AI 聯盟正在開發與硬體無關的軟體堆疊。

真實世界的協作範例:SemiKong 和 DANA

有兩個例子說明了聯盟成員之間的開放協作如何為所有人帶來顯著的好處:

SemiKong

SemiKong 是三個聯盟成員之間的合作成果。他們創建了一個專門針對半導體製造工藝領域的開源大型語言模型。製造商可以利用此模型來加速新設備和工藝的開發。SemiKong 擁有關於半導體器件物理和化學的專業知識。在短短六個月內,SemiKong 就引起了全球半導體行業的關注。

SemiKong 是通過使用 Tokyo Electron 策劃的數據集微調 Llama 3 基礎模型而開發的。這種調整過程產生了一個特定行業的生成式 AI 模型,與通用基礎模型相比,它具有更優越的半導體蝕刻工藝知識。有關 SemiKong 的技術報告可供查閱。

DANA(領域感知神經符號代理)

DANA 是 Aitomatic Inc.(位於矽谷)和 Fenrir Inc.(位於日本)的聯合開發項目。它代表了現在流行的代理架構的早期示例,其中模型與其他工具集成以提供互補功能。雖然單獨的模型可以取得令人印象深刻的結果,但大量研究表明,LLM 經常產生不正確的答案。SemiKong 論文中引用的一項 2023 年的研究測量了典型的 LLM 錯誤率為 50%,而 DANA 對推理和規劃工具的補充使用將目標應用程序的準確性提高到 90%。

DANA 採用神經符號代理,將神經網絡的模式識別能力與符號推理相結合,實現嚴格的邏輯和基於規則的問題解決。邏輯推理與規劃工具(例如設計裝配線流程)相結合,產生準確可靠的結果,這對於工業質量控制系統和自動規劃和調度至關重要。

DANA 的多功能性擴展到多個領域。例如,在財務預測和決策中,DANA 可以理解市場趨勢並根據複雜的理論做出預測,利用結構化和非結構化數據。同樣的能力可以應用於檢索和評估醫學文獻和研究信息,確保診斷和治療符合既定的醫療協議和實踐。從本質上講,DANA 可以改善患者的治療效果並減少關鍵患者應用程序中的錯誤。

持續增長的堅實基礎

AI 聯盟在 2025 年初處於強勢地位,成員遍布 23 個國家,眾多工作組專注於主要的 AI 挑戰。聯盟擁有超過 1,200 名工作組協作者,參與了 90 多個活躍項目。在國際上,AI 聯盟已參加了在 10 個國家/地區舉行的活動,覆蓋了 20,000 多人,並發布了五份關於重要 AI 主題的操作指南,以協助研究人員和開發人員構建和利用 AI。

AI 聯盟發布了在 IBM 的 Granite 系列和 Meta 的 Llama 模型等模型上使用 AI 的示例。其不斷增長的’配方’集合利用最流行的開放庫和模型來實現常見的應用模式,包括 RAG、知識圖譜、神經符號系統以及新興的代理規劃和推理架構。

擴大規模:2025 年及以後的雄心勃勃的計劃

在 2025 年,AI 聯盟致力於將其影響力和影響力擴大十倍。其兩個新的主要倡議,如前所述,是’開放可信數據倡議’和’信任與安全評估倡議’。AI 聯盟還計劃建立一個行業標準的社區實驗室,用於開發和測試 AI 應用技術。其特定領域的模型計劃將繼續發展。例如,新的氣候和可持續發展工作組計劃開發多模態基礎模型和開源軟體工具,以應對氣候變化及其緩解方面的關鍵挑戰。

到 2030 年,AI 預計將為全球經濟貢獻約 20 萬億美元。到那時,預計 70% 的工業 AI 應用程序將在開源 AI 上運行。AI 專業人員的短缺預計也將變得比現在更加嚴重。AI 聯盟成員或許能夠通過與其他成員合作來獲得多樣化的專業知識和資源共享,從而減輕這一挑戰。

AI 聯盟正遵循與其他成功的開源組織(如 Linux 基金會、Apache 軟體基金會和開源倡議)相似的增長軌跡。這些包括:

  • 全面的 AI 教育和技能計劃
  • 全球倡導負責任的 AI
  • 創建工具以確保 AI 的安全性和可信賴性,以及易於開發和使用
  • 與學術機構合作研究

AI 聯盟的領導層將繼續吸引開發人員和研究人員,以及商業和政府領導人。AI 聯盟的領導層已將擴大全球合作確立為其 2025 年的首要任務。總而言之,AI 聯盟有基礎發展成為一個主導的全球力量,塑造、改進和創新人工智能的未來。