開源AI革命:深入探討GOSIM AI Paris 2025

在開源開發的協作精神推動下,AI領域在過去一年經歷了巨大的轉變。大型語言模型(LLMs)不再只是科技巨頭的專屬領域,而是透過社群努力和開放共享不斷發展,影響著從基礎設施到演算法優化和部署的各個方面。這股開源運動正在加速AI的進程,使其更易於存取,並將貢獻下一代智慧系統的機會普及化。

在此背景下,由GOSIM、CSDN和1ms.ai聯合主辦的GOSIM AI Paris 2025大會於5月6日在法國巴黎開幕。本次活動是一個重要的平台,將全球技術從業者和研究人員聯繫起來,共同探索開源AI的最新突破和未來發展方向。

本次大會擁有令人印象深刻的陣容,匯集了來自阿里巴巴、Hugging Face、BAAI、MiniMax、Neo4j、Dify、MetaGPT、智譜AI、Eigent.AI、Docker、Inflow、北京大學、Fraunhofer、牛津大學和法國openLLM社群等領先組織的80多位技術專家和學者。華為、法國華僑青年企業家協會、法中人工智慧協會、Apache軟體基金會、Eclipse基金會、The Khronos Group、WasmEdgeRuntime、LF Generative AI Commons、Linux基金會研究、OpenWallet基金會、開源促進會(OSI)、Software Heritage和K8SUG等重要合作夥伴也積極參與。大會設有60多場技術會議,圍繞AI模型、基礎設施、應用部署和具身智慧等核心主題,全面展示開源生態系統的發展和新興趨勢。

AI與開源之間的共生關係

GOSIM聯合創始人袁征在會議開幕式上發表了題為「開源已經趕上,下一步是什麼?」的主題演講。他分享了自己對開源AI現狀和未來發展軌跡的見解,強調開源AI已經達到了一個關鍵時刻。

「我們曾經預測開源需要5-10年才能趕上閉源模型,但現在看來,這個目標已經提前實現了,」袁征表示。他以最近發佈的Qwen 3為例,指出開源模型不再只是相互競爭,而是直接挑戰專有旗艦模型,甚至在某些基準測試中超越了它們。袁征還表示,這種進步不僅僅歸功於開源的發展,也歸因於閉源開發未能達到預期,並遇到了性能瓶頸。相反,開源模型正在迅速發展,呈現出陡峭的性能增長曲線,展現了真正的「趕超」現象。

這一觀察提出了一個根本性的問題:我們距離實現通用人工智慧(AGI)還有多遠?袁征認為,AGI的未來可能不在於單一的、包羅萬象的模型,而是在於部署在私有硬體或機器人設備上的專業模型、知識庫和工具的網路。

他進一步闡述說,AI架構正在從集中式轉向分散式範式。他強調了OpenAI從Completion API到新的Responses API的轉變,後者旨在建立一個大型智慧代理平台。近60萬用戶和開發人員已經加入了這個轉型,為分散式AI應用程式的開發做出貢獻。

「AGI的未來不應該僅僅由一家資金雄厚的公司開發,」袁征斷言。「相反,它應該透過全球協作來建立,創建一個包含模型、知識庫、機器人和執行系統的生態系統網路。」

在袁征發表演講之後,OpenWallet基金會執行董事Daniel Goldscheider發表了關於「GDC錢包與憑證」的演講,重點介紹了聯合國大會通過的「全球數位契約」(GDC)專案。他解釋說,GDC有兩個核心目標:

  • 認識到數位科技已經深刻地改變了我們的生活和社會發展,既帶來了前所未有的機遇,也帶來了難以預見的風險。
  • 強調充分發揮數位科技為全人類謀福祉的潛力,需要全球合作,打破國家、產業甚至公共和私營部門之間的障礙。

基於這種共識,GDC催生了「全球數位合作」倡議,旨在促進政府、企業、非營利組織和其他利益相關者之間的真正合作。

在討論運營方面時,Goldscheider強調,這種合作不受任何單一組織的支配,而是採取「聯合召集」的方式,邀請所有感興趣的國際組織、標準制定機構、開源社群和政府間組織參與。他澄清說,這不是一個「誰領導誰」的專案,而是一個平等的合作平台,每個參與方都有發言權,沒有人比其他人更重要。

他進一步解釋說,「全球數位合作」的目標不是直接開發標準或技術,而是促進來自不同背景的組織之間的對話,讓他們能夠提出自己的觀點和需求,以達成共識。隨後,具體的標準和技術工作將由相關的專業機構推進。他以「數位身份」和「生物識別技術」為例,指出許多組織已經在這些領域開展工作,強調需要一個中立的平台將大家聚集在一起,避免重複、衝突和資源浪費。

四大專題論壇:全面剖析開源AI

本次大會設有AI模型、AI基礎設施、AI應用和具身智慧四大專題論壇。這些論壇涵蓋了從底層架構到應用部署,從模型能力到智慧代理實踐等關鍵議題。每個論壇都邀請了來自全球企業和研究機構的領先專家,既深入分析了最新的技術趨勢,又展示了豐富的工程實踐案例,展現了開源AI在多個領域的全面整合和發展。

解構AI大型模型的底層邏輯

AI模型論壇匯集了來自開源社群和研究機構的專家,分享他們在大型模型領域的架構創新、開源協作和生態系統發展方面的見解。

Hugging Face的機器學習研究工程師Guilherme Penedo發表了「Open-R1:DeepSeek-R1的完全開源複製」的演講,展示了Open-R1專案在複製DeepSeek-R1模型方面的努力,重點是促進與推理任務相關的資料的開放性和標準化。智源研究院資料研究團隊技術負責人劉光分享了「OpenSeek:面向下一代大型模型的協同創新」,強調全球協作在演算法、資料和系統層面推動模型性能突破的重要性,目標是開發超越DeepSeek的下一代大型模型。

CSDN高級副總裁李炯炯發表了「解碼DeepSeek:技術創新及其對AI生態的影響」,深入分析了DeepSeek在技術範式、模型架構和產業生態方面的創新,以及其對全球AI生態的潛在影響。MiniMax高級研究總監鍾毅然發表了「線性未來:大型語言模型架構的演進」,介紹了該團隊提出的Lightning Attention機制,該機制在效率和性能方面為Transformer架構提供了一種潛在的替代方案。牛津大學皇家學會牛頓國際研究員劉世偉討論了「大型語言模型中的深度詛咒」,探討了隨著模型加深,深度神經網路的貢獻越來越小,並提出使用LayerNorm Scaling來改善Pre-LN機制,以提高深層利用率和整體效率。智譜AI的研究工程師Diego Rojas在「程式碼大型語言模型:探索Tokens之外」中指出,目前的大型模型雖然功能強大,但仍然依賴於Tokenization,效率低下,並分享了跳過Tokenization的新方法,以使模型更快更強。Fraunhofer IAIS基礎模型團隊負責人Nicolas Flores-Herr以「如何建立具有全球競爭力的“歐洲製造”大型語言模型?」總結了論壇,強調歐洲正在透過多語言、開源和值得信賴的本地化大型模型專案克服資料、多樣性和監管挑戰,以建立反映歐洲價值觀的下一代AI。

AI基礎設施的三大支柱:資料、算力和演算法演進

AI基礎設施論壇專注於為大型模型構建一個更開放、高效和包容的基礎,匯集了來自研究機構和企業的領先專家,就資料、算力和系統架構等關鍵問題進行深入討論。

智源研究院(BAAI)副院長林詠華在「AI開源向善:普惠應用、公平資料、通用算力」中啟動了中文網際網路語料庫CCI 4.0,涵蓋了三個主要資料集:CCI4.0-M2-Base V1、CCI4.0-M2-CoT V1和CCI4.0-M2-Extra V1。CCI4.0-M2-Base V1的資料量為35000GB,採用中英雙語,其中中文資料為5000GB,與CCI3.0相比,資料規模增加了5倍。CCI4.0-M2-CoT V1包含4.5億條反向合成的人類思維軌跡資料,用於提高推理能力,總Token數為425B(4250億),幾乎是Cosmopedia(由Hugging Face開源)的20倍,後者是目前全球最大的開源合成資料集。

然後,華為高級軟體工程師王希元介紹了CANN架構如何在「基於昇騰CANN的訓練和推理最佳實踐」中連接AI框架和昇騰硬體,並透過支援PyTorch和vLLM等生態系統實現最佳訓練推理。家樂福資料架構師Guillaume Blaquiere展示了如何透過Google Cloud Run部署支援GPU的無伺服器大型模型實例,以降低成本並提高資源利用效率,演講主題為「讓你的LLM無伺服器化」。北京大學工程師馬寅鵬發表了關於「開源智慧計算整合管理調度基礎軟體-SCOW和CraneSched」的主題演講,介紹了北京大學開發的兩個主要開源基礎軟體SCOW和CraneSched,這些軟體已部署在全國數十所大學和企業中,支援智慧計算資源的統一管理和高性能調度。北京航空航天大學博士候選人鄭耀偉在「verl:基於混合控制器的RLHF系統」的演講中分享了Verl系統中混合控制器架構的設計理念,並討論了其在大規模強化學習訓練中的效率優勢。Oxen.ai的CEO Greg Schoeninger介紹了「用於DeepSeek-R1風格強化學習(GRPO)的訓練資料集和基礎設施」,並詳細介紹了用於推理LLM的強化學習訓練過程的實踐路徑,包括資料集建構、基礎設施建構和本地訓練程式碼生成模型。

從「能否使用」到「是否用好」:AI應用進入實用階段

在AI應用論壇上,來自領先公司的研發從業者和技術決策者分享了多樣化的見解,展示了由大型模型驅動的AI應用在現實世界中的部署路徑和未來可能性。

阿里巴巴通義實驗室首席研究員李永彬分享了通義靈碼在技術演進和產品應用方面的最新進展,演講主題為「通義靈碼:從程式碼Copilot到程式碼Agent」。華為軟體工程師陳東傑發表了關於「倉頡魔方:大模型時代開發者的新選擇」的主題演講,介紹了基於倉頡程式語言的AI大型模型Agent開發框架,該框架可以顯著提高開發者構建智慧HarmonyOS應用程式的效率,並帶來卓越的開發體驗。LangGenius開發者生態系統總監劉鑫睿聚焦於「協同合作,Dify賦能技術力量」,強調Dify的開源生態系統及其在加速AI應用普及方面的作用。

關於AI和系統工程的結合,Makepad聯合創始人Rik Arends發表了一個獨特的演講:「使用Ambient Coding,使用AI為移動設備、網頁和混合實境創建Rust UI」,探討瞭如何使用ambient coding來構建UI的新範式。Broadcom Spring團隊的研發軟體工程師Christian Tzolov重點展示瞭如何透過MCP Java SDK和Spring AI MCP將AI模型與現有系統和資源高效整合,演講主題為「透過MCP實現AI整合的統一範式」。Futurewei技術戰略高級總監褚文靜在「MCP和A2A中的’T’代表信任」中進一步提升了視角,深入分析了如何在基於代理的應用程式中構建真正值得信賴的AI系統。此外,Cegid的軟體工程經理Hong-Thai Nguyen結合實際場景介紹瞭如何使用多代理重塑業務流程,並實現更智慧的企業決策和運營,演講主題為「Cegid Pulse:多代理業務管理平台」。

當大型模型配備「身體」:具身智慧來臨

具身智慧正在成為AI領域最具挑戰性和最有前景的發展方向之一。在本論壇中,許多業界頂尖技術專家圍繞「具身智慧」的主題進行了深入討論,分享了他們在架構設計、模型應用和場景部署方面的實踐探索。

ZettaScale的CEO兼CTO Angelo Corsaro介紹了Zenoh協議如何在智慧機器人時代打破感知、執行和認知之間的障礙,演講主題為「心智、身體和Zenoh」。Dora專案的專案經理Philipp Oppermann帶來了「在Dora中使用Zenoh來實現分散式資料流」,解釋了Zenoh協議在Dora中實現分散式資料流的重要應用。中國科學技術大學教授楊健發表了關於「自動駕駛中對抗性安全關鍵場景的生成」的演講,介紹了如何透過生成對抗性場景來提高自動駕駛技術的安全性,以確保在複雜環境中的穩定性和可靠性。

此外,智源研究院的具身智慧研究員林明蘭也聚焦於「RoboBrain:用於機器人操作的統一腦模型&RoboOS:RoboBrain和機器人智慧代理的分層協作框架」這一主題,展示瞭RoboBrain如何提高機器人的智慧水平,以及RoboOS在機器人協作中的重要作用。Voyage Robotics的創始人Ville Kuosmanen發表了關於「使用開源VLA模型構建機器人應用程式」的精彩演講,解釋瞭如何使用開源VLA模型為機器人應用程式提供強有力的支援。最後,Menlo Research的大型語言模型研究員Huy Hoang Ha在「空間推理LLM:增強對2D和3D的理解以支援機器人操作和導航」的主題演講中討論瞭空間推理如何幫助機器人更好地理解複雜的2D和3D環境,從而提高其操作和導航能力。

焦點對話:照亮尖端技術和創新應用

焦點對話第一天以業界專家關於尖端技術和創新應用的精彩演講為特色。該環節是來自各個領域的技術從業者討論AI的最新進展和實際應用的平台。法國原子能委員會(CEA)的研究工程師Cyril Moineau在「Aidge」的演講中介紹了Eclipse Aidge專案如何透過提供完整的工具鏈來支援在嵌入式平台上部署和優化深度神經網路,從而加速邊緣智慧系統的開發。

Bielik.ai的資料科學家Paweł Kiszczak在本次大會上首次公開分享了波蘭本土AI專案Bielik的最新進展,並發表了題為「Bielik.AI的崛起」的演講,講述了該專案如何透過開源語言模型和完整的工具生態系統來促進本地自主AI系統的建構。Bielik專案不僅發佈了多個開源語言模型(參數規模涵蓋1.5B、4.5B和11B),還創建了一個涵蓋資料集、評估、訓練和微調的端到端工具鏈,支援研究團隊和開發人員基於基本模型進行微調或持續預訓練,這大大降低了大型模型的研發門檻,並激發了本地技術創新能力。

Second State的技術負責人Hung-Ying Tai分享了「使用LlamaEdge在邊緣設備上執行GenAI模型」,展示了LlamaEdge在邊緣設備上部署生成式AI模型時的輕量級和高性能能力,帶來了更靈活高效的本地推理體驗。北京大學博士候選人陳天宇介紹瞭如何透過「資料合成-模型微調」的自我演進機制來緩解訓練資料稀缺的問題,從而顯著提高Rust程式碼形式化驗證的效率和準確性,演講主題為「基於自我演進框架實現Rust程式碼的自動形式化驗證」。Illuin Technology的研發總監Gautier Viaud分享瞭團隊基於ColBERT架構和PaliGemma模型構建的ColPali系統如何透過結合圖形和文字資訊來有效提高文件檢索的準確性和效率,演講主題為「ColPali:基於視覺語言模型的高效文件檢索」。最後,Dynamia.ai的CEO肖張介紹瞭如何在HAMi的幫助下更好地管理和調度異構GPU資源,並提高AI基礎設施的利用率和可觀察性,演講主題為「釋放異構AI基礎設施的K8s集群能力:釋放HAMi的力量」。

多樣化的互動和第一天的亮點

除了高密度的專題演講外,本次大會還設有多個特別單元。閉門會議單元側重於戰略對話和深入的產業交流,以促進跨境合作。展示會單元側重於展示企業和研究機構的最新AI技術產品,吸引了大量參觀者駐足交流。在競賽單元中,來自世界各地的AI和機器人開發人員、工程師和機器人愛好者專注於開源SO-ARM100機器人手臂套件,以進行模仿學習的實踐探索。該套件整合了Hugging Face的LeRobot框架,並結合了NVIDIA的AI和機器人技術,以支援包括ACT和Diffusion Policy在內的尖端AI架構,為參與者提供堅實的技術基礎。參與者在真實場景中進行了實踐探索,以全面評估其效果和可行性。

工作坊單元以OpenHarmony生態系統為核心主題,探討了由開放原子開源基金會孵化和運營的開源專案。OpenHarmony致力於為全場景、全連接、全智慧時代構建智慧終端作業系統框架,創建一個開放、全球化和創新的領先分散式作業系統平台,服務於多樣化的智慧設備,並助力萬物互聯產業的發展。在大會現場,參與者透過一系列實踐工作坊深入瞭解了OpenHarmony在多設備協作和輕量級系統設計方面的核心優勢,親身參與了從驅動程式開發到應用部署的關鍵過程。動手實踐不僅有助於開發者開闢「從底到端」的技術路徑,還有助於全面提高系統級開發和調試能力。

GOSIM AI Paris 2025第一天的議程已經圓滿結束,但精彩仍在繼續。明天,大會將繼續圍繞AI模型、AI基礎設施、AI應用和具身智慧四大論壇展開,並將迎來備受期待的PyTorch Day,更多重量級嘉賓和第一線實用內容即將到來,敬請期待!