オープンソースAI革命:GOSIM AI Paris 2025の詳細な探求
過去1年間で、AIの状況は劇的な変化を遂げました。これは、オープンソース開発の共同精神によって推進されています。もはやテクノロジー大手だけの領域ではなくなり、大規模言語モデル(LLM)は、コミュニティの努力とオープンな共有を通じて進化しており、インフラストラクチャからアルゴリズムの最適化、展開に至るまで、あらゆるものに影響を与えています。このオープンソースの動きは、AIの進歩を加速させ、よりアクセスしやすくし、次世代のインテリジェントシステムに貢献する機会を民主化しています。
このような背景の中、GOSIM、CSDN、および1ms.aiが共催するGOSIM AI Paris 2025会議が、5月6日にフランスのパリで始まりました。このイベントは、世界のテクノロジーの実務家や研究者を結び付け、オープンソースAIにおける最新のブレークスルーと将来の方向性を探求するための重要なプラットフォームとして機能します。
この会議には、Alibaba、Hugging Face、BAAI、MiniMax、Neo4j、Dify、MetaGPT、Zhipu AI、Eigent.AI、Docker、Inflow、北京大学、Fraunhofer、オックスフォード大学、フランスのopenLLMコミュニティなどの主要組織から、80人以上のテクノロジー専門家と学者が集まります。Huawei、フランスの全中国青年イノベーション起業家協会、中仏人工知能協会、Apache Software Foundation、Eclipse Foundation、The Khronos Group、WasmEdgeRuntime、LF Generative AI Commons、Linux Foundation Research、OpenWallet Foundation、Open Source Initiative(OSI)、Software Heritage、K8SUGなどの主要パートナーも積極的に参加しています。この会議では、AIモデル、インフラストラクチャ、アプリケーションの展開、具現化されたインテリジェンスなどの中心的なテーマに焦点を当てた60以上の技術セッションが開催され、オープンソースエコシステムの進化と新たなトレンドを包括的に見ることができます。
AIとオープンソースの共生関係
GOSIMの共同創設者であるMichael Yuan氏は、「オープンソースが追いついた、次は何か?(Open Source Has Caught Up, What’s Next?)」というタイトルの基調講演で会議を開始しました。彼は、オープンソースAIの現状と将来の軌跡について洞察を共有し、それが重要な瞬間に達したことを強調しました。
「かつて、オープンソースがクローズドソースモデルに追いつくには5〜10年かかると予測していましたが、この目標は予定よりも早く達成されたようです」とYuan氏は述べています。彼は、Qwen 3の最近のリリースを例に挙げ、オープンソースモデルはもはや互いに競合するだけでなく、特定のベンチマークでは独自のフラッグシップモデルに直接挑戦し、それを上回ることさえあると指摘しました。Yuan氏はまた、この進歩はオープンソースの進歩だけでなく、クローズドソースの開発が期待に応えられず、パフォーマンスのボトルネックに遭遇した結果でもあると示唆しました。対照的に、オープンソースモデルは急速に進化しており、急勾配のパフォーマンス成長曲線を示し、「キャッチアップ」現象を実証しています。
この観察は、人工汎用知能(AGI)の達成まであとどれくらいかという根本的な疑問を提起します。Yuan氏は、AGIの未来は、単一の包括的なモデルではなく、プライベートハードウェアまたはロボットデバイスに展開された特殊なモデル、知識ベース、およびツールのネットワークにある可能性があると考えています。
彼はさらに、AIアーキテクチャが集中型から分散型パラダイムに移行していると説明しました。彼は、OpenAIのCompletion APIから、大規模なインテリジェントエージェントプラットフォームの構築を目的とした新しいResponses APIへの移行を強調しました。60万人近くのユーザーと開発者がすでにこの変革に参加し、分散型AIアプリケーションの開発に貢献しています。
「AGIの未来は、単一の資金豊富な企業によって独占的に開発されるべきではありません」とYuan氏は主張しました。「代わりに、グローバルなコラボレーションを通じて構築され、モデル、知識ベース、ロボット、および実行システムを包含するエコシステムネットワークを作成する必要があります。」
Yuan氏の講演に続き、OpenWallet FoundationのエグゼクティブディレクターであるDaniel Goldscheider氏が、「GDC Wallets & Credentials」に関するプレゼンテーションを行い、国連総会で採択されたグローバルデジタルコンパクト(GDC)プロジェクトに焦点を当てました。彼は、GDCには2つの主要な目的があると説明しました。
- デジタル技術が私たちの生活と社会の発展を大きく変え、前例のない機会と予期せぬリスクの両方をもたらしていることを認識すること。
- すべての人類の利益のためにデジタル技術の可能性を最大限に引き出すには、グローバルな協力が必要であり、国、産業、さらには公共部門と民間部門の間の障壁を取り除く必要があることを強調すること。
この共通理解に基づいて、GDCは「グローバルデジタルコラボレーション」イニシアチブを生み出し、政府、企業、非営利団体、およびその他の利害関係者間の真のコラボレーションを促進することを目指しています。
Goldscheider氏は、運用面について議論する際、このコラボレーションは単一の組織によって指示されるのではなく、関心のあるすべての国際機関、標準化団体、オープンソースコミュニティ、および政府間組織に参加を呼びかける「共同招集」アプローチを採用していることを強調しました。彼は、これが「誰が誰をリードするか」というプロジェクトではなく、すべての当事者が発言権を持ち、誰も他の人よりも重要ではない平等なコラボレーションプラットフォームであると明確にしました。
彼はさらに、グローバルデジタルコラボレーションは、直接標準や技術を開発することを目的とするのではなく、多様なバックグラウンドを持つ組織間の対話を促進し、コンセンサスに達するために彼らの視点やニーズを提示できるようにすることを目的としていると説明しました。その後、特定の標準と技術的な作業は、関連する専門機関によって進められます。彼は、「デジタルアイデンティティ」と「生体認証技術」を例に挙げ、多くの組織がすでにこれらの分野で取り組んでおり、すべての人々を結びつけ、重複、競合、およびリソースの浪費を回避するためのニュートラルなプラットフォームが必要であることを強調しました。
4つの専用フォーラム:オープンソースAIの包括的な分析
この会議では、AIモデル、AIインフラストラクチャ、AIアプリケーション、具現化されたインテリジェンスの4つの専門フォーラムが開催されました。これらのフォーラムでは、基盤となるアーキテクチャからアプリケーションの展開、モデルの機能からインテリジェントエージェントの実践まで、重要なトピックが網羅されました。各フォーラムでは、グローバル企業や研究機関の第一線の専門家がホストを務め、最新の技術トレンドに関する詳細な分析と豊富なエンジニアリング実践事例を紹介し、複数の分野におけるオープンソースAIの包括的な統合と進化を実証しました。
AI大規模モデルの基盤となるロジックの解体
AIモデルフォーラムには、オープンソースコミュニティや研究機関の専門家が集まり、大規模モデルの領域におけるアーキテクチャのイノベーション、オープンソースのコラボレーション、およびエコシステムの進化に関する洞察を共有しました。
Hugging Faceの機械学習研究エンジニアであるGuilherme Penedo氏は、「Open-R1:DeepSeek-R1の完全なオープンソースによる再現(Open-R1: A Fully Open Source Reproduction of DeepSeek-R1)」を発表し、推論タスクに関連するデータのオープン性と標準化を促進することに焦点を当てて、DeepSeek-R1モデルを複製するOpen-R1プロジェクトの取り組みを紹介しました。Zhiyuan Research Instituteのデータ研究チームのテクノロジーリーダーであるGuang Liu氏は、「OpenSeek:次世代の大規模モデルに向けた共同イノベーション(OpenSeek: Collaborative Innovation Towards the Next Generation of Large Models)」を共有し、アルゴリズム、データ、およびシステムレベルでのモデルパフォーマンスのブレークスルーを推進する上でのグローバルなコラボレーションの重要性を強調し、DeepSeekを超える次世代の大規模モデルの開発を目標としました。
CSDNのシニアバイスプレジデントであるJason Li氏は、「DeepSeekの解読:技術革新とそのAIエコシステムへの影響(Decoding DeepSeek: Technological Innovation and its Impact on the AI Ecosystem)」を発表し、技術パラダイム、モデルアーキテクチャ、および産業生態におけるDeepSeekのイノベーション、ならびにグローバルなAIエコシステムへの潜在的な影響に関する詳細な分析を提供しました。MiniMaxのシニアリサーチディレクターであるYiran Zhong氏は、「線形な未来:大規模言語モデルアーキテクチャの進化(Linear Future: The Evolution of Large Language Model Architectures)」を発表し、効率とパフォーマンスの点でTransformerアーキテクチャの代替となる可能性のある、チームが提案したLightning Attentionメカニズムを紹介しました。オックスフォード大学のロイヤルソサエティニュートン国際フェローであるShiwei Liu氏は、「大規模言語モデルにおける深さの呪い(The Depth Curse in Large Language Models)」について議論し、モデルが深まるにつれてディープニューラルネットワークの貢献が減少することを探求し、深層レイヤーの利用率と全体的な効率を向上させるためにPre-LNメカニズムを改善するためにLayerNorm Scalingを使用することを提案しました。Zhipu AIの研究エンジニアであるDiego Rojas氏は、「コード大規模言語モデル:トークンを超えた探求(Code Large Language Models: Exploring Beyond Tokens)」で、現在の大規模モデルは強力ではあるものの、依然として非効率的なトークン化に依存しており、モデルをより高速かつ強力にするためにトークン化をスキップする新しい方法を共有していると指摘しました。Fraunhofer IAISのベーシックモデルチームの責任者であるNicolas Flores-Herr氏は、「グローバルに競争力のある「ヨーロッパ製」の大規模言語モデルを構築する方法(How to Build Globally Competitive ‘European-Made’ Large Language Models?)」でフォーラムを締めくくり、ヨーロッパは多言語、オープンソース、および信頼できるローカライズされた大規模モデルプロジェクトを通じてデータ、多様性、および規制上の課題を克服し、ヨーロッパの価値観を反映した次世代のAIを構築していることを強調しました。
AIインフラストラクチャの三位一体:データ、計算能力、およびアルゴリズムの進化
よりオープンで効率的、かつ包括的な大規模モデルの基盤の構築に焦点を当て、AIインフラストラクチャフォーラムには、研究機関や企業の第一線の専門家が集まり、データ、計算能力、およびシステムアーキテクチャなどの主要な問題について詳細な議論を行いました。
Zhiyuan Research Institute(BAAI)の副社長であるYonghua Lin氏は、「AIオープンソース・フォー・グッド:包括的なアプリケーション、公正なデータ、および普遍的な計算能力(AI Open Source for Good: Inclusive Applications, Fair Data, and Universal Computing Power)」で中国インターネットコーパスCCI 4.0を発表し、CCI4.0-M2-Base V1、CCI4.0-M2-CoT V1、およびCCI4.0-M2-Extra V1の3つの主要なデータセットを網羅しました。CCI4.0-M2-Base V1のデータ量は35000GBで、中国語と英語のバイリンガルであり、5000GBの中国語データがあり、CCI3.0と比較してデータ規模が5倍に増加しています。CCI4.0-M2-CoT V1には、推論能力を向上させるための4億5000万件の逆合成された人間の思考軌跡データが含まれており、合計トークン数は425B(4250億)で、現在グローバルで利用可能な最大のオープンソース合成データセットであるCosmopedia(Hugging Faceによってオープンソース化)の約20倍のサイズです。
次に、HuaweiのシニアソフトウェアエンジニアであるXiyuan Wang氏は、「Ascend CANNに基づくトレーニングと推論のベストプラクティス(Best Practices for Training and Inference Based on Ascend CANN)」で、CANNアーキテクチャがAIフレームワークとAscendハードウェアをどのように接続し、PyTorchやvLLMなどのサポートエコシステムを通じて最適なトレーニング推論を実現するかを紹介しました。CarrefourのデータアーキテクトであるGuillaume Blaquiere氏は、「LLMをサーバーレスにする(Making Your LLM Serverless)」で、GPUをサポートするサーバーレス大規模モデルインスタンスをGoogle Cloud Runを通じて展開し、コストを削減し、リソースの利用効率を向上させる方法を実証しました。北京大学のエンジニアであるYinping Ma氏は、「オープンソースインテリジェントコンピューティング統合管理およびスケジューリング基本ソフトウェア - SCOWおよびCraneSched(Open Source Intelligent Computing Integrated Management and Scheduling Basic Software - SCOW and CraneSched)」に関する基調講演を行い、北京大学が開発した2つの主要なオープンソース基本ソフトウェアであるSCOWとCraneSchedを紹介しました。これらのソフトウェアは、全国の数十の大学や企業に展開され、インテリジェントコンピューティングリソースの統一された管理と高性能なスケジューリングをサポートしています。Beihang大学の博士課程候補であるYaowei Zheng氏は、「verl:ハイブリッドコントローラーに基づくRLHFシステム(verl: A RLHF System Based on Hybrid Controller)」のスピーチで、Verlシステムのハイブリッドコントローラーアーキテクチャの設計コンセプトを共有し、大規模な強化学習トレーニングにおける効率の利点について議論しました。Oxen.aiのCEOであるGreg Schoeninger氏は、「DeepSeek-R1スタイルの強化学習のためのトレーニングデータセットとインフラストラクチャ(GRPO)(Training Datasets and Infrastructure for DeepSeek-R1 Style Reinforcement Learning (GRPO))」を発表し、データセットの構築、インフラストラクチャの構築、ローカルトレーニングコード生成モデルを含む、推論LLMの強化学習トレーニングプロセスの実践パスを詳細に説明しました。
「使用できるか」から「うまく使用されているか」へ:AIアプリケーションが実用段階に入る
AIアプリケーションフォーラムでは、大手企業のR&D担当者とテクノロジー意思決定者が、大規模モデルによって推進されるAIアプリケーションの現実世界の展開パスと将来の可能性を示す、多様な洞察を共有しました。
Alibaba Tongyi LabのチーフレサーチャーであるYongbin Li氏は、「Tongyi Lingma:コーディングコパイロットからコーディングエージェントへ(Tongyi Lingma: From Coding Copilot to Coding Agent)」で、技術的進化と製品アプリケーションにおけるTongyi Lingmaの最新の進捗状況を共有しました。HuaweiのソフトウェアエンジニアであるDongjie Chen氏は、「Cangjie Magic:大規模モデル時代の開発者のための新しい選択肢(Cangjie Magic: A New Choice for Developers in the Era of Large Models)」に関する基調講演を行い、Cangjieプログラミング言語に基づくAI大規模モデルエージェント開発フレームワークを紹介しました。これにより、開発者がインテリジェントなHarmonyOSアプリケーションを構築する効率を大幅に向上させ、優れた開発体験をもたらすことができます。LangGenius Developer EcosystemのディレクターであるXinrui Liu氏は、「協力、Difyによって実現される技術力(Working Together, Technical Power Enabled by Dify)」に焦点を当て、Difyのオープンソースエコシステムと、AIアプリケーションの普及を加速する上でのその役割を強調しました。
AIとシステムエンジニアリングの組み合わせに関して、Makepadの共同創設者であるRik Arends氏は、「アンビエントコーディングを使用して、AIを使用してモバイルデバイス、Webページ、および複合現実用のRust UIを作成する(Using Ambient Coding, Use AI to Create Rust UI for Mobile Devices, Web Pages, and Mixed Reality)」というユニークなプレゼンテーションを行い、アンビエントコーディングを使用してUIの新しいパラダイムを構築する方法を模索しました。Broadcom SpringチームのR&DソフトウェアエンジニアであるChristian Tzolov氏は、「MCPを介したAI統合のための統一されたパラダイム(A Unified Paradigm for AI Integration Through MCP)」で、MCP Java SDKとSpring AI MCPを通じて、AIモデルを既存のシステムやリソースと効率的に統合する方法を実証することに焦点を当てました。Futureweiのテクノロジーストラテジー担当シニアディレクターであるWenjing Chu氏は、「MCPおよびA2Aの「T」は信頼を意味する(The ‘T’ in MCP and A2A Stands for Trust)」で、エージェントベースのアプリケーションで真に信頼できるAIシステムを構築する方法を深く分析し、さらに視点を高めました。さらに、CegidのソフトウェアエンジニアリングマネージャーであるHong-Thai Nguyen氏は、「Cegid Pulse:マルチエージェントビジネス管理プラットフォーム(Cegid Pulse: Multi-Agent Business Management Platform)」のスピーチで、マルチエージェントがビジネスプロセスをどのように再構築し、実際のシナリオと組み合わせてよりスマートな企業意思決定と運用を達成できるかを紹介しました。
大規模モデルに「体」が装備されている場合:具現化されたインテリジェンスが到着する
具現化されたインテリジェンスは、AI分野で最も挑戦的で有望な開発方向の1つになりつつあります。このフォーラムでは、業界のトップ技術専門家の多くが、「具現化されたインテリジェンス」をテーマに詳細な議論を行い、アーキテクチャ設計、モデルアプリケーション、およびシナリオ展開における彼らの実践的な探求を共有しました。
ZettaScaleのCEO兼CTOであるAngelo Corsaro氏は、「心、体、およびZenoh(Mind, Body, and Zenoh)」で、Zenohプロトコルがインテリジェントロボット時代に知覚、実行、および認識の間の障壁をどのように打ち破ることができるかを紹介しました。DoraプロジェクトのプロジェクトマネージャーであるPhilipp Oppermann氏は、「DoraでZenohを使用して分散データフローを実装する(Using Zenoh in Dora to Implement Distributed Data Flow)」を持ち込み、分散データフローを実装するためのDoraにおけるZenohプロトコルの重要なアプリケーションについて説明しました。中国科学技術大学の教授であるJames Yang氏は、「自律走行における敵対的な安全クリティカルシナリオの生成(Generation of Adversarial Safety-Critical Scenarios in Autonomous Driving)」に関するスピーチを行い、複雑な環境における安定性と信頼性を確保するために敵対的なシナリオを生成することにより、自律走行技術の安全性を向上させる方法を紹介しました。
さらに、Zhiyuan Research Instituteの具現化されたインテリジェンス研究者であるMinglan Lin氏も、「RoboBrain:ロボット操作のための統一された脳モデルおよびRoboOS:RoboBrainおよびロボットインテリジェントエージェントのための階層的なコラボレーションフレームワーク(RoboBrain: A Unified Brain Model for Robot Operation & RoboOS: A Hierarchical Collaboration Framework for RoboBrain and Robot Intelligent Agents)」のトピックに焦点を当て、RoboBrainがロボットのインテリジェンスレベルをどのように向上させることができるか、およびRoboOSのロボットコラボレーションにおける重要な役割を実証しました。Voyage Roboticsの創設者であるVille Kuosmanen氏は、「オープンソースVLAモデルを使用したロボットアプリケーションの構築(Building Robot Applications with Open Source VLA Models)」に関する素晴らしいスピーチを行い、オープンソースVLAモデルを使用してロボットアプリケーションに強力なサポートを提供する