GOSIM AI Paris 2025: Революция Open Source AI

В последние годы в сфере ИИ произошла кардинальная трансформация, обусловленная духом сотрудничества при разработке открытого исходного кода. Большие языковые модели (LLM) больше не являются исключительной областью технологических гигантов, теперь они развиваются благодаря усилиям сообщества и открытому обмену, влияя на все: от инфраструктуры до оптимизации алгоритмов и развертывания. Это движение open source ускоряет прогресс ИИ, делая его более доступным и демократизируя возможность внести свой вклад в следующее поколение интеллектуальных систем.

На этом фоне 6 мая в Париже, Франция, начала свою работу конференция GOSIM AI Paris 2025, организованная совместно GOSIM, CSDN и 1ms.ai. Мероприятие служит важной платформой, объединяющей мировых технологических практиков и исследователей для изучения последних прорывов и будущих направлений в области ИИ с открытым исходным кодом.

Конференция может похвастаться впечатляющим составом из более чем 80 технических экспертов и ученых из ведущих организаций, таких как Alibaba, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, Peking University, Fraunhofer, Oxford University и французское сообщество openLLM. Ключевые партнеры, в том числе Huawei, Всекитайская молодежная ассоциация инноваций и предпринимательства во Франции, Китайско-французская ассоциация искусственного интеллекта, Apache Software Foundation, Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, Linux Foundation Research, OpenWallet Foundation, Open Source Initiative (OSI), Software Heritage и K8SUG, также принимают активное участие. На конференции проходит более 60 технических сессий, посвященных основным темам, таким как модели ИИ, инфраструктура, развертывание приложений и воплощенный интеллект, что обеспечивает всесторонний обзор эволюции экосистемы open source и возникающих тенденций.

Симбиотические отношения между ИИ и Open Source

Майкл Юань, соучредитель GOSIM, открыл конференцию вступительным докладом под названием "Open Source догнал, что дальше?". Он поделился своими мыслями о текущем состоянии и будущей траектории развития ИИ с открытым исходным кодом, подчеркнув, что он достиг переломного момента.

"Однажды мы предсказали, что open source потребуется 5-10 лет, чтобы догнать модели с закрытым исходным кодом, но, похоже, эта цель была достигнута досрочно", - заявил Юань. В качестве примера он привел недавний выпуск Qwen 3, отметив, что модели open source больше не просто конкурируют друг с другом, а теперь напрямую бросают вызов проприетарным флагманским моделям, даже превосходя их по некоторым бенчмаркам. Юань также предположил, что этот прогресс обусловлен не только достижениями open source, но и тем, что разработка с закрытым исходным кодом не оправдала ожиданий и столкнулась с узкими местами в производительности. В отличие от этого, модели open source быстро развиваются, демонстрируя крутую кривую роста производительности и демонстрируя истинный феномен "догоняющего развития".

Это наблюдение поднимает фундаментальный вопрос: как далеко мы от достижения общего искусственного интеллекта (AGI)? Юань считает, что будущее AGI может заключаться не в единой, всеобъемлющей модели, а скорее в сети специализированных моделей, баз знаний и инструментов, развернутых на частном оборудовании или роботизированных устройствах.

Он далее уточнил, что архитектура ИИ смещается от централизованной к децентрализованной парадигме. Он выделил переход OpenAI от Completion API к новому Responses API, который направлен на создание крупномасштабной интеллектуальной платформы агентов. Почти 600 000 пользователей и разработчиков уже присоединились к этой трансформации, внося свой вклад в разработку распределенных приложений ИИ.

"Будущее AGI не должно разрабатываться исключительно одной, хорошо финансируемой компанией", - заявил Юань. "Вместо этого оно должно строиться посредством глобального сотрудничества, создавая сетевую экосистему, охватывающую модели, базы знаний, роботов и системы исполнения".

После выступления Юаня Даниэль Гольдшайдер, исполнительный директор OpenWallet Foundation, представил доклад на тему "GDC Wallets & Credentials", посвященный проекту Global Digital Compact (GDC), принятому Генеральной Ассамблеей Организации Объединенных Наций. Он пояснил, что GDC преследует две основные цели:

  • Признание того, что цифровые технологии коренным образом изменили нашу жизнь и общественное развитие, принеся как беспрецедентные возможности, так и непредвиденные риски.
  • Подчеркивая, что реализация всего потенциала цифровых технологий на благо всего человечества требует глобального сотрудничества, устранения барьеров между странами, отраслями и даже государственным и частным секторами.

На основе этого общего понимания GDC породил инициативу "Глобальное цифровое сотрудничество", направленную на содействие подлинному сотрудничеству между правительствами, предприятиями, некоммерческими организациями и другими заинтересованными сторонами.

При обсуждении операционных аспектов Гольдшайдер подчеркнул, что это сотрудничество не продиктовано какой-либо отдельной организацией, а скорее принимает подход "совместного созыва", приглашая к участию все заинтересованные международные организации, органы по стандартизации, сообщества open source и межправительственные организации. Он пояснил, что это не проект "кто кем руководит", а платформа для равноправного сотрудничества, где каждая сторона имеет право голоса и никто не важнее другого.

Он далее пояснил, что Global Digital Collaboration не ставит перед собой цель непосредственно разрабатывать стандарты или технологии, а скорее содействовать диалогу между организациями из разных слоев общества, позволяя им представить свои перспективы и потребности для достижения консенсуса. Впоследствии конкретные стандарты и техническая работа будут продвигаться соответствующими специализированными органами. Он привел в качестве примеров "цифровую идентификацию" и "биометрические технологии", отметив, что многие организации уже работают в этих областях, подчеркнув необходимость нейтральной платформы для объединения всех, избежания дублирования, конфликтов и траты ресурсов.

Четыре специализированных форума: Комплексный анализ Open Source AI

На конференции было представлено четыре специализированных форума: Модели ИИ, Инфраструктура ИИ, Приложения ИИ и Воплощенный интеллект. Эти форумы охватывали важные темы, начиная от базовой архитектуры и заканчивая развертыванием приложений, и от возможностей модели до практики интеллектуальных агентов. На каждом форуме выступали ведущие эксперты из глобальных предприятий и исследовательских институтов, предоставляя как углубленный анализ последних технологических тенденций, так и демонстрируя богатые примеры инженерной практики, демонстрирующие всестороннюю интеграцию и эволюцию Open Source AI в различных областях.

Деконструкция базовой логики больших моделей ИИ

Форум по моделям ИИ собрал вместе экспертов из сообществ open source и исследовательских институтов, чтобы поделиться мнениями об архитектурных инновациях, сотрудничестве open source и эволюции экосистемы в сфере больших моделей.

Гильерме Пенедо, инженер-исследователь машинного обучения в Hugging Face, представил "Open-R1: Полностью Open Source воспроизведение DeepSeek-R1", демонстрируя усилия проекта Open-R1 по воспроизведению модели DeepSeek-R1, с акцентом на содействие открытости и стандартизации данных, связанных с задачами вывода. Гуан Лю, руководитель технологической группы исследования данных в Zhiyuan Research Institute, поделился информацией об "OpenSeek: Совместные инновации на пути к следующему поколению больших моделей", подчеркнув важность глобального сотрудничества в стимулировании прорывов в производительности моделей на уровнях алгоритмов, данных и систем, с целью разработки следующего поколения больших моделей, которые превзойдут DeepSeek.

Джейсон Ли, старший вице-президент CSDN, представил "Декодирование DeepSeek: Технологические инновации и их влияние на экосистему ИИ", предоставив углубленный анализ инноваций DeepSeek в технических парадигмах, архитектуре моделей и промышленной экологии, а также их потенциального воздействия на глобальную экосистему ИИ. Иран Чжун, старший директор по исследованиям в MiniMax, представил "Линейное будущее: Эволюция архитектур больших языковых моделей", представив предложенный командой механизм Lightning Attention, который предлагает потенциальную альтернативу архитектурам Transformer с точки зрения эффективности и производительности. Шивэй Лю, научный сотрудник Королевского общества Ньютона в Оксфордском университете, обсудил "Проклятие глубины в больших языковых моделях", изучая уменьшающийся вклад глубоких нейронных сетей по мере углубления моделей, и предложил использовать LayerNorm Scaling для улучшения механизма Pre-LN для повышения использования глубоких слоев и общей эффективности. Диего Рохас, инженер-исследователь в Zhipu AI, отметил в "Модели больших языковых кодов: Исследование за пределами токенов", что текущие большие модели, хотя и мощные, все еще полагаются на токенизацию, которая неэффективна, и поделился новыми методами пропуска токенизации, чтобы сделать модели быстрее и сильнее. Николас Флорес-Херр, руководитель группы базовых моделей в Fraunhofer IAIS, завершил форум докладом "Как построить глобально конкурентоспособные "сделанные в Европе" большие языковые модели?", подчеркнув, что Европа преодолевает проблемы с данными, разнообразием и регулированием с помощью многоязычных, open source и заслуживающих доверия локализованных проектов больших моделей, чтобы построить следующее поколение ИИ, отражающее европейские ценности.

Триада инфраструктуры ИИ: Данные, вычислительная мощность и алгоритмическая эволюция

Сосредоточившись на создании более открытой, эффективной и инклюзивной основы для больших моделей, форум по инфраструктуре ИИ собрал вместе ведущих экспертов из исследовательских институтов и предприятий для участия в углубленных дискуссиях по ключевым вопросам, таким как данные, вычислительная мощность и системная архитектура.

Юнхуа Линь, вице-президент Zhiyuan Research Institute (BAAI), запустил китайский интернет-корпус CCI 4.0 в "AI Open Source для блага: Инклюзивные приложения, справедливые данные и универсальная вычислительная мощность", охватывающий три основных набора данных: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1 и CCI4.0-M2-Extra V1. CCI4.0-M2-Base V1 имеет объем данных 35000 ГБ, является двуязычным на китайском и английском языках, с 5000 ГБ китайских данных, что в 5 раз больше, чем в CCI3.0. CCI4.0-M2-CoT V1 содержит 450 миллионов обратно синтезированных данных траектории мышления человека для улучшения способности к рассуждению, с общим количеством токенов 425B (425 миллиардов), что почти в 20 раз превышает размер Cosmopedia (open source от Hugging Face), самого большого open source синтетического набора данных, доступного в настоящее время в мире.

Сиюань Ван, старший инженер-программист в Huawei, затем представил, как архитектура CANN соединяет фреймворки ИИ и оборудование Ascend в "Лучшие практики для обучения и вывода на основе Ascend CANN" и достигает оптимального обучения и вывода посредством поддержки экосистем, таких как PyTorch и vLLM. Гийом Блакьер, архитектор данных в Carrefour, продемонстрировал, как развернуть бессерверные экземпляры больших моделей, поддерживающие графические процессоры через Google Cloud Run, чтобы снизить затраты и повысить эффективность использования ресурсов в "Сделав ваш LLM бессерверным". Иньпин Ма, инженер в Peking University, выступил с основным докладом на тему "Open Source Intelligent Computing Integrated Management and Scheduling Basic Software - SCOW and CraneSched", представив два основных open source базовых программного обеспечения, разработанных Peking University, SCOW и CraneSched, которые были развернуты в десятках университетов и предприятий по всей стране, поддерживая унифицированное управление и высокопроизводительное планирование интеллектуальных вычислительных ресурсов. Яовэй Чжэн, кандидат наук в Beihang University, поделился концепцией дизайна гибридной архитектуры контроллера в системе Verl в докладе "verl: Система RLHF на основе гибридного контроллера" и обсудил ее преимущества в эффективности при крупномасштабном обучении с подкреплением. Грег Шёнингер, генеральный директор Oxen.ai, представил "Наборы данных для обучения и инфраструктуру для обучения с подкреплением в стиле DeepSeek-R1 (GRPO)" и подробно рассказал о пути практики для процессов обучения с подкреплением для рассуждающих LLM, включая построение набора данных, построение инфраструктуры и локальные модели генерации кода обучения.

От "Можно ли это использовать" до "Используется ли это хорошо": Приложения ИИ выходят на практический этап

На форуме по приложениям ИИ специалисты по исследованиям и разработкам и лица, принимающие технологические решения, из ведущих компаний поделились разнообразным спектром мнений, демонстрируя пути развертывания в реальном мире и будущие возможности приложений ИИ, управляемых большими моделями.

Юнбин Ли, главный исследователь в Alibaba Tongyi Lab, поделился последним прогрессом Tongyi Lingma в технической эволюции и применении продукта в "Tongyi Lingma: От помощника по кодированию до агента по кодированию". Дунцзе Чэнь, инженер-программист в Huawei, выступил с основным докладом на тему "Cangjie Magic: Новый выбор для разработчиков в эпоху больших моделей", представив фреймворк разработки агентов ИИ на основе языка программирования Cangjie, который может значительно повысить эффективность разработчиков при создании интеллектуальных приложений HarmonyOS и обеспечить превосходный опыт разработки. Синьжуй Лю, директор экосистемы разработчиков LangGenius, сосредоточился на "Работая вместе, техническая мощь, обеспечиваемая Dify", подчеркнув экосистему open source Dify и ее роль в ускорении популяризации приложений ИИ.

Что касается сочетания ИИ и системной инженерии, Рик Арендс, соучредитель Makepad, выступил с уникальной презентацией: "Использование Ambient Coding, использование ИИ для создания Rust UI для мобильных устройств, веб-страниц и смешанной реальности", изучая, как использовать ambient coding для построения новой парадигмы для UI. Кристиан Цолов, инженер-программист R&D из команды Broadcom Spring, сосредоточился на демонстрации того, как эффективно интегрировать модели ИИ с существующими системами и ресурсами с помощью MCP Java SDK и Spring AI MCP в "Унифицированная парадигма для интеграции ИИ через MCP". Вэньцзин Чу, старший директор по стратегии технологий в Futurewei, еще больше повысил перспективу в "‘T’ в MCP и A2A означает доверие", глубоко анализируя, как построить действительно заслуживающие доверия системы ИИ в приложениях на основе агентов. Кроме того, Хонг-Тай Нгуен, менеджер по разработке программного обеспечения в Cegid, рассказал, как мультиагент может изменить бизнес-процессы и добиться более разумного принятия решений и операций на предприятиях в сочетании с практическими сценариями в докладе "Cegid Pulse: Мультиагентная платформа управления бизнесом".

Когда большие модели оснащены "телами": Наступает воплощенный интеллект

Воплощенный интеллект становится одним из самых сложных и перспективных направлений развития в области ИИ. На этом форуме многие ведущие технические эксперты отрасли приняли участие в углубленных дискуссиях на тему "воплощенного интеллекта", поделившись своими практическими исследованиями в области архитектурного дизайна, применения моделей и развертывания сценариев.

Анджело Корсаро, генеральный директор и технический директор ZettaScale, рассказал, как протокол Zenoh может разрушить барьеры между восприятием, исполнением и познанием в эпоху интеллектуальных роботов в "Ум, тело и Zenoh". Филипп Опперманн, менеджер проекта Dora, принес "Использование Zenoh в Dora для реализации распределенного потока данных", объяснив важное применение протокола Zenoh в Dora для реализации распределенного потока данных. Джеймс Янг, профессор Университета науки и технологий Китая, выступил с докладом на тему "Генерация состязательных сценариев, критически важных для безопасности, в автономном вождении", представив, как повысить безопасность технологии автономного вождения путем генерации состязательных сценариев для обеспечения стабильности и надежности в сложных условиях.

Кроме того, Минглань Линь, исследователь воплощенного интеллекта в Zhiyuan Research Institute, также сосредоточился на теме "RoboBrain: Унифицированная модель мозга для работы роботов & RoboOS: Иерархический фреймворк сотрудничества для RoboBrain и интеллектуальных агентов роботов", продемонстрировав, как RoboBrain может повысить уровень интеллекта роботов, и важную роль RoboOS в сотрудничестве роботов. Вилле Куосманен, основатель Voyage Robotics,выступил с замечательной речью на тему "Создание приложений для роботов с помощью Open Source VLA Models", объяснив, как использовать open source VLA Models для обеспечения мощной поддержки приложений для роботов. Наконец, Хуй Хоанг Ха, исследователь больших языковых моделей в Menlo Research, обсудил, как пространственное мышление может помочь роботам лучше понимать сложные 2D и 3D среды, тем самым улучшая их работу и возможности навигации в основном докладе "Пространственное мышление LLM: Улучшение понимания 2D и 3D для поддержки работы и навигации роботов".

Spotlight Talks: Освещение передовых технологий и инновационных приложений

Spotlight Talks Day 1 включал в себя интересные презентации от отраслевых экспертов по передовым технологиям и инновационным приложениям. Этот сегмент послужил платформой для практикующих специалистов в области технологий из различных областей для обсуждения последних достижений и практического применения ИИ. Сирил Мойно, инженер-исследователь во Французской комиссии по атомной энергии (CEA), рассказал, как проект Eclipse Aidge поддерживает развертывание и оптимизацию глубоких нейронных сетей на встроенных платформах, предоставляя полную цепочку инструментов в речи “Aidge”, тем самым ускоряя разработку интеллектуальных пограничных систем.

Павел Кищак, специалист по данным в Bielik.ai, впервые публично поделился последним прогрессом польского отечественного проекта ИИ Bielik на этой конференции и выступил с речью под названием "Восстание Bielik.AI", рассказав, как проект способствует построению локальной автономной системы ИИ с помощью языковых моделей с открытым исходным кодом и полной экосистемы инструментов. Проект Bielik не только выпустил несколько языковых моделей с открытым исходным кодом (параметры масштабирования, охватывающие 1,5B, 4,5B и 11B), но также создал сквозную цепочку инструментов, охватывающую наборы данных, оценку, обучение и тонкую настройку, поддерживая исследовательские группы и разработчиков для тонкой настройки или непрерывного предварительного обучения на основе базовых моделей, что значительно снижает порог исследований и разработок для больших моделей и стимулирует местные технологические инновационные возможности.

Хунг-Инь Тай, технический руководитель из Second State, поделился "Запуском моделей GenAI на периферийных устройствах с помощью LlamaEdge", продемонстрировав легкие и высокопроизводительные возможности LlamaEdge при развертывании генеративных моделей ИИ на периферийных устройствах, обеспечивая более гибкий и эффективный локальный опыт рассуждений. Тянью Чэнь, кандидат наук в Peking University, рассказал, как фреймворк SAFE смягчает проблему нехватки данных для обучения с помощью механизма саморазвития "синтез данных - тонкая настройка модели", тем самым значительно повышая эффективность и точность формальной верификации кода Rust в "Достижение автоматической формальной верификации кода Rust на основе фреймворка саморазвития". Готье Вио, директор по исследованиям и разработкам в Illuin Technology, рассказал, как система ColPali, построенная командой на основе архитектуры ColBERT и модели PaliGemma, эффективно повышает точность и эффективность поиска документов, объединяя графическую и текстовую информацию в речи "ColPali: Эффективный поиск документов на основе модели визуального языка". Наконец, Сяо Чжан, генеральный директор Dynamia.ai, рассказал, как лучше управлять и планировать гетерогенные ресурсы графического процессора с помощью HAMi и повысить коэффициент использования и наблюдаемость инфраструктуры ИИ в "Разблокировка возможностей кластера K8s гетерогенной инфраструктуры ИИ: Высвобождение мощи HAMi".

Разнообразные взаимодействия и основные моменты первого дня

В дополнение к высокоплотным основным выступлениям, на конференции также было представлено несколько специальных подразделений. Подразделение Closed-door Meeting было сосредоточено на стратегических диалогах и углубленных отраслевых обменах для содействия трансграничному сотрудничеству. Showcase Sessions были сосредоточены на представлении новейших технологических продуктов ИИ предприятий и исследовательских институтов, привлекая большое количество посетителей, чтобы остановиться и пообщаться. В конкурсных сессиях разработчики ИИ и робототехники, инженеры и энтузиасты робототехники со всего мира сосредоточились на open source наборе роботизированной руки SO-ARM100 для проведения практического исследования обучения имитации. Комплект интегрирует фреймворк LeRobot от Hugging Face и объединяет технологии ИИ и робототехники NVIDIA для поддержки передовых архитектур ИИ, включая ACT и Diffusion Policy, предоставляя участникам прочную техническую основу. Участники провели практические исследования в реальных сценариях, чтобы всесторонне оценить его эффекты и осуществимость.

Workshop Sessions взяли экосистему OpenHarmony в качестве основной темы и изучили проект open source, инкубированный и управляемый Open Atom Open Source Foundation. OpenHarmony стремится создать интеллектуальную терминальную операционную систему для эпохи всесценариев, всесвязности и всеинтеллекта, создав открытую, глобализированную и инновационную ведущую распределенную платформу операционной системы, обслуживая разнообразные интеллектуальные устройства и помогая развитию индустрии Интернета вещей. На месте проведения конференции участники глубоко поняли основные преимущества OpenHarmony в многокомпонентном сотрудничестве устройств и легком дизайне системы посредством серии практических семинаров, лично участвуя в ключевых процессах от разработки драйверов до развертывания приложений. Практическая практика не только помогает разработчикам открыть технический путь "снизу вверх", но и всесторонне улучшает возможности разработки и отладки на системном уровне.

Программа GOSIM AI Paris 2025 Day 1 подошла к успешному завершению, но волнение продолжается. Завтра конференция продолжит продвигаться по четырем основным форумам: модели ИИ, инфраструктура ИИ, приложения ИИ и воплощенный интеллект, и будет приветствовать долгожданный PyTorch Day, с появлением более авторитетных гостей и практического контента из первых рук, так что следите за обновлениями!