В последните години пейзажът на изкуствения интелект (AI) претърпя драматична трансформация, подхранвана от духа на сътрудничество в развитието на отворен код. Големите езикови модели (LLMs) вече не са само домейн на технологичните гиганти, а еволюират чрез усилията на общността и отвореното споделяне, което оказва влияние върху всичко - от инфраструктурата до оптимизацията и внедряването на алгоритми. Това движение с отворен код ускорява напредъка на AI, като го прави по-достъпен и демократизира възможността да се допринесе за следващото поколение интелигентни системи.
На този фон, конференцията GOSIM AI Париж 2025, съорганизирана от GOSIM, CSDN и 1ms.ai, започна на 6 май в Париж, Франция. Събитието служи като решаваща платформа, свързваща глобални технологични практици и изследователи, за да проучат най-новите пробиви и бъдещи насоки в AI с отворен код.
Конференцията се гордее с впечатляващ състав от над 80 технологични експерти и учени от водещи организации като Alibaba, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, Peking University, Fraunhofer, Oxford University и френската общност openLLM. Ключови партньори, включително Huawei, All-China Youth Innovation and Entrepreneurship Association in France, the Sino-French Artificial Intelligence Association, the Apache Software Foundation, the Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, the Linux Foundation Research, the OpenWallet Foundation, the Open Source Initiative (OSI), Software Heritage и K8SUG, също активно участват. Конференцията включва над 60 технически сесии, центрирани около основни теми като AI модели, инфраструктура, внедряване на приложения и въплътен интелект, предоставяйки цялостен поглед върху еволюцията и нововъзникващите тенденции в екосистемата с отворен код.
Симбиотичната връзка между AI и отворен код
Майкъл Юан, съосновател на GOSIM, откри конференцията с основна реч, озаглавена "Отвореният код настигна, какво следва?". Той сподели своите прозрения за текущото състояние и бъдещата траектория на AI с отворен код, като подчерта, че е достигнал ключов момент.
"Веднъж прогнозирахме, че ще отнеме 5-10 години, за да настигне отвореният код моделите със затворен код, но изглежда, че тази цел е постигната преди крайния срок", заяви Юан. Той цитира скорошното пускане на Qwen 3 като пример, отбелязвайки, че моделите с отворен код вече не се конкурират само помежду си, а сега директно предизвикват собственическите водещи модели, дори ги надминават в определени показатели. Юан също така предположи, че този напредък не се дължи единствено на постиженията с отворен код, а и на факта, че развитието със затворен код не успява да оправдае очакванията и се сблъсква с тесни места в производителността. За разлика от това, моделите с отворен код бързо се развиват, показвайки стръмна крива на растеж на производителността и демонстрирайки истински феномен на "настигане".
Това наблюдение повдига основен въпрос: Колко сме близо до постигането на общ изкуствен интелект (AGI)? Юан вярва, че бъдещето на AGI може да не се крие в единен, всеобхватен модел, а по-скоро в мрежа от специализирани модели, бази знания и инструменти, разположени на частен хардуер или роботизирани устройства.
Той допълнително уточни, че AI архитектурата се измества от централизирана към децентрализирана парадигма. Той подчерта прехода на OpenAI от Completion API към новия Responses API, който има за цел да изгради мащабна интелигентна агентна платформа. Близо 600 000 потребители и разработчици вече са се присъединили към тази трансформация, допринасяйки за разработването на разпределени AI приложения.
"Бъдещето на AGI не трябва да бъде изключително развито от една, добре финансирана компания", заяви Юан. "Вместо това то трябва да бъде изградено чрез глобално сътрудничество, създавайки екосистемна мрежа, обхващаща модели, бази знания, роботи и системи за изпълнение."
След речта на Юан, Даниел Голдшайдер, изпълнителен директор на OpenWallet Foundation, изнесе презентация на тема "GDC Wallets & Credentials", фокусирайки се върху проекта Global Digital Compact (GDC), приет от Общото събрание на Организацията на обединените нации. Той обясни, че GDC има две основни цели:
- Признавайки, че дигиталните технологии са трансформирали дълбоко нашия живот и общественото развитие, носейки както безпрецедентни възможности, така и непредвидени рискове.
- Подчертавайки, че реализирането на пълния потенциал на дигиталните технологии в полза на цялото човечество изисква глобално сътрудничество, премахване на бариерите между държави, индустрии и дори публичния и частния сектор.
Въз основа на това споделено разбиране, GDC породи инициативата "Global Digital Collaboration", която има за цел да насърчи истинско сътрудничество между правителства, бизнеси, организации с нестопанска цел и други заинтересовани страни.
Когато обсъждаше оперативните аспекти, Голдшайдер подчерта, че това сътрудничество не е диктувано от никоя отделна организация, а по-скоро приема подход на "съвместно свикване", като кани всички заинтересовани международни организации, органи за определяне на стандарти, общности с отворен код и междуправителствени организации да участват. Той поясни, че това не е проект "кой кого ръководи", а платформа за равноправно сътрудничество, където всяка страна има глас и никой не е по-важен от друг.
Той допълнително обясни, че Global Digital Collaboration няма за цел да разработва директно стандарти или технологии, а по-скоро да улесни диалога между организации от различен произход, позволявайки им да представят своите гледни точки и нужди, за да постигнат консенсус. Впоследствие специфичните стандарти и техническа работа ще бъдат развити от съответните специализирани органи. Той цитира "дигитална идентичност" и "биометрична технология" като примери, отбелязвайки, че много организации вече работят в тези области, подчертавайки необходимостта от неутрална платформа, която да обедини всички, да избегне дублирането, конфликтите и загубата на ресурси.
Четири специализирани форума: Цялостен анализ на AI с отворен код
Конференцията включваше четири специализирани форума: AI модели, AI инфраструктура, AI приложения и въплътен интелект. Тези форуми обхващаха критични теми, вариращи от основната архитектура до внедряването на приложения, и от възможностите на модела до практиките на интелигентни агенти. Всеки форум беше домакин на водещи експерти от глобални предприятия и изследователски институции, предоставяйки както задълбочен анализ на най-новите технологични тенденции, така и демонстрирайки богати случаи на инженерна практика, демонстрирайки цялостната интеграция и еволюция на AI с отворен код в множество области.
Деконструиране на основната логика на AI големи модели
Форумът AI модели събра експерти от общности с отворен код и изследователски институции, за да споделят прозрения за архитектурните иновации, сътрудничеството с отворен код и еволюцията на екосистемите в областта на големите модели.
Гилерме Пенедо, инженер по машинно обучение в Hugging Face, представи "Open-R1: Напълно възпроизвеждане с отворен код на DeepSeek-R1", демонстрирайки усилията на проекта Open-R1 за репликиране на модела DeepSeek-R1, с акцент върху насърчаването на отвореността и стандартизацията на данните, свързани със задачи за извод. Гуанг Лиу, технологичен лидер на екипа за изследване на данни в Zhiyuan Research Institute, сподели "OpenSeek: Сътрудничещи иновации към следващото поколение големи модели", подчертавайки важността на глобалното сътрудничество за стимулиране на пробиви в производителността на моделите на алгоритмично, данни и системно ниво, с цел разработване на следващото поколение големи модели, които надминават DeepSeek.
Джейсън Ли, старши вицепрезидент на CSDN, изнесе "Декодиране на DeepSeek: Технологични иновации и тяхното въздействие върху AI екосистемата", предоставяйки задълбочен анализ на иновациите на DeepSeek в технически парадигми, архитектура на модела и индустриална екология, както и неговото потенциално въздействие върху глобалната AI екосистема. Иран Zhong, старши директор изследвания в MiniMax, представи "Линейно бъдеще: Еволюцията на големите езикови модели архитектури", представяйки предложената от екипа Lightning Attention механизъм, който предлага потенциална алтернатива на Transformer архитектурите по отношение на ефективността и производителността. Шивей Лиу, стипендиант на Кралското общество Нютон в Оксфордския университет, обсъди "Дълбокото проклятие в големите езикови модели", изследвайки намаляващите приноси на дълбоките невронни мрежи с задълбочаването на моделите и предлагайки използването на LayerNorm Scaling за подобряване на Pre-LN механизма за подобряване на използването на дълбоките слоеве и общата ефективност. Диего Рохас, инженер по научни изследвания в Zhipu AI, посочи в "Кодирайте големи езикови модели: Проучване отвъд токените", че настоящите големи модели, макар и мощни, все още разчитат на токенизацията, която е неефективна, и сподели нови методи за пропускане на токенизацията, за да направи моделите по-бързи и по-силни. Николас Флорес-Хер, ръководител на екипа за основни модели във Fraunhofer IAIS, завърши форума с "Как да изградим глобално конкурентоспособни "европейски" големи езикови модели?", подчертавайки, че Европа преодолява предизвикателствата пред данни, разнообразие и регулаторни предизвикателства чрез многоезични, отворени и надеждни локализирани проекти за големи модели, за да изгради следващото поколение AI, което отразява европейските ценности.
Триадата на AI инфраструктурата: Данни, изчислителна мощност и алгоритмична еволюция
Фокусирайки се върху изграждането на по-отворена, ефективна и приобщаваща основа за големи модели, форумът AI инфраструктура събра водещи експерти от изследователски институции и предприятия, за да участват в задълбочени дискусии по ключови въпроси като данни, изчислителна мощност и системна архитектура.
Йонгхуа Лин, вицепрезидент на Zhiyuan Research Institute (BAAI), стартира китайския интернет корпус CCI 4.0 в "AI Open Source for Good: Приобщаващи приложения, честни данни и универсална изчислителна мощност", обхващащ три основни набора от данни: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1 и CCI4.0-M2-Extra V1. CCI4.0-M2-Base V1 има обем на данните от 35000GB, двуезичен е на китайски и английски език, с 5000GB китайски данни, 5-кратно увеличение на мащаба на данните в сравнение с CCI3.0. CCI4.0-M2-CoT V1 съдържа 450 милиона обратно синтезирани данни за траекторията на човешката мисъл за подобряване на способността за разсъждение, с общ брой токени 425B (425 милиарда), почти 20 пъти по-голям от Cosmopedia (отворен код от Hugging Face), най-големият набор от синтетични данни с отворен код, достъпни в момента в световен мащаб.
След това Ксиюан Ван, старши софтуерен инженер в Huawei, представи как архитектурата CANN свързва AI рамки и Ascend хардуер в "Най-добри практики за обучение и извод, базирани на Ascend CANN", и постига оптимален извод за обучение чрез поддържащи екосистеми като PyTorch и vLLM. Гийом Блакиер, архитект на данни в Carrefour, демонстрира как да разположите сървърни големи моделни екземпляри, поддържащи графични процесори чрез Google Cloud Run, за да намалите разходите и да подобрите ефективността на използването на ресурсите в "Направете вашия LLM сървърен." Инпинг Ма, инженер в Peking University, изнесе основна реч на тема "Интелигентно изчисление с отворен код, интегрирано управление и планиране на основен софтуер - SCOW и CraneSched", представяйки двата основни софтуера с отворен код, разработени от Peking University, SCOW и CraneSched, които са разположени в десетки университети и предприятия в цялата страна, поддържайки унифицирано управление и високопроизводително планиране на интелигентни изчислителни ресурси. Яовей Женг, докторант в Beihang University, сподели концепцията за дизайн на хибридната контролерна архитектура в системата Verl в речта "verl: RLHF система, базирана на хибриден контролер", и обсъди предимствата на нейната ефективност при широкомащабно обучение с подсилващо обучение. Грег Шьонингер, главен изпълнителен директор на Oxen.ai, представи "Набори от данни за обучение и инфраструктура за подсилващо обучение в стил DeepSeek-R1 (GRPO)" и подробно описа пътя на практиката за процеси на обучение с подсилващо обучение за модели за разсъждение LLM, включително конструиране на набори от данни, изграждане на инфраструктура и модели за генериране на локален код за обучение.
От "Може ли да се използва" до "Използва ли се добре": AI приложенията навлизат в практическия етап
Във форума AI приложения R&D практици и вземащи решения за технологии от водещи компании споделиха разнообразен набор от прозрения, демонстрирайки пътищата за внедряване в реалния свят и бъдещите възможности на AI приложенията, задвижвани от големи модели.
Йонгбин Ли, главен изследовател в Alibaba Tongyi Lab, сподели най-новия напредък на Tongyi Lingma в техническата еволюция и приложението на продукта в "Tongyi Lingma: От помощник за кодиране до агент за кодиране." Донгджие Чен, софтуерен инженер в Huawei, изнесе основна реч на тема "Cangjie Magic: Нов избор за разработчици в ерата на големите модели", представяйки AI рамката за разработка на големи моделни агенти, базирана на езика за програмиране Cangjie, която може значително да подобри ефективността на разработчиците при изграждането на интелигентни HarmonyOS приложения и да донесе отлично изживяване при разработката. Синруи Лиу, директор на екосистемата за разработчици на LangGenius, се фокусира върху "Работа заедно, техническа мощност, активирана от Dify", подчертавайки екосистемата с отворен код на Dify и нейната роля в ускоряването на популяризирането на AI приложения.
По отношение на комбинацията от AI и системно инженерство, Рик Арендс, съосновател на Makepad, изнесе уникална презентация: "Използване на Ambient Coding, използвайте AI, за да създадете Rust UI за мобилни устройства, уеб страници и смесена реалност", проучвайки как да използвате ambient coding, за да изградите нова парадигма за UI. Кристиан Цолов, R&D софтуерен инженер от екипа на Broadcom Spring, се фокусира върху демонстриране как ефективно да интегрирате AI модели със съществуващи системи и ресурси чрез MCP Java SDK и Spring AI MCP в "Унифицирана парадигма за AI интеграция чрез MCP." Уенджинг Чу, старши директор по технологична стратегия във Futurewei, допълнително издигна перспективата в "‘T’ в MCP и A2A означава доверие", анализирайки задълбочено как да се изградят наистина надеждни AI системи в базирани на агенти приложения. В допълнение, Hong-Thai Nguyen, мениджър софтуерно инженерство в Cegid, представи как мултиагентите могат да прекроят бизнес процесите и да постигнат по-интелигентно вземане на решения и операции на предприятия в комбинация с практически сценарии в речта "Cegid Pulse: Платформа за управление на многоагентен бизнес."
Когато големите модели са оборудвани с "тела": Въплътеният интелект пристига
Въплътеният интелект се превръща в една от най-предизвикателните и обещаващи направления за развитие в областта на AI. В този форум много от водещите технически експерти в индустрията участваха в задълбочени дискусии около темата за "въплътения интелект", споделяйки своите практически проучвания в архитектурен дизайн, приложение на модела и внедряване на сценарии.
Анджело Корсаро, главен изпълнителен директор и технически директор на ZettaScale, представи как протоколът Zenoh може да разбие бариерите между възприятието, изпълнението и познанието в ерата на интелигентния робот в "Ум, тяло и Zenoh." Филип Оперман, ръководител на проекта Dora, донесе "Използване на Zenoh в Dora за внедряване на разпределен поток от данни", обяснявайки важното приложение на протокола Zenoh в Dora за внедряване на разпределен поток от данни. Джеймс Янг, професор в University of Science and Technology of China, изнесе реч на тема "Генериране на враждебни сценарии, критични за безопасността, при автономно шофиране", представяйки как да се подобри безопасността на технологията за автономно шофиране чрез генериране на враждебни сценарии, за да се осигури стабилност и надеждност в сложни среди.
В допълнение, Minglan Lin, изследовател на въплътен интелект в Zhiyuan Research Institute, също се фокусира върху темата за "RoboBrain: Унифициран мозъчен модел за работа с роботи и RoboOS: Рамка за йерархично сътрудничество за RoboBrain и роботи интелигентни агенти", демонстрирайки как RoboBrain може да подобри нивото на интелигентност на роботите и важната роля на RoboOS в сътрудничеството на роботите. Виле Куосманен, основател на Voyage Robotics, изнесе прекрасна реч на тема "Изграждане на роботизирани приложения с модели VLA с отворен код", обяснявайки как да използвате модели VLA с отворен код, за да осигурите силна подкрепа за роботизирани приложения. И накрая, Huy Hoang Ha, изследовател на големи езикови модели в Menlo Research, обсъди как пространственото разсъждение може да помогне на роботите да разберат по-добре сложни 2D и 3D среди, като по този начин подобри тяхната работа и възможности за навигация в основната реч на "Пространствен разсъждаващ LLM: Подобряване на разбирането на 2D и 3D за подпомагане на работата и навигацията на роботите."
Spotlight Talks: Осветяване на авангардни технологии и иновативни приложения
Spotlight Talks Day 1 включваше ангажиращи презентации от експерти от индустрията относно авангардни технологии и иновативни приложения. Този сегмент послужи като платформа за технологични практици от различни области да обсъдят най-новите постижения и практически приложения на AI. Кирил Моано, инженер по научни изследвания във French Atomic Energy Commission (CEA), представи как проектът Eclipse Aidge поддържа разполагането и оптимизирането на дълбоки невронни мрежи на вградени платформи, като предоставя пълен набор от инструменти в речта на "Aidge", като по този начин ускорява разработването на периферни интелигентни системи.
Павел Кишчак, учен по данни в Bielik.ai, публично сподели най-новия напредък на полския роден AI проект Bielik за първи път на тази конференция и изнесе реч, озаглавена "Възходът на Bielik.AI", разказвайки как проектът насърчава изграждането на локална автономна AI система чрез езикови модели с отворен код и пълна екосистема от инструменти. Проектът Bielik не само пусна множество езикови модели с отворен код (мащаби на параметрите, обхващащи 1,5B, 4,5B и 11B), но също така създаде инструментариум от край до край, обхващащ набори от данни, оценка, обучение и фина настройка, поддържайки изследователски екипи и разработчици да фина настройка или непрекъснато предварително обучение въз основа на основни модели, което значително намалява прага на R&D за големи модели и стимулира местните технологични иновационни възможности.
Hung-Ying Tai, технически ръководител от Second State, сподели "Изпълнение на GenAI модели на периферни устройства с LlamaEdge", демонстрирайки леките и високопроизводителни възможности на LlamaEdge при разполагането на генеративни AI модели на периферни устройства, носейки по-гъвкаво и ефективно локално изживяване при разсъждения. Tianyu Chen, докторант в Peking University, представи как рамката SAFE облекчава проблема с недостига на данни за обучение чрез механизма за саморазвитие на "синтез на данни - фина настройка на модела", като по този начин значително подобрява ефективността и точността на официалната проверка на Rust код в "Постигане на автоматична официална проверка за Rust код, базирана на рамката за саморазвитие." Готие Вио, R&D директор в Illuin Technology, сподели как системата ColPali, изградена от екипа въз основа на архитектурата ColBERT и модела PaliGemma, ефективно подобрява точността и ефективността на извличането на документи чрез комбиниране на графична и текстова информация в речта "ColPali: Ефективно извличане на документи, базирано на Visual Language Model." И накрая, Xiao Zhang, главен изпълнителен директор на Dynamia.ai, представи как да управлявате и планирате по-добре хетерогенни GPU ресурси с помощта на HAMi и да подобрите степента на използване и наблюдаемостта на AI инфраструктурата в "Отключване на възможностите на K8s клъстера на хетерогенна AI инфраструктура: Освобождаване на силата на HAMi."
Разнообразни взаимодействия и акценти на първия ден
В допълнение към ключовите речи с висока плътност, конференцията включваше и няколко специални звена. Звеното Closed-door Meeting се фокусира върху стратегически диалози и задълбочени индустриални обмени за насърчаване на трансграничното сътрудничество. Showcase Sessions се фокусира върху представянето на най-новите AI технологични продукти на предприятия и изследователски институции, привличайки голям брой посетители да спрат и да общуват. В Competition Sessions разработчици на AI и роботика, инженери и ентусиасти по роботика от цял свят се фокусираха върху комплекта роботизирана ръка с отворен код SO-ARM100, за да извършат практическо проучване на имитационното обучение. Комплектът интегрира рамката LeRobot на Hugging Face и комбинира AI и роботизирани технологии на NVIDIA, за да поддържа авангардни AI архитектури, включително ACT и Diffusion Policy, предоставяйки на участниците солидна техническа основа. Участниците проведоха практически проучвания в реални сценарии, за да оценят цялостно неговите ефекти и осъществимост.
Workshop Sessions взе OpenHarmony екосистемата като основна тема и проучи проекта с отворен код, инкубиран и управляван от Open Atom Open Source Foundation. OpenHarmony се ангажира да изгради интелигентна терминална операционна система за ерата на всички сценарии, всички връзки и всички интелигентности, създавайки отворена, глобализирана и иновативна водеща разпределена операционна системна платформа, обслужваща разнообразни интелигентни устройства и подпомагаща развитието на индустрията на Интернет на всичко. На мястото на конференцията участниците задълбочено разбраха основните предимства на OpenHarmony в сътрудничеството между множество устройства и олекотения дизайн на системата чрез поредица от практически семинари, лично участвайки в ключови процеси от разработването на драйвери до разполагането на приложения. Практическото обучение не само помага на разработчиците да отворят техническия път "отдолу до края", но също така цялостно подобрява възможностите за разработка и отстраняване на грешки на системно ниво.
Дневният ред на GOSIM AI Париж 2025 Ден 1 завърши успешно, но вълнението продължава. Утре конференцията ще продължи да напредва около четирите основни форума на AI модели, AI инфраструктура, AI приложения и въплътен интелект и ще приветства очаквания PyTorch Day, с повече гости с тежка категория и практическо съдържание от първа линия, така че останете на линия!