GOSIM AI Paris 2025: A Revolução Open Source

A paisagem da IA passou por uma transformação dramática no último ano, impulsionada pelo espírito colaborativo do desenvolvimento de código aberto. Não sendo mais domínio exclusivo de gigantes da tecnologia, os grandes modelos de linguagem (LLMs) estão agora evoluindo através de esforços da comunidade e compartilhamento aberto, impactando tudo, desde a infraestrutura até a otimização e implantação de algoritmos. Este movimento de código aberto está acelerando o progresso da IA, tornando-o mais acessível e democratizando a oportunidade de contribuir para a próxima geração de sistemas inteligentes.

Nesse contexto, a conferência GOSIM AI Paris 2025, co-organizada pela GOSIM, CSDN e 1ms.ai, começou em 6 de maio em Paris, França. O evento serve como uma plataforma crucial, conectando profissionais e pesquisadores de tecnologia global para explorar os mais recentes avanços e as direções futuras na IA de código aberto.

A conferência ostenta uma impressionante lista de mais de 80 especialistas em tecnologia e acadêmicos de organizações líderes como Alibaba, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, Peking University, Fraunhofer, Oxford University e a comunidade francesa openLLM. Parceiros-chave, incluindo Huawei, a Associação de Inovação e Empreendedorismo da Juventude de Toda a China na França, a Associação Sino-Francesa de Inteligência Artificial, a Apache Software Foundation, a Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, a Linux Foundation Research, a OpenWallet Foundation, a Open Source Initiative (OSI), Software Heritage e K8SUG, também estão participando ativamente. A conferência apresenta mais de 60 sessões técnicas centradas em temas centrais como modelos de IA, infraestrutura, implantação de aplicativos e inteligência incorporada, fornecendo uma visão abrangente da evolução do ecossistema de código aberto e das tendências emergentes.

A Relação Simbiótica Entre IA e Código Aberto

Michael Yuan, cofundador da GOSIM, deu início à conferência com um discurso de abertura intitulado “O Código Aberto Alcançou, Qual é o Próximo?” Ele compartilhou suas percepções sobre o estado atual e a trajetória futura da IA de código aberto, enfatizando que ela atingiu um momento crucial.

"Uma vez, previmos que levaria de 5 a 10 anos para o código aberto alcançar os modelos de código fechado, mas parece que esse objetivo foi alcançado antes do previsto", afirmou Yuan. Ele citou o recente lançamento do Qwen 3 como um exemplo, observando que os modelos de código aberto não estão mais apenas competindo entre si, mas agora estão desafiando diretamente os modelos proprietários, até mesmo superando-os em certos benchmarks. Yuan também sugeriu que este progresso não é apenas devido aos avanços de código aberto, mas também o resultado do desenvolvimento de código fechado não atender às expectativas e encontrar gargalos de desempenho. Em contraste, os modelos de código aberto estão evoluindo rapidamente, exibindo uma curva acentuada de crescimento de desempenho e demonstrando um verdadeiro fenômeno de "alcançar".

Esta observação levanta uma questão fundamental: Quão longe estamos de alcançar a Inteligência Artificial Geral (AGI)? Yuan acredita que o futuro da AGI pode não estar em um único modelo abrangente, mas sim em uma rede de modelos especializados, bases de conhecimento e ferramentas implantadas em hardware privado ou dispositivos robóticos.

Ele elaborou ainda que a arquitetura da IA está mudando de um paradigma centralizado para um descentralizado. Ele destacou a transição da OpenAI da Completion API para a nova Responses API, que visa construir uma plataforma de agente inteligente em grande escala. Quase 600.000 usuários e desenvolvedores já se juntaram a esta transformação, contribuindo para o desenvolvimento de aplicativos de IA distribuídos.

"O futuro da AGI não deve ser desenvolvido exclusivamente por uma única empresa bem financiada", afirmou Yuan. "Em vez disso, deve ser construído através da colaboração global, criando uma rede de ecossistema que engloba modelos, bases de conhecimento, robôs e sistemas de execução."

Após o discurso de Yuan, Daniel Goldscheider, Diretor Executivo da OpenWallet Foundation, fez uma apresentação sobre "GDC Wallets & Credentials", focando no projeto Global Digital Compact (GDC), adotado pela Assembleia Geral das Nações Unidas. Ele explicou que o GDC tem dois objetivos principais:

  • Reconhecer que as tecnologias digitais transformaram profundamente nossas vidas e o desenvolvimento social, trazendo oportunidades sem precedentes e riscos imprevistos.
  • Enfatizar que a realização de todo o potencial das tecnologias digitais para o benefício de toda a humanidade requer cooperação global, quebrando barreiras entre países, indústrias e até mesmo setores público e privado.

Com base nesse entendimento compartilhado, o GDC gerou a iniciativa "Global Digital Collaboration", visando fomentar uma colaboração genuína entre governos, empresas, organizações sem fins lucrativos e outras partes interessadas.

Ao discutir os aspectos operacionais, Goldscheider enfatizou que esta colaboração não é ditada por nenhuma organização individual, mas sim adota uma abordagem de "convocação conjunta", convidando todas as organizações internacionais interessadas, órgãos de definição de padrões, comunidades de código aberto e organizações intergovernamentais a participar. Ele esclareceu que este não é um projeto de "quem lidera quem", mas uma plataforma de colaboração igualitária onde cada parte tem uma voz e ninguém é mais importante que outro.

Ele explicou ainda que a Global Digital Collaboration não tem como objetivo desenvolver diretamente padrões ou tecnologias, mas sim facilitar um diálogo entre organizações de diversas origens, permitindo-lhes apresentar suas perspectivas e necessidades para chegar a um consenso. Posteriormente, os padrões específicos e o trabalho técnico serão avançados pelos órgãos especializados relevantes. Ele citou "identidade digital" e "tecnologia biométrica" como exemplos, observando que muitas organizações já estão trabalhando nessas áreas, destacando a necessidade de uma plataforma neutra para reunir todos, evitar duplicação, conflitos e desperdício de recursos.

Quatro Fóruns Dedicados: Uma Análise Abrangente da IA de Código Aberto

A conferência apresentou quatro fóruns especializados: Modelos de IA, Infraestrutura de IA, Aplicações de IA e Inteligência Incorporada. Esses fóruns cobriram tópicos críticos que variam desde a arquitetura subjacente até a implantação de aplicativos, e desde as capacidades do modelo até as práticas de agentes inteligentes. Cada fórum hospedou especialistas líderes de empresas globais e instituições de pesquisa, fornecendo análises aprofundadas das últimas tendências tecnológicas e apresentando ricos casos de prática de engenharia, demonstrando a integração abrangente e a evolução da IA de código aberto em vários campos.

Desconstruindo a Lógica Subjacente dos Grandes Modelos de IA

O fórum de Modelos de IA reuniu especialistas de comunidades de código aberto e instituições de pesquisa para compartilhar insights sobre inovações arquitetônicas, colaboração de código aberto e evolução do ecossistema no reino dos grandes modelos.

Guilherme Penedo, Engenheiro de Pesquisa de Aprendizado de Máquina da Hugging Face, apresentou "Open-R1: Uma Reprodução Totalmente de Código Aberto do DeepSeek-R1", mostrando os esforços do projeto Open-R1 na replicação do modelo DeepSeek-R1, com foco na promoção da abertura e padronização de dados relacionados a tarefas de inferência. Guang Liu, Líder de Tecnologia da Equipe de Pesquisa de Dados do Zhiyuan Research Institute, compartilhou "OpenSeek: Inovação Colaborativa Rumo à Próxima Geração de Grandes Modelos", enfatizando a importância da colaboração global para impulsionar avanços no desempenho do modelo nos níveis de algoritmo, dados e sistema, com o objetivo de desenvolver a próxima geração de grandes modelos que superem o DeepSeek.

Jason Li, Vice-Presidente Sênior da CSDN, apresentou "Decodificando o DeepSeek: Inovação Tecnológica e seu Impacto no Ecossistema de IA", fornecendo uma análise aprofundada das inovações do DeepSeek em paradigmas técnicos, arquitetura de modelo e ecologia industrial, bem como seu impacto potencial no ecossistema global de IA. Yiran Zhong, Diretor Sênior de Pesquisa da MiniMax, apresentou "Futuro Linear: A Evolução das Arquiteturas de Grandes Modelos de Linguagem", apresentando o mecanismo Lightning Attention proposto pela equipe, que oferece uma alternativa potencial às arquiteturas Transformer em termos de eficiência e desempenho. Shiwei Liu, Royal Society Newton International Fellow na Oxford University, discutiu "A Maldição da Profundidade em Grandes Modelos de Linguagem", explorando as contribuições decrescentes de redes neurais profundas à medida que os modelos se aprofundam, e propondo o uso do LayerNorm Scaling para melhorar o mecanismo Pre-LN para aprimorar a utilização da camada profunda e a eficiência geral. Diego Rojas, Engenheiro de Pesquisa da Zhipu AI, apontou em "Modelos de Linguagem Grande de Código: Explorando Além dos Tokens" que os modelos grandes atuais, embora poderosos, ainda dependem da tokenização, que é ineficiente, e compartilhou novos métodos para ignorar a tokenização para tornar os modelos mais rápidos e fortes. Nicolas Flores-Herr, Chefe da Equipe de Modelos Básicos da Fraunhofer IAIS, concluiu o fórum com "Como Construir Grandes Modelos de Linguagem ‘Fabricados na Europa’ Globalmente Competitivos?" enfatizando que a Europa está superando desafios de dados, diversidade e regulamentação através de projetos multilíngues, de código aberto e confiáveis de modelos grandes localizados, para construir a próxima geração de IA que reflita os valores europeus.

A Tríade da Infraestrutura de IA: Dados, Poder de Computação e Evolução Algorítmica

Com foco na construção de uma base mais aberta, eficiente e inclusiva para grandes modelos, o fórum de Infraestrutura de IA reuniu especialistas líderes de instituições de pesquisa e empresas para se envolver em discussões aprofundadas sobre questões-chave como dados, poder de computação e arquitetura de sistema.

Yonghua Lin, Vice-Presidente do Zhiyuan Research Institute (BAAI), lançou o Chinese Internet Corpus CCI 4.0 em "IA de Código Aberto para o Bem: Aplicações Inclusivas, Dados Justos e Poder de Computação Universal", cobrindo três conjuntos de dados principais: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1 e CCI4.0-M2-Extra V1. O CCI4.0-M2-Base V1 tem um volume de dados de 35000 GB, é bilíngue em chinês e inglês, com 5000 GB de dados chineses, um aumento de 5 vezes na escala de dados em comparação com o CCI3.0. O CCI4.0-M2-CoT V1 contém 450 milhões de dados de trajetória de pensamento humano sintetizados inversamente para melhorar a capacidade de raciocínio, com um número total de tokens de 425B (425 bilhões), quase 20 vezes o tamanho do Cosmopedia (código aberto pela Hugging Face), o maior conjunto de dados sintéticos de código aberto atualmente disponível globalmente.

Xiyuan Wang, Engenheiro de Software Sênior da Huawei, então apresentou como a arquitetura CANN conecta estruturas de IA e hardware Ascend em "Melhores Práticas para Treinamento e Inferência Baseadas no Ascend CANN", e alcança inferência de treinamento ideal através do suporte a ecossistemas como PyTorch e vLLM. Guillaume Blaquiere, Arquiteto de Dados da Carrefour, demonstrou como implantar instâncias de modelo grande sem servidor que suportam GPUs através do Google Cloud Run para reduzir custos e melhorar a eficiência da utilização de recursos em "Tornando Seu LLM Sem Servidor". Yinping Ma, Engenheiro da Peking University, fez um discurso de abertura sobre "Software Básico de Gerenciamento e Agendamento Integrado de Computação Inteligente de Código Aberto - SCOW e CraneSched", apresentando os dois principais softwares básicos de código aberto desenvolvidos pela Peking University, SCOW e CraneSched, que foram implantados em dezenas de universidades e empresas em todo o país, suportando o gerenciamento unificado e o agendamento de alto desempenho de recursos de computação inteligente. Yaowei Zheng, candidato a doutorado na Beihang University, compartilhou o conceito de design da arquitetura de controlador híbrido no sistema Verl no discurso "verl: Um Sistema RLHF Baseado em Controlador Híbrido", e discutiu suas vantagens de eficiência no treinamento de aprendizado por reforço em larga escala. Greg Schoeninger, CEO da Oxen.ai, apresentou os "Conjuntos de Dados de Treinamento e Infraestrutura para Aprendizado por Reforço no Estilo DeepSeek-R1 (GRPO)" e detalhou o caminho prático para processos de treinamento de aprendizado por reforço para LLMs de raciocínio, incluindo construção de conjuntos de dados, construção de infraestrutura e modelos de geração de código de treinamento local.

De "Pode Ser Usado" a "É Bem Usado": Aplicações de IA Entram no Estágio Prático

No fórum de Aplicações de IA, profissionais de P&D e tomadores de decisão de tecnologia de empresas líderes compartilharam uma gama diversificada de insights, mostrando os caminhos de implantação no mundo real e as possibilidades futuras de aplicações de IA impulsionadas por grandes modelos.

Yongbin Li, Pesquisador Chefe do Alibaba Tongyi Lab, compartilhou o progresso mais recente do Tongyi Lingma na evolução técnica e aplicação do produto em "Tongyi Lingma: Do Copiloto de Codificação ao Agente de Codificação". Dongjie Chen, Engenheiro de Software da Huawei, fez um discurso de abertura sobre "Cangjie Magic: Uma Nova Escolha para Desenvolvedores na Era de Grandes Modelos", apresentando a estrutura de desenvolvimento de Agente de modelo grande de IA baseada na linguagem de programação Cangjie, que pode melhorar significativamente a eficiência dos desenvolvedores na construção de aplicativos HarmonyOS inteligentes e trazer uma excelente experiência de desenvolvimento. Xinrui Liu, Diretor do Ecossistema de Desenvolvedores LangGenius, focou em "Trabalhando Juntos, Poder Técnico Habilitado por Dify", enfatizando o ecossistema de código aberto do Dify e seu papel na aceleração da popularização de aplicações de IA.

Em relação à combinação de IA e engenharia de sistemas, Rik Arends, cofundador da Makepad, fez uma apresentação única: "Usando Codificação Ambiente, Use IA para Criar UI Rust para Dispositivos Móveis, Páginas da Web e Realidade Mista", explorando como usar a codificação ambiente para construir um novo paradigma para UI. Christian Tzolov, Engenheiro de Software de P&D da equipe Broadcom Spring, focou em demonstrar como integrar eficientemente modelos de IA com sistemas e recursos existentes através do MCP Java SDK e Spring AI MCP em "Um Paradigma Unificado para Integração de IA Através do MCP". Wenjing Chu, Diretor Sênior de Estratégia de Tecnologia da Futurewei, elevou ainda mais a perspectiva em "O ‘T’ em MCP e A2A Significa Confiança", analisando profundamente como construir sistemas de IA verdadeiramente confiáveis em aplicações baseadas em agentes. Além disso, Hong-Thai Nguyen, Gerente de Engenharia de Software da Cegid, apresentou como multiagente pode remodelar processos de negócios e alcançar uma tomada de decisão e operação empresarial mais inteligentes em combinação com cenários práticos no discurso "Cegid Pulse: Plataforma de Gestão de Negócios Multiagente".

Quando Grandes Modelos São Equipados com "Corpos": A Inteligência Incorporada Chega

A inteligência incorporada está se tornando uma das direções de desenvolvimento mais desafiadoras e promissoras no campo da IA. Neste fórum, muitos dos principais especialistas técnicos da indústria se envolveram em discussões aprofundadas em torno do tema da "inteligência incorporada", compartilhando suas explorações práticas em design arquitetônico, aplicação de modelo e implantação de cenário.

Angelo Corsaro, CEO e CTO da ZettaScale, apresentou como o protocolo Zenoh pode derrubar as barreiras entre percepção, execução e cognição na era do robô inteligente em "Mente, Corpo e Zenoh". Philipp Oppermann, Gerente de Projeto do projeto Dora, trouxe "Usando Zenoh em Dora para Implementar Fluxo de Dados Distribuído", explicando a importante aplicação do protocolo Zenoh em Dora para implementar fluxo de dados distribuído. James Yang, Professor da University of Science and Technology of China, fez um discurso sobre "Geração de Cenários Adversários de Segurança Crítica em Direção Autônoma", apresentando como melhorar a segurança da tecnologia de direção autônoma através da geração de cenários adversários para garantir estabilidade e confiabilidade em ambientes complexos.

Além disso, Minglan Lin, um pesquisador de inteligência incorporada no Zhiyuan Research Institute, também focou no tópico de "RoboBrain: Um Modelo de Cérebro Unificado para Operação de Robôs & RoboOS: Uma Estrutura de Colaboração Hierárquica para RoboBrain e Agentes Inteligentes de Robôs", demonstrando como o RoboBrain pode melhorar o nível de inteligência dos robôs e o importante papel do RoboOS na colaboração de robôs. Ville Kuosmanen, fundador da Voyage Robotics, fez um maravilhoso discurso sobre "Construindo Aplicações de Robôs com Modelos VLA de Código Aberto", explicando como usar modelos VLA de código aberto para fornecer forte suporte para aplicações de robôs. Finalmente, Huy Hoang Ha, um pesquisador de modelo grande de linguagem na Menlo Research, discutiu como o raciocínio espacial pode ajudar os robôs a entender melhor ambientes complexos 2D e 3D, melhorando assim suas capacidades de operação e navegação no discurso de abertura de "LLM de Raciocínio Espacial: Aprimorando a Compreensão de 2D e 3D para Suportar Operação e Navegação de Robôs".

Palestras em Destaque: Iluminando Tecnologias de Ponta e Aplicações Inovadoras

O Spotlight Talks Day 1 apresentou apresentações envolventes de especialistas da indústria sobre tecnologias de ponta e aplicações inovadoras. Este segmento serviu como uma plataforma para profissionais de tecnologia de vários domínios discutirem os últimos avanços e aplicações práticas da IA. Cyril Moineau, Engenheiro de Pesquisa da Comissão Francesa de Energia Atômica (CEA), apresentou como o projeto Eclipse Aidge suporta a implantação e otimização de redes neurais profundas em plataformas embarcadas, fornecendo uma cadeia de ferramentas completa no discurso de "Aidge", acelerando assim o desenvolvimento de sistemas inteligentes de borda.

Paweł Kiszczak, Cientista de Dados da Bielik.ai, compartilhou publicamente o progresso mais recente do projeto de IA nativo polonês Bielik pela primeira vez nesta conferência, e fez um discurso intitulado "A Ascensão da Bielik.AI", contando como o projeto promove a construção de um sistema de IA autônomo local através de modelos de linguagem de código aberto e um ecossistema de ferramentas completo. O projeto Bielik não só lançou vários modelos de linguagem de código aberto (escalas de parâmetros cobrindo 1,5B, 4,5B e 11B), mas também criou uma cadeia de ferramentas de ponta a ponta cobrindo conjuntos de dados, avaliação, treinamento e ajuste fino, suportando equipes de pesquisa e desenvolvedores para ajustar finamente ou pré-treinar continuamente com base em modelos básicos, o que reduz bastante o limite de P&D para modelos grandes e estimula as capacidades locais de inovação tecnológica.

Hung-Ying Tai, Líder Técnico da Second State, compartilhou "Executando Modelos GenAI em Dispositivos de Borda com LlamaEdge", demonstrando as capacidades leves e de alto desempenho do LlamaEdge na implantação de modelos de IA generativa em dispositivos de borda, trazendo uma experiência de raciocínio local mais flexível e eficiente. Tianyu Chen, um candidato a doutorado na Peking University, apresentou como a estrutura SAFE alivia o problema de dados de treinamento escassos através do mecanismo de autoevolução de "síntese de dados - ajuste fino de modelo", melhorando assim significativamente a eficiência e precisão da verificação formal de código Rust em "Alcançando Verificação Formal Automática para Código Rust Baseado na Estrutura de Autoevolução". Gautier Viaud, Diretor de P&D da Illuin Technology, compartilhou como o sistema ColPali, construído pela equipe com base na arquitetura ColBERT e no modelo PaliGemma, melhora efetivamente a precisão e a eficiência da recuperação de documentos, combinando informações gráficas e de texto no discurso "ColPali: Recuperação Eficiente de Documentos Baseada em Modelo de Linguagem Visual". Finalmente, Xiao Zhang, CEO da Dynamia.ai, apresentou como gerenciar e agendar melhor recursos de GPU heterogêneos com a ajuda do HAMi e melhorar a taxa de utilização e a observabilidade da infraestrutura de IA em "Desbloqueando as Capacidades do Cluster K8s de Infraestrutura de IA Heterogênea: Liberando o Poder do HAMi".

Diversas Interações e Destaques do Primeiro Dia

Além dos discursos de abertura de alta densidade, a conferência também apresentou várias unidades especiais. A unidade de Reunião Fechada focou em diálogos estratégicos e intercâmbios aprofundados da indústria para promover a cooperação transfronteiriça. As Sessões de Apresentação focaram na apresentação dos mais recentes produtos de tecnologia de IA de empresas e instituições de pesquisa, atraindo um grande número de visitantes para parar e se comunicar. Nas Sessões de Competição, desenvolvedores de IA e robótica, engenheiros e entusiastas de robótica de todo o mundo focaram no kit de braço robótico de código aberto SO-ARM100 para realizar exploração prática do aprendizado por imitação. O kit integra a estrutura LeRobot da Hugging Face e combina as tecnologias de IA e robótica da NVIDIA para suportar arquiteturas de IA de ponta, incluindo ACT e Diffusion Policy, fornecendo aos participantes uma base técnica sólida. Os participantes conduziram explorações práticas em cenários reais para avaliar abrangentemente seus efeitos e viabilidade.

As Sessões de Workshop tomaram o ecossistema OpenHarmony como o tópico central e exploraram o projeto de código aberto incubado e operado pela Open Atom Open Source Foundation. A OpenHarmony está comprometida em construir uma estrutura de sistema operacional de terminal inteligente para a era de todos os cenários, toda a conexão e toda a inteligência, criando uma plataforma de sistema operacional distribuído líder aberta, globalizada e inovadora, atendendo a diversos dispositivos inteligentes e ajudando o desenvolvimento da indústria da Internet de Tudo. No local da conferência, os participantes entenderam profundamente as principais vantagens da OpenHarmony na colaboração multi-dispositivo e design de sistema leve através de uma série de workshops práticos, participando pessoalmente de processos-chave desde o desenvolvimento de drivers até a implantação de aplicativos. A prática prática não só ajuda os desenvolvedores a abrir o caminho técnico "de baixo para cima", mas também melhora de forma abrangente as capacidades de desenvolvimento e depuração em nível de sistema.

A agenda do GOSIM AI Paris 2025 Day 1 chegou a uma conclusão bem-sucedida, mas a emoção continua. Amanhã, a conferência continuará a avançar em torno dos quatro principais fóruns de modelos de IA, infraestrutura de IA, aplicações de IA e inteligência incorporada, e receberá o tão aguardado PyTorch Day, com mais convidados de peso e conteúdo prático de primeira linha em breve, então fique ligado!