A Meta, o gigante tecnológico, encontra-se envolvido em uma nova onda de críticas, enfrentando acusações de “open washing”. Esta controvérsia decorre do seu patrocínio de um documento de pesquisa da Linux Foundation que explora o crescente panorama das soluções de IA de código aberto (open-source). O cerne da questão reside na percepção de que a Meta está alavancando este patrocínio para promover seus próprios modelos Llama AI, ao mesmo tempo que contorna a verdadeira definição de “código aberto”.
O Estudo da Linux Foundation: Uma Faca de Dois Gumes
O estudo da Linux Foundation, divulgado no início deste mês, defende as vantagens dos sistemas de IA de código aberto, enfatizando a sua relação custo-eficácia para empresas de todos os tamanhos, especialmente pequenas empresas. O estudo sugere que as organizações que optam por modelos de IA de código fechado podem incorrer em despesas de software três vezes e meia superiores em comparação com aquelas que utilizam alternativas de código aberto.
Esta pesquisa alinha-se com um corpo crescente de evidências que apoiam os benefícios da IA de código aberto. Por exemplo, uma pesquisa realizada pela IBM e Morning Consult em janeiro revelou que mais de metade das empresas que empregam ferramentas de IA de código aberto são mais propensas a experimentar um retorno positivo sobre o investimento (ROI). Além disso, dois quintos dos entrevistados que ainda não adotaram soluções de IA de código aberto expressaram a sua intenção de integrar estas ferramentas nos seus projetos de IA no próximo ano.
No entanto, o envolvimento da Meta no estudo da Linux Foundation gerou controvérsia, com críticos argumentando que serve como uma campanha de marketing disfarçada para os modelos Llama AI da empresa.
O Dilema do “Código Aberto”: Llama Sob Escrutínio
Amanda Brock, CEO da OpenUK, afirma que os modelos Llama da Meta não cumprem os critérios necessários para serem classificados como genuinamente “código aberto”. Ela aponta que nem a Meta nem o estudo reconhecem esta discrepância.
“Llama não é ‘código aberto’, independentemente da definição que você escolher”, afirmou Brock. “Eu pessoalmente prefiro a Open Source Software Definition (OSD) da Open Source Initiative (OSI). Llama não cumpre seu padrão de código aberto devido a vários motivos, incluindo a incorporação de uma restrição comercial em seu licenciamento”.
Brock elaborou ainda sobre as implicações desta restrição: “Esta limitação perturba o fluxo livre que é central para o licenciamento de código aberto e cria atrito. Confiamos que o código aberto seja utilizável por qualquer pessoa para qualquer propósito, e o Llama não cumpre este requisito”.
As Alegações de Código Aberto da Meta: Uma Questão Contenciosa
A gama de modelos Llama da Meta é rotulada como “código aberto”, mas a empresa tem enfrentado desafios persistentes das partes interessadas da indústria em relação a esta afirmação. O principal ponto de discórdia gira em torno de diferentes interpretações do que realmente constitui “código aberto”.
O cerne do desacordo reside nos termos de licenciamento impostos aos usuários uma vez que atingem um certo nível de comercialização. Embora os modelos Llama ofereçam acesso aberto, limitações são impostas aos usuários em circunstâncias específicas.
No início deste ano, a Open Source Initiative (OSI) criticou publicamente a Meta sobre esta questão, afirmando que a empresa “continua a promover falsamente o Llama como código aberto”.
Reconhecendo os esforços da Meta com a gama Llama como um “passo na direção certa” na promoção da conscientização sobre código aberto, Brock enfatiza que é necessário progresso significativo para abordar efetivamente o “open washing” dentro da indústria de tecnologia.
“Com o site da Meta destacando uma conclusão chave do seu relatório como ‘A pesquisa da Linux Foundation mostra como os modelos de IA de código aberto, como o Llama, estão impulsionando o crescimento econômico, a inovação e a competição, tornando as soluções tecnológicas cruciais mais acessíveis’, não é surpreendente que a OSI esteja indignada e acusando a Linux Foundation de apoiar o open washing”, observou Brock.
Ela enfatizou ainda as implicações mais amplas do open washing, afirmando: “O open washing não é apenas uma questão de código aberto hoje. Com reguladores como a UE usando o termo código aberto como a base de exceções à responsabilidade em IA e os padrões que devem ser atendidos em IA, o impacto do open washing tornou-se um societal”.
Além da Meta: Uma Tendência Mais Ampla da Indústria
A Meta não é o único desenvolvedor da indústria a ter sido apanhado na mira do debate sobre a definição de código aberto.
Em março de 2024, a Databricks lançou seu próprio modelo de linguagem grande, DBRX, que especialistas também alegaram não aderir aos padrões de código aberto. Isto foi atribuído à inclusão de uma política de uso aceitável externa e sua operação sob uma licença fora da jurisdição do quadro da OSI. A controvérsia do DBRX sublinha ainda mais a ambiguidade e a complexidade em torno do termo “código aberto” e os desafios enfrentados pelos desenvolvedores na navegação pelas suas várias interpretações. O debate destaca a necessidade de maior clareza e padronização na definição de princípios de código aberto, particularmente no campo da inteligência artificial em rápida evolução. Sem uma definição universalmente aceita, o risco de “open washing” continuará a persistir, potencialmente minando a credibilidade e a integridade do movimento de código aberto.
Definindo Código Aberto: Os Princípios Essenciais
Para entender a controvérsia em torno do Llama da Meta e do DBRX da Databricks, é crucial aprofundar os princípios fundamentais que definem o software de código aberto. A Open Source Initiative (OSI) fornece uma definição amplamente reconhecida, descrevendo dez critérios chave que uma licença de software deve atender para ser considerada de código aberto:
- Redistribuição Livre: A licença não deve restringir nenhuma parte de vender ou dar o software como um componente de uma distribuição agregada de software contendo programas de várias fontes diferentes. A licença não deve exigir um royalty ou outra taxa para tal venda.
- Código Fonte: O programa deve incluir código fonte e deve permitir a distribuição em código fonte, bem como em forma compilada. Onde alguma forma de produto não é distribuída com código fonte, deve haver um meio bem divulgado de obter o código fonte por não mais que um custo de reprodução razoável - de preferência, download via Internet sem custo. O código fonte deve ser a forma preferida na qual um programador modificaria o programa. Código fonte deliberadamente ofuscado não é permitido. Formas intermediárias, como a saída de um pré-processador ou tradutor, não são permitidas.
- Trabalhos Derivados: A licença deve permitir modificações e trabalhos derivados e deve permitir que sejam distribuídos sob os mesmos termos da licença do software original.
- Integridade do Código Fonte do Autor: A licença pode restringir que o código fonte seja distribuído em forma modificada apenas se a licença permitir a distribuição de "arquivos de patch" com o código fonte com o propósito de modificar o programa em tempo de construção. A licença deve permitir explicitamente a distribuição de software construído a partir de código fonte modificado. A licença pode exigir que trabalhos derivados carreguem um nome ou número de versão diferente do software original.
- Não Discriminação Contra Pessoas ou Grupos: A licença não deve discriminar contra nenhuma pessoa ou grupo de pessoas.
- Não Discriminação Contra Campos de Esforço: A licença não deve restringir ninguém de fazer uso do programa em um campo específico de esforço. Por exemplo, não pode restringir o programa de ser usado em um negócio ou de ser usado para pesquisa genética.
- Distribuição da Licença: Os direitos anexados ao programa devem aplicar-se a todos aqueles a quem o programa é redistribuído sem a necessidade de execução de uma licença adicional por essas partes.
- Licença Não Deve Ser Específica para um Produto: Os direitos anexados ao programa não devem depender do fato de o programa fazer parte de uma distribuição de software particular. Se o programa for extraído dessa distribuição e usado ou distribuído dentro dos termos da licença do programa, todas as partes a quem o programa é redisribuído devem ter os mesmos direitos que aqueles que são concedidos em conjunto com a distribuição de software original.
- Licença Não Deve Restringir Outro Software: A licença não deve colocar restrições em outro software que é distribuído junto com o software licenciado. Por exemplo, a licença não deve insistir que todos os outros programas distribuídos na mesma mídia devem ser software de código aberto.
- Licença Deve Ser Neutra em Relação à Tecnologia: Nenhuma disposição da licença pode ser baseada em qualquer tecnologia individual ou estilo de interface.
Estes princípios enfatizam a importância da liberdade, transparência e colaboração no ecossistema de código aberto. Quando uma licença de software se desvia destes princípios, levanta questões sobre se o software pode realmente ser considerado código aberto. No caso do Llama da Meta e do DBRX da Databricks, as preocupações giram em torno de restrições comerciais, políticas de uso aceitável e quadros de licença que podem não estar totalmente alinhados com a definição da OSI.
As Implicações do “Open Washing”
A prática de “open washing”, onde as empresas deturpam o seu software como código aberto quando não cumpre totalmente os critérios, pode ter várias consequências negativas:
- Erosão da Confiança: Pode corroer a confiança no movimento de código aberto como um todo, dificultando aos usuários distinguir entre projetos de código aberto genuínos e aqueles que estão apenas fingindo.
- Desencorajamento da Contribuição: Pode desencorajar contribuições de desenvolvedores que estão comprometidos com os princípios do código aberto, pois podem sentir que os seus esforços estão sendo minados por empresas que não estão jogando pelas mesmas regras.
- Incerteza Legal: Pode criar incerteza legal para os usuários que dependem do software, pois podem não ter certeza dos seus direitos e obrigações sob a licença.
- Impedimento da Inovação: Pode impedir a inovação, restringindo a liberdade de modificar e redistribuir o software, que é um motor chave da inovação na comunidade de código aberto.
Portanto, é essencial que as empresas sejam transparentes sobre os termos de licenciamento do seu software e evitem fazer alegações enganosas sobre o seu status de código aberto.
A Necessidade de Maior Clareza e Padronização
O debate em curso sobre o Llama da Meta e o DBRX da Databricks destaca a necessidade de maior clareza e padronização na definição de princípios de código aberto. A falta de uma definição universalmente aceita cria confusão e permite que as empresas explorem brechas e se envolvam em “open washing”.
Várias iniciativas estão em andamento para abordar esta questão:
- A Open Source Initiative (OSI): A OSI continua a desempenhar um papel crucial na definição e promoção de princípios de código aberto. Fornece uma definição amplamente reconhecida de código aberto e certifica licenças que atendem aos seus critérios.
- The Linux Foundation: A Linux Foundation está trabalhando para promover a colaboração e a inovação na comunidade de código aberto. Fornece uma plataforma para projetos de código aberto e hospeda eventos que reúnem desenvolvedores, usuários e empresas.
- A União Europeia (UE): A UE está reconhecendo cada vez mais a importância do código aberto e está incorporando-o nas suas políticas e regulamentos. Está usando o termo "código aberto" como a base para exceções à responsabilidade em IA e os padrões que devem ser atendidos em IA.
Estas iniciativas estão ajudando a criar um ecossistema de código aberto mais transparente e padronizado. No entanto, é necessário mais trabalho para garantir que os princípios de código aberto sejam claramente definidos e aplicados consistentemente.
Avançando: Transparência e Responsabilidade
Para combater eficazmente o “open washing” e promover o código aberto genuíno, é necessária uma abordagem multifacetada:
- Transparência: As empresas devem ser transparentes sobre os termos de licenciamento do seu software e evitar fazer alegações enganosas sobre o seu status de código aberto.
- Responsabilidade: As organizações da indústria e os órgãos reguladores devem responsabilizar as empresas pelas suas alegações de código aberto e tomar medidas contra aquelas que se envolvem em “open washing”.
- Educação: Os usuários e desenvolvedores precisam ser educados sobre os princípios de código aberto e como identificar projetos de código aberto genuínos.
- Colaboração: A comunidade de código aberto deve continuar a colaborar para definir e promover os princípios de código aberto e para desenvolver ferramentas e recursos que ajudam os usuários e desenvolvedores a navegar no ecossistema de código aberto.
Trabalhando juntos, podemos criar um ecossistema de código aberto mais transparente, responsável e inovador que beneficia a todos. O futuro da IA e de outras tecnologias depende disso.