Meta обвиняют в "отмывании" Open Source в AI

Meta, технологический гигант, вновь сталкивается с волной критики, на этот раз по обвинениям в “отмывании” Open Source. Этот спор возник из-за спонсорства компанией Meta исследовательского документа Linux Foundation, в котором рассматривается развивающаяся область решений AI с открытым исходным кодом. Суть проблемы заключается в восприятии того, что Meta использует это спонсорство для продвижения своих собственных моделей Llama AI, обходя при этом истинное определение “open source”.

Исследование Linux Foundation: Палка о двух концах

Исследование Linux Foundation, опубликованное в начале этого месяца, подчеркивает преимущества систем AI с открытым исходным кодом, подчеркивая их экономическую эффективность для предприятий любого размера, особенно для малых предприятий. Исследование показывает, что организации, выбирающие модели AI с закрытым исходным кодом, могут понести расходы на программное обеспечение в три с половиной раза выше по сравнению с теми, кто использует альтернативы с открытым исходным кодом.

Это исследование соответствует растущему объему данных, подтверждающих преимущества AI с открытым исходным кодом. Например, опрос, проведенный IBM и Morning Consult в январе, показал, что более половины предприятий, использующих инструменты AI с открытым исходным кодом, с большей вероятностью получат положительную отдачу от инвестиций (ROI). Кроме того, две пятых респондентов, которые еще не внедрили решения AI с открытым исходным кодом, выразили намерение интегрировать эти инструменты в свои проекты AI в течение следующего года.

Однако участие Meta в исследовании Linux Foundation вызвало споры, при этом критики утверждают, что оно служит завуалированной маркетинговой кампанией для моделей Llama AI компании.

Дилемма “Open Source”: Llama под пристальным вниманием

Аманда Брок, генеральный директор OpenUK, утверждает, что модели Llama от Meta не соответствуют необходимым критериям для классификации как подлинно “open source”. Она отмечает, что ни Meta, ни исследование не признают это несоответствие.

“Llama не является ‘open source’, независимо от выбранного определения”, - заявила Брок. “Лично я предпочитаю определение Open Source Software Definition (OSD) от Open Source Initiative (OSI). Llama не соответствует стандарту open source по нескольким причинам, включая включение коммерческого ограничения в свою лицензию”.

Брок далее уточнила последствия этого ограничения: “Это ограничение нарушает свободный поток, который является центральным для лицензирования open source, и создает трения. Мы полагаемся на open source, который может использоваться кем угодно и для любых целей, а Llama не выполняет это требование”.

Заявления Meta об Open Source: Спорный вопрос

Модельный ряд Llama от Meta маркируется как “open source”, но компания столкнулась с постоянными вызовами со стороны заинтересованных сторон отрасли в отношении этого утверждения. Основным предметом спора является различное толкование того, что действительно является “open source”.

Суть разногласий заключается в условиях лицензирования, налагаемых на пользователей после достижения определенного уровня коммерциализации. В то время как модели Llama предлагают открытый доступ, ограничения налагаются на пользователей при определенных обстоятельствах.

Ранее в этом году Open Source Initiative (OSI) публично раскритиковала Meta по этому вопросу, заявив, что компания “продолжает ложно продвигать Llama как open source”.

Признавая усилия Meta с линейкой Llama как “шаг в правильном направлении” в продвижении осведомленности об open source, Брок подчеркивает, что для эффективного решения проблемы “отмывания” open source в технологической индустрии необходим значительный прогресс.

“Учитывая, что на веб-сайте Meta ключевой вывод из их отчета выделен как ‘Исследование Linux Foundation показывает, как модели AI с открытым исходным кодом, такие как Llama, стимулируют экономический рост, инновации и конкуренцию, делая важнейшие технологические решения более доступными’, неудивительно, что OSI поднял тревогу и обвиняет LinuxFoundation в поддержке отмывания open source”, - отметила Брок.

Она далее подчеркнула более широкие последствия отмывания open source, заявив: “Отмывание open source - это не просто проблема open source сегодня. Ввиду того, что регулирующие органы, такие как ЕС, используют термин open source в качестве основы для исключений из ответственности в отношении AI и стандартов, которым необходимо соответствовать в AI, воздействие отмывания open source стало общественным”.

За пределами Meta: Более широкая отраслевая тенденция

Meta - не единственный разработчик в отрасли, оказавшийся под перекрестным огнем дебатов об определении open source.

В марте 2024 года Databricks запустила свою собственную большую языковую модель DBRX, которая, по утверждениям экспертов, также не соответствовала стандартам open source. Это было связано с включением внешней политики приемлемого использования и ее работой по лицензии, находящейся за пределами юрисдикции структуры OSI. Спор о DBRX еще больше подчеркивает двусмысленность и сложность, окружающие термин “open source”, и проблемы, с которыми сталкиваются разработчики при навигации по его различным интерпретациям. Эти дебаты подчеркивают необходимость большей ясности и стандартизации в определении принципов open source, особенно в быстро развивающейся области искусственного интеллекта. Без общепринятого определения риск “отмывания” open source будет продолжать сохраняться, потенциально подрывая доверие и целостность движения open source.

Определение Open Source: Основные принципы

Чтобы понять споры, окружающие Llama от Meta и DBRX от Databricks, важно углубиться в фундаментальные принципы, которые определяют программное обеспечение open source. Open Source Initiative (OSI) предоставляет широко признанное определение, в котором изложены десять ключевых критериев, которым должна соответствовать лицензия на программное обеспечение, чтобы считаться open source:

  1. Свободное распространение: Лицензия не должна ограничивать какую-либо сторону в продаже или безвозмездной передаче программного обеспечения в качестве компонента совокупного распространения программного обеспечения, содержащего программы из нескольких различных источников. Лицензия не должна требовать роялти или другую плату за такую продажу.
  2. Исходный код: Программа должна включать исходный код и должна разрешать распространение как в исходном коде, так и в скомпилированной форме. Если какая-либо форма продукта не распространяется с исходным кодом, должны быть общеизвестные средства получения исходного кода не более чем по разумной стоимости воспроизведения - предпочтительно, загрузка через Интернет бесплатно. Исходный код должен быть предпочтительной формой, в которой программист будет изменять программу. Преднамеренно запутанный исходный код не допускается. Промежуточные формы, такие как вывод препроцессора или транслятора, не допускаются.
  3. Производные работы: Лицензия должна разрешать изменения и производные работы и должна разрешать их распространение на тех же условиях, что и лицензия оригинального программного обеспечения.
  4. Целостность исходного кода автора: Лицензия может ограничивать распространение исходного кода в измененной форме только в том случае, если лицензия разрешает распространение “файлов исправлений” с исходным кодом с целью изменения программы во время сборки. Лицензия должна явно разрешать распространение программного обеспечения, построенного на основе измененного исходного кода. Лицензия может требовать, чтобы производные работы имели другое имя или номер версии, чем оригинальное программное обеспечение.
  5. Отсутствие дискриминации в отношении лиц или групп: Лицензия не должна дискриминировать какое-либо лицо или группу лиц.
  6. Отсутствие дискриминации в отношении областей деятельности: Лицензия не должна ограничивать кого-либо в использовании программы в определенной области деятельности. Например, она не может ограничивать использование программы в бизнесе или для генетических исследований.
  7. Распространение лицензии: Права, связанные с программой, должны применяться ко всем, кому программа распространяется повторно, без необходимости выполнения дополнительной лицензии этими сторонами.
  8. Лицензия не должна быть специфичной для продукта: Права, связанные с программой, не должны зависеть от того, является ли программа частью определенного распространения программного обеспечения. Если программа извлекается из этого распространения и используется или распространяется в соответствии с условиями лицензии программы, все стороны, которым программа распространяется повторно, должны иметь те же права, что и те, которые предоставляются в связи с оригинальным распространением программного обеспечения.
  9. Лицензия не должна ограничивать другое программное обеспечение: Лицензия не должна налагать ограничения на другое программное обеспечение, распространяемое вместе с лицензированным программным обеспечением. Например, лицензия не должна настаивать на том, чтобы все другие программы, распространяемые на одном носителе, были программным обеспечением open source.
  10. Лицензия должна быть технологически нейтральной: Ни одно положение лицензии не может быть основано на какой-либо отдельной технологии или стиле интерфейса.

Эти принципы подчеркивают важность свободы, прозрачности и сотрудничества в экосистеме open source. Когда лицензия на программное обеспечение отклоняется от этих принципов, возникают вопросы о том, можно ли действительно считать программное обеспечение open source. В случае Llama от Meta и DBRX от Databricks опасения связаны с коммерческими ограничениями, приемами использования и лицензионными рамками, которые могут не полностью соответствовать определению OSI.

Последствия “Отмывания Open Source”

Практика “отмывания open source”, когда компании неверно представляют свое программное обеспечение как open source, когда оно не полностью соответствует критериям, может иметь несколько негативных последствий:

  • Эрозия доверия: Она может подорвать доверие к движению open source в целом, затрудняя для пользователей различение между подлинными проектами open source и теми, которые просто притворяются.
  • Ослабление вклада: Это может отбить вклад от разработчиков, которые привержены принципам open source, поскольку они могут почувствовать, что их усилия подрываются компаниями, которые не играют по тем же правилам.
  • Юридическая неопределенность: Это может создать юридическую неопределенность для пользователей, которые полагаются на программное обеспечение, поскольку они могут не знать своих прав и обязанностей по лицензии.
  • Препятствие инновациям: Это может затруднить инновации, ограничивая свободу изменения и распространения программного обеспечения, что является ключевым фактором инноваций в сообществе open source.

Поэтому компаниям важно быть прозрачными в отношении условий лицензирования своего программного обеспечения и избегать вводящих в заблуждение заявлений о его статусе open source.

Необходимость большей ясности и стандартизации

Продолжающиеся дебаты по поводу Llama от Meta и DBRX от Databricks подчеркивают необходимость большей ясности и стандартизации в определении принципов open source. Отсутствие общепринятого определения создает путаницу и позволяет компаниям использовать лазейки и заниматься “отмыванием open source”.

В настоящее время реализуется несколько инициатив для решения этой проблемы:

  • Open Source Initiative (OSI): OSI продолжает играть решающую роль в определении и продвижении принципов open source. Он предоставляет широко признанное определение open source и сертифицирует лицензии, соответствующие его критериям.
  • Linux Foundation: Linux Foundation работает над продвижением сотрудничества и инноваций в сообществе open source. Он предоставляет платформу для проектов open source и проводит мероприятия, которые объединяют разработчиков, пользователей и компании.
  • Европейский Союз (ЕС): ЕС все больше признает важность open source и включает его в свои политики и правила. Он использует термин “open source” в качестве основы для исключений из ответственности в отношении AI и стандартов, которым необходимо соответствовать в AI.

Эти инициативы помогают создать более прозрачную и стандартизированную экосистему open source. Однако необходимо проделать больше работы, чтобы обеспечить четкое определение принципов open source и их последовательное применение.

Двигаясь вперед: Прозрачность и подотчетность

Чтобы эффективно бороться с “отмыванием open source” и продвигать подлинный open source, необходим многогранный подход:

  • Прозрачность: Компании должны быть прозрачными в отношении условий лицензирования своего программного обеспечения и избегать вводящих в заблуждение заявлений о его статусе open source.
  • Подотчетность: Отраслевые организации и регулирующие органы должны привлекать компании к ответственности за их заявления об open source и принимать меры против тех, кто занимается “отмыванием open source”.
  • Образование: Пользователи и разработчики должны быть осведомлены о принципах open source и о том, как идентифицировать подлинные проекты open source.
  • Сотрудничество: Сообщество open source должно продолжать сотрудничать для определения и продвижения принципов open source и для разработкиинструментов и ресурсов, которые помогают пользователям и разработчикам ориентироваться в экосистеме open source.

Работая вместе, мы можем создать более прозрачную, подотчетную и инновационную экосистему open source, которая принесет пользу всем. Будущее AI и других технологий зависит от этого.