Трансформационный сдвиг в Open Source AI
Исторически сложилось так, что разработка ИИ с открытым исходным кодом была фрагментированным делом, часто приводящим к созданию неэффективных моделей. До 2023 года немногие некоммерческие организации обладали ресурсами для обучения моделей ИИ, возможности которых хотя бы приближались к GPT-2. Крупные технологические компании доминировали в сфере проприетарного ИИ, в то время как ИИ с открытым исходным кодом в основном использовался в нишевых приложениях.
2023 год стал поворотным моментом. Было выпущено несколько новых базовых моделей с разрешительными лицензиями, за которыми последовал революционный выпуск Meta своей модели Llama 2 с открытым исходным кодом в партнерстве с Microsoft. Это событие вызвало шквал активности: за шесть месяцев было создано более 10 000 производных моделей. Началась новая эра разработки ИИ с открытым исходным кодом.
Амбициозные цели и выдающийся руководящий комитет
На этом фоне AI Alliance с самого начала поставил перед собой впечатляющий набор целей. Эти цели включали:
- Содействие открытому сотрудничеству.
- Установление управления и ограничений для ИИ.
- Разработка инструментов бенчмаркинга и четких политических позиций.
- Приоритезация обширных образовательных инициатив.
- Развитие надежных аппаратных экосистем.
Сила Альянса еще больше подчеркивается калибром его руководящего комитета, в который входят известные коммерческие организации и университеты.
Критерии членства: приверженность открытости и сотрудничеству
Чтобы стать членом AI Alliance, организация должна соответствовать четырем ключевым критериям:
- Соответствие миссии: Потенциальный член должен соответствовать миссии развития безопасности, открытой науки и инноваций.
- Приверженность проектам: Члены должны быть привержены работе над значительными проектами, которые соответствуют миссии Альянса.
- Разнообразие точек зрения: Потенциальные члены должны быть готовы внести свой вклад в разнообразие точек зрения и культур в рамках глобального членства, которое в настоящее время превышает 140 организаций и, как ожидается, будет расти дальше.
- Репутация: AI Alliance ищет членов с признанной репутацией преподавателей, разработчиков или защитников в сообществе ИИ с открытым исходным кодом.
Категоризация членов: Строители, Помощники и Защитники
Члены Альянса обычно делятся на три категории:
- Строители (Builders): Эти члены отвечают за создание моделей, наборов данных, инструментов и приложений, использующих ИИ.
- Помощники (Enablers): Эти члены способствуют внедрению открытых технологий ИИ с помощью учебных пособий, примеров использования и общей поддержки сообщества.
- Защитники (Advocates): Эти члены подчеркивают преимущества экосистемы AI Alliance и способствуют укреплению общественного доверия и безопасности среди руководителей организаций, заинтересованных сторон общества и регулирующих органов.
Шесть ключевых областей внимания: целостный подход к экосистеме ИИ
AI Alliance определяет свои долгосрочные приоритеты по шести ключевым направлениям. Однако важно отметить, что Альянс придерживается целостного подхода ко всей экосистеме ИИ, поощряя членов сообщества и разработчиков участвовать в одной или нескольких областях и адаптироваться по мере изменения интересов или приоритетов.
Рассмотрим подробнее шесть ключевых областей:
Навыки и образование
Эта область посвящена предоставлению знаний об ИИ широкой аудитории, включая потребителей и бизнес-лидеров, оценивающих риски ИИ, а также студентов и разработчиков, создающих приложения ИИ. Она направлена на упрощение процесса поиска экспертных рекомендаций в конкретных областях и включает инициативу по оценке моделей.
В 2024 году Альянс опубликовал ‘Guide to Essential Competencies for AI’, всеобъемлющий ресурс, ставший результатом обширного опроса, проведенного с целью определения ключевых ролей в области ИИ и навыков, необходимых для этих ролей. Несмотря на то, что руководство было опубликовано недавно, оно уже претерпело девять редакций, и планируется провести последующий опрос для решения проблем, выявленных в первоначальном опросе.
Доверие и безопасность
В этой критически важной области исследуются основные элементы доверия и безопасности, необходимые для успеха всех приложений ИИ. Бенчмарки, инструменты и методологии используются для обеспечения высокого качества, безопасности и надежности моделей и приложений. Это включает поддержку развивающихся стандартов поведения и эффективное реагирование на риски.
Рабочая группа в этой области собирает лучшие в своем роде концепции, связанные с доверием и безопасностью, и связывает пользователей с необходимыми им экспертными знаниями. Опрос ‘State of Open Source AI Trust and Safety — End of 2024 Edition’, опубликованный на веб-сайте AI Alliance, выявил как потребности, так и успехи в этой области. Исследовательские и экологические пробелы устраняются посредством научно-исследовательских и опытно-конструкторских работ, проводимых многочисленными членами AI Alliance.
Приложения и инструменты
Эта группа сосредоточена на изучении инструментов и методов для создания эффективных и надежных приложений с поддержкой ИИ. Она также разрабатывает лабораторию ИИ для облегчения экспериментов и тестирования приложений ИИ, ускоряя инновации.
Аппаратное обеспечение
Эта область посвящена развитию надежной экосистемы ускорителей аппаратного обеспечения ИИ путем обеспечения независимости программного стека ИИ от аппаратного обеспечения. Такие технологии, как MLIR и Triton, являются важнейшими программными инструментами для достижения высокой производительности и переносимости аппаратного обеспечения. Эти инструменты позволяют организациям использовать предпочитаемое ими аппаратное обеспечение, повышая гибкость и производительность, а также снижая зависимость от проприетарных систем.
Базовые модели и наборы данных
Эта область концентрируется на моделях для недостаточно обслуживаемых областей, включая многоязычные, мультимодальные, временные ряды, науку и другие области. Например, научные и предметно-ориентированные модели нацелены на изменение климата, открытие молекул и полупроводниковую промышленность.
Эффективные модели и архитектуры приложений ИИ требуют полезных наборов данных с четким управлением и правами использования. Инициатива ‘Open Trusted Data Initiative’ разъясняет требования к таким наборам данных и создает каталоги соответствующих наборов данных. Эта работа направлена на то, чтобы в значительной степени устранить опасения по поводу юридических вопросов, авторских прав и конфиденциальности.
Адвокация
Адвокация нормативно-правовой политики имеет важное значение для создания здоровой и открытой экосистемы ИИ. Все политики и нормативные акты в области ИИ должны представлять сбалансированные, а не предвзятые точки зрения.
Глубокое погружение в доверие и безопасность: инициатива 2025 года
Доверие и безопасность — это значительная и обширная область в рамках AI Alliance, в которой многочисленные специалисты работают над инструментами для обнаружения и смягчения разжигания ненависти, предвзятости и другого вредоносного контента. ‘Trust and Safety Evaluation Initiative’ — это крупное начинание на 2025 год, обеспечивающее единое представление обо всем спектре оценки — не только для безопасности, но и для производительности и других областей, где оценка эффективности моделей и приложений ИИ имеет решающее значение. Подпроект изучает конкретные приоритеты безопасности по областям, таким как здравоохранение, право и финансы.
В середине 2025 года AI Alliance планирует выпустить таблицу лидеров Hugging Face, которая позволит разработчикам:
- Искать оценки, которые наилучшим образом соответствуют их потребностям.
- Сравнивать производительность открытых моделей с этими оценками.
- Загружать и развертывать эти оценки для изучения своих собственных частных моделей и приложений ИИ.
Эта инициатива также предоставит рекомендации по важным аспектам безопасности и соответствия требованиям различных вариантов использования.
Поддержка локального ИИ: аппаратно-независимые программные стеки
Не все вызовы моделей ИИ будут полагаться на размещенные коммерческие сервисы. В определенных ситуациях необходимы решения с воздушным зазором. Интеллектуальные периферийные устройства с поддержкой ИИ стимулируют развертывание новых, небольших и мощных моделей на местах, часто без подключения к Интернету. Для поддержки этих вариантов использования и облегчения обслуживания моделей в больших масштабах с гибкими аппаратными конфигурациями AI Alliance разрабатывает аппаратно-независимые программные стеки.
Реальные примеры сотрудничества: SemiKong и DANA
Два примера показывают, как открытое сотрудничество между членами Альянса приносит значительные выгоды для всех:
SemiKong
SemiKong — это результат совместных усилий трех членов Альянса. Они создали большую языковую модель с открытым исходным кодом специально для области процессов производства полупроводников. Производители могут использовать эту модель для ускорения разработки новых устройств и процессов. SemiKong обладает специализированными знаниями о физике и химии полупроводниковых приборов. Всего за шесть месяцев SemiKong привлек внимание мировой полупроводниковой промышленности.
SemiKong был разработан путем тонкой настройки базовой модели Llama 3 с использованием наборов данных, курируемых Tokyo Electron. Этот процесс настройки привел к созданию отраслевой генеративной модели ИИ с превосходными знаниями о процессах травления полупроводников по сравнению с общей базовой моделью. Доступен технический отчет о SemiKong.
DANA (Domain-Aware Neurosymbolic Agents)
DANA — это совместная разработка Aitomatic Inc. (базируется в Кремниевой долине) и Fenrir Inc. (базируется в Японии). Она представляет собой ранний пример ныне популярной архитектуры агентов, где модели интегрируются с другими инструментами для обеспечения дополнительных возможностей. Хотя одни только модели могут достигать впечатляющих результатов, многочисленные исследования показали, что LLM часто генерируют неверные ответы. В исследовании 2023 года, цитируемом в статье о SemiKong, типичные ошибки LLM оценивались в 50%, тогда как дополнительное использование DANA инструментов рассуждения и планирования повысило точность до 90% для целевых приложений.
DANA использует нейросимволические агенты, которые сочетают в себе возможности распознавания образов нейронных сетей с символическими рассуждениями, обеспечивая строгую логику и решение проблем на основе правил. Логические рассуждения в сочетании с инструментами для планирования (например, проектирования процессов сборочной линии) дают точные и надежные результаты, которые необходимы для промышленных систем контроля качества и автоматизированного планирования и составления графиков.
Универсальность DANA распространяется на несколько областей. Например, в финансовом прогнозировании и принятии решений DANA может понимать рыночные тенденции и делать прогнозы на основе сложных теорий, используя как структурированные, так и неструктурированные данные. Эта же возможность может быть применена к поиску и оценке медицинской литературы и исследовательской информации, гарантируя, что диагнозы и лечение соответствуют установленным медицинским протоколам и практикам. По сути, DANA может улучшить результаты лечения пациентов и уменьшить количество ошибок в критически важных приложениях для пациентов.
Прочная основа для дальнейшего роста
AI Alliance начал 2025 год в сильной позиции, с членами, охватывающими 23 страны, и многочисленными рабочими группами, сосредоточенными на основных проблемах ИИ. Альянс может похвастаться более чем 1200 сотрудниками рабочих групп, участвующими в более чем 90 активных проектах. На международном уровне AI Alliance принял участие в мероприятиях, проведенных в 10 странах, охватив более 20 000 человек, и опубликовал пять руководств по важным темам ИИ, чтобы помочь исследователям и разработчикам в создании и использовании ИИ.
AI Alliance опубликовал примеры использования ИИ на таких моделях, как семейство Granite от IBM и модели Llama от Meta. Его растущая коллекция «рецептов» использует самые популярные открытые библиотеки и модели для распространенных шаблонов приложений, включая RAG, графы знаний, нейросимволические системы и новые архитектуры планирования и рассуждения агентов.
Масштабирование: амбициозные планы на 2025 год и далее
В 2025 году AI Alliance намерен увеличить свой охват и влияние в десять раз. Две его новые крупные инициативы, о которых говорилось ранее, — это ‘Open Trusted Data Initiative’ и ‘Trust and Safety Evaluation Initiative’. AI Alliance также планирует создать стандартную отраслевую лабораторию сообщества для разработки и тестирования технологий приложений ИИ. Его инициативы в области предметно-ориентированных моделей будут продолжать развиваться. Например, новая рабочая группа по климату и устойчивому развитию планирует разработать мультимодальные базовые модели и программные инструменты с открытым исходным кодом для решения ключевых проблем, связанных с изменением климата и его смягчением.
По прогнозам, к 2030 году ИИ внесет вклад в мировую экономику в размере около 20 триллионов долларов. К тому времени прогнозируется, что 70% промышленных приложений ИИ будут работать на ИИ с открытым исходным кодом. Ожидается, что нехватка специалистов по ИИ станет еще более острой, чем сегодня. Члены AI Alliance могут смягчить эту проблему, сотрудничая с другими членами, чтобы получить доступ к разнообразному опыту и обмену ресурсами.
AI Alliance следует траектории роста, аналогичной другим успешным организациям с открытым исходным кодом, таким как Linux Foundation, Apache Software Foundation и Open Source Initiative. К ним относятся:
- Комплексные программы обучения и повышения квалификации в области ИИ.
- Глобальная адвокация ответственного ИИ.
- Создание инструментов для обеспечения безопасности и надежности ИИ, а также простоты разработки и использования.
- Совместные исследования с академическими учреждениями.
Руководство AI Alliance будет продолжать привлекать разработчиков и исследователей, а также лидеров бизнеса и правительства. Руководство AI Alliance определило масштабирование глобального сотрудничества в качестве своей главной миссии на 2025 год. Учитывая все вышесказанное, AI Alliance имеет основу для того, чтобы стать доминирующей глобальной силой, которая формирует, улучшает и внедряет инновации в будущее искусственного интеллекта.