Rozwój AI Alliance w pierwszym roku

Transformacyjna zmiana w otwartym oprogramowaniu AI

Historycznie rzecz biorąc, rozwój AI o otwartym kodzie źródłowym był fragmentarycznym przedsięwzięciem, często skutkującym modelami o niskiej wydajności. Przed 2023 rokiem niewiele podmiotów non-profit posiadało zasoby, aby trenować modele AI o możliwościach zbliżonych do GPT-2. Duże firmy technologiczne zdominowały krajobraz zastrzeżonego AI, podczas gdy otwarte oprogramowanie AI było w dużej mierze zdegradowane do niszowych zastosowań.

Rok 2023 był punktem zwrotnym. Wydano wiele nowych modeli bazowych z liberalnymi licencjami, a następnie Meta przełomowo wydała swój model Llama 2 o otwartym kodzie źródłowym we współpracy z Microsoft. To wydarzenie wywołało falę aktywności, z ponad 10 000 modelami pochodnymi utworzonymi w ciągu sześciu miesięcy. Rozpoczęła się nowa era rozwoju AI o otwartym kodzie źródłowym.

Ambitne cele i znakomity komitet sterujący

Na tym tle AI Alliance od samego początku postawił sobie imponujący zestaw celów. Cele te obejmowały:

  • Wspieranie otwartej współpracy
  • Ustanowienie zarządzania i barier ochronnych dla AI
  • Opracowywanie narzędzi do benchmarkingu i jasnych stanowisk politycznych
  • Priorytetowe traktowanie szeroko zakrojonych inicjatyw edukacyjnych
  • Pielęgnowanie solidnych ekosystemów sprzętowych

Siła Sojuszu jest dodatkowo podkreślona przez kaliber jego komitetu sterującego, który może pochwalić się listą renomowanych organizacji komercyjnych i uniwersytetów.

Kryteria członkostwa: Zaangażowanie w otwartość i współpracę

Aby zostać członkiem AI Alliance, organizacja musi spełnić cztery kluczowe kryteria:

  1. Zgodność z misją: Potencjalny członek musi być zgodny z misją kultywowania bezpieczeństwa, otwartej nauki i innowacji.
  2. Zaangażowanie w projekty: Członkowie muszą być zaangażowani w pracę nad znaczącymi projektami, które są zgodne z misją Sojuszu.
  3. Różnorodność perspektyw: Przyszli członkowie muszą być gotowi do wniesienia wkładu w różnorodność perspektyw i kultur w ramach globalnego członkostwa, które obecnie przekracza 140 organizacji i ma się dalej rozwijać.
  4. Reputacja: AI Alliance poszukuje członków o uznanej reputacji jako edukatorów, budowniczych lub adwokatów w społeczności AI o otwartym kodzie źródłowym.

Kategoryzacja członków: Budowniczowie, Aktywatorzy i Adwokaci

Członkowie Sojuszu zazwyczaj należą do jednej z trzech kategorii:

  • Budowniczowie (Builders): Ci członkowie są odpowiedzialni za tworzenie modeli, zbiorów danych, narzędzi i aplikacji, które wykorzystują AI.
  • Aktywatorzy (Enablers): Ci członkowie promują wdrażanie otwartych technologii AI poprzez samouczki, przypadki użycia i ogólne wsparcie społeczności.
  • Adwokaci (Advocates): Ci członkowie podkreślają korzyści płynące z ekosystemu AI Alliance oraz wspierają zaufanie publiczne i bezpieczeństwo wśród liderów organizacji, interesariuszy społecznych i organów regulacyjnych.

Sześć kluczowych obszarów zainteresowania: Holistyczne podejście do ekosystemu AI

AI Alliance definiuje swoje długoterminowe priorytety w sześciu kluczowych obszarach zainteresowania. Należy jednak zauważyć, że Sojusz przyjmuje holistyczne podejście do całego ekosystemu AI, zachęcając członków społeczności i programistów do uczestnictwa w jednym lub kilku obszarach i dostosowywania się do zmieniających się zainteresowań lub priorytetów.

Oto bliższe spojrzenie na sześć kluczowych obszarów zainteresowania:

Umiejętności i edukacja

Ten obszar jest poświęcony dostarczaniu wiedzy o AI szerokiemu gronu odbiorców, w tym konsumentom i liderom biznesu oceniającym ryzyko związane z AI, a także studentom i programistom tworzącym aplikacje AI. Ma na celu uproszczenie procesu znajdowania wskazówek ekspertów w określonych obszarach i obejmuje inicjatywę oceny modeli.

W 2024 roku Sojusz opublikował Guide to Essential Competencies for AI, kompleksowe źródło będące wynikiem szeroko zakrojonego badania mającego na celu zidentyfikowanie kluczowych ról w AI i umiejętności wymaganych na tych stanowiskach. Pomimo niedawnej publikacji, przewodnik przeszedł już dziewięć poprawek, a planowane jest kolejne badanie, aby zająć się kwestiami zidentyfikowanymi w pierwotnym badaniu.

Zaufanie i bezpieczeństwo

Ten krytyczny obszar bada podstawowe elementy zaufania i bezpieczeństwa niezbędne do sukcesu wszystkich aplikacji AI. Benchmarki, narzędzia i metodologie są wykorzystywane do zapewnienia, że modele i aplikacje są wysokiej jakości, bezpieczne i godne zaufania. Obejmuje to wspieranie ewoluujących standardów postępowania i skuteczne reagowanie na zagrożenia.

Grupa robocza w tym obszarze gromadzi najlepsze w swojej klasie koncepcje związane z zaufaniem i bezpieczeństwem oraz łączy użytkowników z wiedzą ekspercką, której potrzebują. Ankieta State of Open Source AI Trust and Safety — End of 2024 Edition, opublikowana na stronie internetowej AI Alliance, podkreśliła zarówno potrzeby, jak i sukcesy w tej dziedzinie. Luki badawcze i środowiskowe są rozwiązywane poprzez wysiłki badawczo-rozwojowe wielu członków AI Alliance.

Aplikacje i narzędzia

Ta grupa koncentruje się na badaniu narzędzi i technik do budowania wydajnych i solidnych aplikacji opartych na AI. Opracowuje również laboratorium AI, aby ułatwić eksperymentowanie i testowanie aplikacji AI, przyspieszając innowacje.

Aktywacja sprzętu

Ten obszar jest poświęcony wspieraniu solidnego ekosystemu akceleratorów sprzętowych AI poprzez zapewnienie, że stos oprogramowania AI jest niezależny od sprzętu. Technologie takie jak MLIR i Triton są kluczowymi narzędziami programowymi do osiągnięcia wysokiej wydajności przenośności sprzętu. Narzędzia te umożliwiają organizacjom wykorzystanie preferowanego sprzętu, zwiększając elastyczność i wydajność, jednocześnie zmniejszając zależność od zastrzeżonych systemów.

Modele podstawowe i zbiory danych

Ten obszar koncentruje się na modelach dla niedostatecznie obsługiwanych obszarów, w tym wielojęzycznych, multimodalnych, szeregów czasowych, nauki i innych dziedzin. Na przykład modele naukowe i specyficzne dla danej dziedziny są ukierunkowane na zmiany klimatu, odkrywanie molekularne i przemysł półprzewodników.

Skuteczne modele i architektury aplikacji AI wymagają użytecznych zbiorów danych z jasnym zarządzaniem i prawami użytkowania. Inicjatywa Open Trusted Data Initiative precyzuje wymagania dotyczące takich zbiorów danych i buduje katalogi zgodnych zbiorów danych. To przedsięwzięcie ma na celu w dużej mierze wyeliminowanie obaw dotyczących kwestii prawnych, praw autorskich i prywatności.

Rzecznictwo

Rzecznictwo polityk regulacyjnych jest niezbędne do stworzenia zdrowego i otwartego ekosystemu AI. Wszystkie polityki i regulacje dotyczące AI powinny reprezentować zrównoważone, a nie stronnicze punkty widzenia.

Dogłębna analiza zaufania i bezpieczeństwa: Inicjatywa 2025

Zaufanie i bezpieczeństwo to znaczący i rozległy obszar w ramach AI Alliance, z licznymi specjalistami pracującymi nad narzędziami do wykrywania i łagodzenia mowy nienawiści, uprzedzeń i innych szkodliwych treści. Trust and Safety Evaluation Initiative to duże przedsięwzięcie na rok 2025, zapewniające ujednolicony widok całego spektrum oceny – nie tylko pod kątem bezpieczeństwa, ale także wydajności i innych obszarów, w których ocena skuteczności modeli i aplikacji AI jest kluczowa. Podprojekt bada konkretne priorytety bezpieczeństwa według dziedzin, takich jak zdrowie, prawo i finanse.

W połowie 2025 roku AI Alliance planuje wydać tablicę liderów Hugging Face, która umożliwi programistom:

  • Wyszukiwanie ocen, które najlepiej odpowiadają ich potrzebom
  • Porównywanie wydajności otwartych modeli w odniesieniu do tych ocen
  • Pobieranie i wdrażanie tych ocen w celu zbadania własnych prywatnych modeli i aplikacji AI

Inicjatywa ta zapewni również wskazówki dotyczące ważnych aspektów bezpieczeństwa i zgodności różnych przypadków użycia.

Wspieranie AI on-premise: Stosy oprogramowania niezależne od sprzętu

Nie wszystkie wywołania modeli AI będą opierać się na hostowanych usługach komercyjnych. Niektóre sytuacje wymagają rozwiązań typu air-gapped. Inteligentne urządzenia brzegowe z obsługą AI napędzają wdrażanie nowych, małych i wydajnych modeli on-premise, często bez połączenia z Internetem. Aby wesprzeć te przypadki użycia i ułatwić obsługę modeli na dużą skalę z elastycznymi konfiguracjami sprzętowymi, AI Alliance opracowuje stosy oprogramowania niezależne od sprzętu.

Przykłady współpracy w świecie rzeczywistym: SemiKong i DANA

Dwa przykłady pokazują, jak otwarta współpraca między członkami Sojuszu przynosi znaczące korzyści dla wszystkich:

SemiKong

SemiKong to wspólny wysiłek trzech członków Sojuszu. Stworzyli oni model języka dużego o otwartym kodzie źródłowym, specjalnie dla domeny procesu produkcji półprzewodników. Producenci mogą wykorzystać ten model do przyspieszenia rozwoju nowych urządzeń i procesów. SemiKong posiada specjalistyczną wiedzę na temat fizyki i chemii urządzeń półprzewodnikowych. W ciągu zaledwie sześciu miesięcy SemiKong przyciągnął uwagę globalnego przemysłu półprzewodników.

SemiKong został opracowany poprzez dostrojenie modelu bazowego Llama 3 przy użyciu zbiorów danych opracowanych przez Tokyo Electron. Ten proces dostrajania zaowocował specyficznym dla branży modelem generatywnej AI o lepszej wiedzy na temat procesów trawienia półprzewodników w porównaniu z ogólnym modelem bazowym. Dostępny jest raport techniczny na temat SemiKong.

DANA (Domain-Aware Neurosymbolic Agents)

DANA to wspólne opracowanie Aitomatic Inc. (z siedzibą w Dolinie Krzemowej) i Fenrir Inc. (z siedzibą w Japonii). Stanowi wczesny przykład popularnej obecnie architektury agentów, w której modele są integrowane z innymi narzędziami, aby zapewnić komplementarne możliwości. Chociaż same modele mogą osiągnąć imponujące wyniki, liczne badania wykazały, że LLM często generują nieprawidłowe odpowiedzi. Badanie z 2023 roku cytowane w artykule SemiKong zmierzyło typowe błędy LLM na poziomie 50%, podczas gdy komplementarne wykorzystanie narzędzi rozumowania i planowania przez DANA zwiększyło dokładność do 90% dla docelowych aplikacji.

DANA wykorzystuje agentów neurosymbolicznych, którzy łączą możliwości rozpoznawania wzorców sieci neuronowych z rozumowaniem symbolicznym, umożliwiając rygorystyczną logikę i rozwiązywanie problemów w oparciu o reguły. Rozumowanie logiczne, w połączeniu z narzędziami do planowania (takimi jak projektowanie procesów linii montażowych), daje dokładne i wiarygodne wyniki, które są niezbędne dla przemysłowych systemów kontroli jakości oraz zautomatyzowanego planowania i harmonogramowania.

Wszechstronność DANA rozciąga się na wiele dziedzin. Na przykład w prognozowaniu finansowym i podejmowaniu decyzji DANA może rozumieć trendy rynkowe i dokonywać prognoz w oparciu o złożone teorie, wykorzystując zarówno dane ustrukturyzowane, jak i nieustrukturyzowane. Ta sama zdolność może być zastosowana do wyszukiwania i oceny literatury medycznej i informacji badawczych, zapewniając, że diagnozy i leczenie są zgodne z ustalonymi protokołami i praktykami medycznymi. Zasadniczo DANA może poprawić wyniki pacjentów i zmniejszyć liczbę błędów w krytycznych aplikacjach dla pacjentów.

Mocne podstawy do dalszego rozwoju

AI Alliance rozpoczął rok 2025 w silnej pozycji, z członkami z 23 krajów i licznymi grupami roboczymi skupionymi na głównych wyzwaniach AI. Sojusz może pochwalić się ponad 1200 współpracownikami grup roboczych zaangażowanymi w ponad 90 aktywnych projektów. Na arenie międzynarodowej AI Alliance uczestniczył w wydarzeniach zorganizowanych w 10 krajach, docierając do ponad 20 000 osób, i opublikował pięć przewodników instruktażowych na ważne tematy związane z AI, aby pomóc badaczom i programistom w budowaniu i wykorzystywaniu AI.

AI Alliance opublikował przykłady wykorzystania AI na modelach takich jak rodzina Granite firmy IBM i modele Llama firmy Meta. Jego rosnąca kolekcja ‘przepisów’ wykorzystuje najpopularniejsze otwarte biblioteki i modele dla typowych wzorców aplikacji, w tym RAG, grafy wiedzy, systemy neurosymboliczne oraz pojawiające się architektury planowania i rozumowania agentów.

Skalowanie: Ambitne plany na rok 2025 i kolejne lata

W 2025 roku AI Alliance jest zaangażowany w dziesięciokrotne zwiększenie swojego zasięgu i wpływu. Dwie z jego nowych głównych inicjatyw, omówione wcześniej, to Open Trusted Data Initiative i Trust and Safety Evaluation Initiative. AI Alliance planuje również ustanowienie standardowego w branży laboratorium społecznościowego do opracowywania i testowania technologii aplikacji AI. Jego inicjatywy dotyczące modeli specyficznych dla danej dziedziny będą nadal ewoluować. Na przykład nowa grupa robocza ds. klimatu i zrównoważonego rozwoju planuje opracować multimodalne modele podstawowe i narzędzia programowe o otwartym kodzie źródłowym, aby sprostać kluczowym wyzwaniom związanym ze zmianami klimatu i ich łagodzeniem.

Szacuje się, że do 2030 roku AI wniesie około 20 bilionów dolarów do globalnej gospodarki. Przewiduje się, że do tego czasu 70% przemysłowych aplikacji AI będzie działać na AI o otwartym kodzie źródłowym. Oczekuje się również, że niedobór specjalistów AI stanie się jeszcze bardziej dotkliwy niż obecnie. Członkowie AI Alliance mogą być w stanie złagodzić to wyzwanie, współpracując z innymi członkami, aby uzyskać dostęp do różnorodnej wiedzy specjalistycznej i dzielenia się zasobami.

AI Alliance podąża trajektorią wzrostu podobną do innych udanych organizacji open-source, takich jak Linux Foundation, Apache Software Foundation i Open Source Initiative. Obejmują one:

  • Kompleksowe programy edukacji i umiejętności w zakresie AI
  • Globalne rzecznictwo na rzecz odpowiedzialnej AI
  • Tworzenie narzędzi zapewniających bezpieczeństwo i wiarygodność AI, a także łatwość rozwoju i użytkowania
  • Współpraca badawcza z instytucjami akademickimi

Przywództwo AI Alliance będzie nadal przyciągać programistów i badaczy, a także liderów biznesu i rządu. Kierownictwo AI Alliance ustanowiło skalowanie globalnej współpracy jako swoją nadrzędną misję na rok 2025. Biorąc wszystko pod uwagę, AI Alliance ma podstawy, aby stać się dominującą globalną siłą, która kształtuje, ulepsza i wprowadza innowacje w przyszłość sztucznej inteligencji.