Meta Разширява AI Арсенала си с Llama Модели

Meta наскоро разкри последните итерации на своя модел за изкуствен интелект (AI) Llama, сигнализирайки за значителна стъпка напред в текущия ангажимент на компанията към AI иновациите. Сред новите предложения са Llama 4 Scout и Llama 4 Maverick, които Meta нарече "мултимодални модели", подчертавайки способността им да обработват и взаимодействат с различни форми на медии отвъд обикновения текст.

В допълнение, Meta teas-на Llama 4 Behemoth, позициониран като един от най-интелигентните LLM в световен мащаб и предназначен да служи като учител за новоиздадените модели.

Това съобщение подчертава значителните инвестиции на Meta в AI през предходните две години. Изпълнителният директор Mark Zuckerberg публично заяви намерението си да отдели до $65 милиарда през 2025 г., за да подобри допълнително AI възможностите на компанията. Амбициите на Meta се простират извън социалните медии, проучвайки потенциални премиум абонаменти за своя AI-асистент, Meta AI, за да се справя със задачи като резервации и създаване на видеоклипове.

Отвореното начинание на OpenAI

Успоредно с тези развития, OpenAI съобщава, че обмисля пускането на версия с отворен код на своя LLM, което е отклонение от неотдавнашните му практики. Този ход ще предостави на потребителите свободата да използват, модифицират и разпространяват модела, без да плащат лицензионни такси. OpenAI търси принос от общността от разработчици, изследователи и широката публика, за да оптимизира полезността на модела.

Очаква се моделът с отворен код да бъде пуснат в рамките на няколко месеца. Последният път, когато OpenAI възприе принципите на отворения код, беше през 2019 г. с GPT-2 LLM. Най-новият му LLM е GPT-4.5. OpenAI премина към собствени модели, след като осигури инвестиция от един милиард долара от Microsoft, формирайки тесен съюз за напредък в разработването на AI модели. Оттогава Microsoft инвестира над $13 милиарда в OpenAI, като моделите на OpenAI са ексклузивни за клиентите на облачните услуги на Microsoft Azure.

Llama на Meta, LLM-ът на Mistral и DeepSeek са някои от моделите с отворен код, които натрупват популярност напоследък. Zuckerberg спомена на Threads, че Llama е бил изтеглен 1 милиард пъти. Llama беше пуснат през 2023 г.

AI Моделът "Behemoth" от Meta е изправен пред забавяния

Въпреки това, Meta съобщава, че забавя пускането на "Behemoth", първоначално планиран за пускане през лятото, като най-ранното възможно пускане сега се очаква през есента. Източници предполагат, че прогресът на модела не е "достатъчно значителен", за да оправдае пускането през юни, и това представлява забавяне от конференцията на разработчиците на Meta.

Забавянето хвърля сянка върху пускането от Meta на водещото семейство големи езикови модели Llama. The Wall Street Journal казва, че те са били похвалени за бързината на пускането им. Llama е инструмент за даване на възможност на разработчици в по-малки компании, организации с нестопанска цел и академични институции. Той е алтернатива на затворените, собствени модели, предлагани от компании като OpenAI, Google и Amazon.

Влиянието на забавянето на Behemoth върху по-големите компании е по-слабо изразено, тъй като те често разчитат на облачно базирани собствени модели. Въпреки че по-малките компании могат да персонализират моделите с отворен код Llama, те изискват допълнителни услуги за разгръщане, които Meta не предлага. Използването на Llama от Meta е насочено към подобряване на собствените му инструменти за социални медии, което позволява на Zuckerberg да поддържа контрол над своята AI траектория.

Значителен фактор зад забавянето е дали моделът демонстрира достатъчно значителни подобрения, за да оправдае публичното пускане.

Императивът за иновации

В бързо развиващия се свят на технологичната индустрия, новите издания трябва да демонстрират осезаеми подобрения, за да оправдаят въвеждането им. На LlamaCon, Meta представи два по-малки модела Llama 4, всеки от които притежава впечатляващи възможности:

  • Maverick може да се похвали с 400 милиарда общи параметъра с контекстно прозореца от 1 милион токена (750 000 думи).
  • Scout разполага със 109 милиарда параметъра и контекстно прозореца от 10 милиона токена (7,5 милиона думи).

Behemoth първоначално беше планиран за едновременно пускане, включващ 2 трилиона параметъра.

Според Wall Street Journal, Meta става нетърпелива към своя екип на Llama 4 поради продължаващите си AI инвестиции. През 2024 г. компанията е отделила до $72 милиарда в капиталови разходи, предимно насочени към разработката на AI.

Нарастващи опасения

Zuckerberg и други висши ръководители все още не са обявили окончателна дата на пускане за Behemoth. Вътрешни лица се опасяват, че производителността му може да не отговори на очакванията, поставени от публичните изявления на Meta.

Източници посочват нарастващо недоволство сред ръководството на Meta от напредъка, постигнат от екипа, разработващ моделите Llama 4. Това доведе до дискусии за възможни промени в ръководството в рамките на неговата група за AI продукти.

Meta представи Behemoth като изключително способна система, надминаваща конкуренти като OpenAI, Google и Anthropic по конкретни показатели. Вътрешните предизвикателства възпрепятстват нейната ефикасност, както твърдят тези, които са запознати с нейното развитие.

OpenAI също се натъкна на забавяния. Следващият им голям модел, GPT-5, първоначално беше планиран за пускане в средата на 2024 г. Wall Street Journal съобщи през декември, че развитието е изостанало от графика.

През февруари главният изпълнителен директор на OpenAI Sam Altman каза, че междинният модел ще бъде GPT-4.5, докато GPT-5 ще остане месеци напред.

Възможни причини за спрян прогрес

Няколко фактора могат да допринесат за забавянето на разработването на AI модели, включително:

Намаляване на висококачествени данни

Големите езикови модели изискват огромни количества данни за обучение, отразяващи огромното пространство на интернет. Те може да изчерпват публично достъпни източници на данни, като същевременно са изправени пред правни задължения, свързани с авторските права.

Това накара OpenAI, Google и Microsoft да се застъпят за запазването на правото си да се обучават върху защитен с авторски права материал.

OpenAI спомена, че правителството може да осигури свободата на американците да се учат от AI и да избегне отстъпването на превъзходството на AI на КНР [Китайската народна република] чрез запазване на способността на американските AI модели да се учат от защитен с авторски права материал.

Алгоритмични препятствия

Вярата, че увеличаването на размера на модела, използването на повече изчисления и обучението върху повече данни ще доведат до забележителни постижения, е доказано грешна. Bloomberg казва, че има намаляваща възвръщаемост, което кара някои да казват, че законите за мащабиране се забавят.