Моделът Qwen на Alibaba

Разширяващата се AI екосистема на Китай

На 5 март китайският технологичен гигант Alibaba представи най-новия си модел за разсъждение с изкуствен интелект - разработка, която доведе до впечатляващ 8% скок на акциите на компанията, листвани в Хонконг. Въпреки че този нов модел, наречен QwQ-32B, може все още да не съперничи на възможностите на водещите AI системи в Съединените щати, се твърди, че съответства на производителността на своя местен конкурент, модела R1 на DeepSeek. Това, което отличава QwQ-32B, е значително по-ниското му изискване за изчислителна мощност, както при разработката, така и при текущата му работа. Създателите на QwQ-32B твърдят, че той въплъщава „древен философски дух“, подхождайки към проблемите с чувство на „истинско удивление и съмнение“.

„Това пускане на пазара подчертава по-широката конкурентоспособност на китайската гранична AI екосистема“, отбелязва Скот Сингър, гостуващ учен в Програмата за технологии и международни отношения в Carnegie Endowment for International Peace. Тази екосистема е оживен пейзаж, населен от играчи като DeepSeek с неговия модел R1 и Tencent с неговия модел Hunyuan. Трябва да се отбележи, че съоснователят на Anthropic, Джак Кларк, призна Hunyuan като „от световна класа“ в определени аспекти. Важно е обаче да се отбележи, че оценките на най-новия модел на Alibaba са все още в начален стадий. Присъщата трудност при измерването на възможностите на модела, съчетана с факта, че QwQ-32B е оценен само вътрешно от Alibaba, означава, че „информационната среда не е много богата в момента“, както посочва Сингър.

Дебютът на модела R1 на DeepSeek през януари вече беше предизвикал вълни на световния фондов пазар, изтласквайки технологичната екосистема на Китай в светлината на международните прожектори. Това внимание се засилва допълнително от нарастващото възприятие в САЩ за надпревара с Китай за постигане на изкуствен общ интелект (AGI). AGI представлява хипотетично ниво на AI изтънченост, при което системите притежават способността да изпълняват широк спектър от когнитивни задачи, от графичен дизайн до изследвания в областта на машинното обучение, на ниво, сравнимо или надвишаващо човешките възможности.

Стратегическите последици от AGI

Широко се очаква, че разработването на AGI ще даде значително военно и стратегическо предимство на който и да е субект – било то компания или правителство – който го постигне пръв. Потенциалните приложения на такава система са огромни и трансформиращи, вариращи от усъвършенствани възможности за кибервойна до създаването на нови оръжия за масово унищожение.

„Уверени сме, че комбинирането на по-силни базови модели с обучение с подсилване, задвижвано от мащабирани изчислителни ресурси, ще ни тласне по-близо до постигането на AGI“, заяви екипът, отговорен за най-новия модел на Alibaba. Този стремеж към AGI е обща нишка, преминаваща през повечето водещи AI лаборатории. Декларираната цел на DeepSeek е да „разгадае мистерията на AGI с любопитство“. По същия начин мисията на OpenAI е да „гарантира, че изкуственият общ интелект – AI системи, които като цяло са по-умни от хората – е от полза за цялото човечество“. Изтъкнати изпълнителни директори на AI изразиха очаквания, че подобни на AGI системи могат да се появят в рамките на настоящия мандат на президента Тръмп.

Завръщането на Джак Ма и технологичният пейзаж на Китай

Неотдавнашният пробив на Alibaba в областта на AI идва след забележителна публична изява на съоснователя на компанията, Джак Ма. Той беше на видно място на първия ред по време на среща между президента Си Дзинпин и водещите бизнес фигури в Китай. Това бележи значителна промяна за Ма, който до голяма степен се беше оттеглил от общественото внимание от 2020 г. насам. Предишните му критики към държавните регулатори и държавните банки за възпрепятстване на иновациите и работа с „менталитет на заложна къща“ изглежда бяха довели до период на намалена видимост.

По време на отсъствието на Ма от светлината на прожекторите, китайското правителство приложи серия от мерки, насочени към технологичната индустрия. Бяха наложени по-строги разпоредби за това как компаниите могат да използват данни и да участват в пазарната конкуренция. Едновременно с това правителството упражняваше по-голям контрол върху ключови дигитални платформи.

Промяна на приоритетите: От технологични репресии към икономическо възраждане

До 2022 г. се появи осезаема промяна във фокуса на правителството. Възприеманата заплаха, породена от технологичната индустрия, изглежда намаля в сравнение с надвисналата заплаха от икономическа стагнация. „Тази история за икономическата стагнация и опитите да се обърне тя, наистина оформи толкова голяма част от политиката през последните 18 месеца“, обяснява Сингър. Китай сега активно преследва приемането на авангардни технологии. Докладите сочат, че най-малко 13 градски правителства и 10 държавни енергийни компании вече са интегрирали моделите на DeepSeek в своите оперативни системи.

Тенденцията за повишаване на ефективността на AI

Моделът на Alibaba е пример за продължаваща тенденция в областта на AI: последователното подобряване на производителността на системата заедно с намаляване на оперативните разходи. Epoch AI, изследователска организация с нестопанска цел, изчислява, че изчислителната мощност, необходима за обучение на AI системи, се е увеличавала със скорост, надвишаваща 4 пъти годишно. Въпреки това, едновременният напредък в дизайна на алгоритмите е довел до трикратно увеличение на ефективността на тази изчислителна мощност всяка година. На практика това означава, че AI система, която може да е изисквала 10 000 усъвършенствани компютърни чипа за обучение миналата година, може да бъде обучена само с една трета от този брой тази година.

Ключовата роля на високопроизводителните изчислителни чипове

Въпреки тези впечатляващи подобрения в ефективността, Сингър предупреждава, че високопроизводителните изчислителни чипове остават незаменими за усъвършенстваното AI развитие. Тази реалност подчертава продължаващото предизвикателство, породено от американския контрол върху износа на тези чипове за китайски AI компании като Alibaba и DeepSeek. Главният изпълнителен директор на DeepSeek специално посочи достъпа до чипове, а не финансовите ресурси илиталанта, като основно тяхно затруднение.

Нова парадигма: „Модели за разсъждение“

QwQ представлява най-новото допълнение към процъфтяващото поколение AI системи, категоризирани като „модели за разсъждение“. Някои експерти разглеждат това като промяна на парадигмата в областта на AI. Преди това AI системите се подобряваха чрез комбинация от увеличаване на изчислителната мощност, използвана за обучение, и подобряване на количеството и качеството на данните за обучение.

Тази нова парадигма набляга на различен подход. Той включва вземане на модел, който вече е преминал първоначално обучение – в този случай Qwen 2.5-32B – и след това значително увеличаване на изчислителните ресурси, разпределени за системата, когато тя отговаря на конкретна заявка. Както екипът на Qwen красноречиво го казва, „когато му се даде време да размишлява, да поставя въпроси и да обмисля, разбирането на модела за математика и програмиране разцъфтява като цвете, което се отваря към слънцето“. Това наблюдение е в съответствие с тенденциите, наблюдавани при западните модели, където техниките, които позволяват удължено време за „мислене“, са довели до значителни подобрения в производителността при сложни аналитични задачи.

Пускане с отворени тегла и пазарна динамика

QwQ на Alibaba е пуснат под модел с „отворени тегла“. Това означава, че теглата, които по същество съставляват модела и са достъпни като компютърен файл, могат да бъдат изтеглени и стартирани локално, дори на лаптоп от висок клас. Интересното е, че предварителният преглед на модела, пуснат през ноември миналата година, привлече значително по-малко внимание. Сингър отбелязва, че „фондовият пазар като цяло реагира на пускането на модели, а не на траекторията на технологията“, която се очаква да продължи бързото си развитие от двете страни на Тихия океан. Той допълнително подчертава, „Китайската екосистема има множество играчи в нея, всички от които пускат модели, които са много мощни и завладяващи, и не е ясно кой ще се появи, когато всичко е казано и направено, като има най-добрия модел.“

Подробен преглед на архитектурата на QwQ-32B

Моделът QwQ-32B, макар и изграден върху основата на Qwen 2.5-32B, включва няколко ключови архитектурни модификации и подобрения в обучението, които допринасят за подобрените му възможности за разсъждение. Тези подобрения могат да бъдат широко категоризирани в:

  • Разширяване на контекстния прозорец: Контекстният прозорец, който определя количеството текст, което моделът може да разгледа наведнъж, вероятно е значително разширен. Това позволява на QwQ-32B да обработва и разбира по-дълги, по-сложни пасажи от текст, което води до по-добро разбиране и по-нюансирани отговори.

  • Подобрени механизми за внимание: Механизмът за внимание, основен компонент на базираните на трансформатори модели като QwQ-32B, вероятно е усъвършенстван. Това може да включва техники като многоглаво внимание или разредено внимание, което позволява на модела да се фокусира по-ефективно върху релевантна информация в рамките на входния текст и да филтрира шума.

  • Обучение с подсилване от човешка обратна връзка (RLHF): Въпреки че не е изрично посочено, е много вероятно QwQ-32B да е бил фино настроен с помощта на RLHF. Тази техника включва обучение на модела да генерира изходи,които са предпочитани от човешки оценители, което води до подобрения в области като съгласуваност, полезност и безвредност.

  • Настройка на инструкции: QwQ-32B може да е преминал обширна настройка на инструкции, процес, при който моделът се обучава на разнообразен набор от инструкции и съответните изходи. Това помага на модела да се обобщава по-добре за нови задачи и да следва инструкциите по-точно.

  • Подсказване на верига от мисли: Моделът е изрично проектиран да използва подсказване на верига от мисли, техника, при която моделът се насърчава да генерира поредица от междинни стъпки на разсъждение, преди да стигне до окончателен отговор. Това насърчава по-обмислено и логично разсъждение.

Последици за конкретни индустрии

Напредъкът, въплътен от QwQ-32B и други китайски AI модели, има значителни последици за различни индустрии, както в Китай, така и в световен мащаб. Някои ключови сектори, които вероятно ще бъдат засегнати, включват:

  • Електронна търговия: Основният бизнес на Alibaba, електронната търговия, може да се възползва значително от подобрените AI възможности. Това включва области като персонализирани препоръки, чатботове за обслужване на клиенти, откриване на измами и оптимизиране на веригата за доставки.

  • Финанси: AI моделите могат да се използват за задачи като оценка на риска, откриване на измами, алгоритмична търговия и управление на взаимоотношенията с клиенти. Повишените способности за разсъждение на модели като QwQ-32B могат да доведат до по-точни финансови прогнози и подобрено вземане на решения.

  • Здравеопазване: AI може да помогне при откриването на лекарства, диагностицирането на заболявания, персонализираната медицина и наблюдението на пациенти. По-мощните модели за разсъждение могат да анализират сложни медицински данни и да предоставят прозрения, които преди това са били недостъпни.

  • Производство: Автоматизацията, задвижвана от AI, контролът на качеството и предсказуемата поддръжка могат да повишат ефективността и да намалят разходите в производствените процеси.

  • Транспорт: Самоуправляващите се превозни средства, системите за управление на трафика и оптимизирането на логистиката разчитат в голяма степен на AI. Напредъкът в AI разсъжденията може да допринесе за по-безопасни и по-ефективни транспортни мрежи.

  • Образование: AI моделите все по-често се приемат, за да осигурят по-добра подкрепа за учениците и дори персонализирано обучение.

Бъдещето на AI конкуренцията и сътрудничеството

Бързият напредък на китайските AI модели като QwQ-32B повдига важни въпроси за бъдещето на AI конкуренцията и сътрудничеството в световен мащаб. Въпреки че несъмнено съществува конкурентна динамика, особено между САЩ и Китай, има и потенциални ползи от сътрудничеството и споделянето на знания.

  • Отворен код срещу затворен код: Решението на Alibaba да пусне QwQ-32B като модел с отворени тегла е значително. То контрастира с подхода, възприет от някои западни AI компании, които поддържат своите модели като собствени системи със затворен код. Моделите с отворен код могат да насърчат по-голямо сътрудничество и да ускорят иновациите, като позволяват на изследователи и разработчици по целия свят да надграждат съществуващата работа.

  • Споделяне на данни и стандартизация: Разработването на надеждни и сигурни AI системи изисква огромни количества данни. Международното сътрудничество в областта на споделянето на данни и установяването на общи стандарти би могло да бъде от полза за цялата AI общност.

  • Етични съображения: Тъй като AI системите стават по-мощни, етичните съображения стават все по-важни. Глобалният диалог и сътрудничество са от съществено значение, за да се гарантира, че AI се разработва и внедрява отговорно, с подходящи предпазни мерки за смекчаване на потенциалните рискове.

  • Обмен на таланти: Областта на AI се възползва от разнообразен и глобално разпределен набор от таланти. Улесняването на обмена на изследователи и инженери между държавите може да насърчи трансфера на знания и да ускори напредъка.

Появата на QwQ-32B и други усъвършенствани китайски AI модели представлява важен етап в продължаващата еволюция на изкуствения интелект. Той подчертава нарастващите възможности на китайската технологична екосистема и подчертава глобалните последици от напредъка в областта на AI. През следващите години вероятно ще станем свидетели на продължаващ бърз напредък, интензивна конкуренция и нарастващи призиви за международно сътрудничество, за да се гарантира, че AI е от полза за човечеството като цяло.