Пробив в AI: Goku предизвиква DeepSeek?

Шанхайски количествен търговски фонд предизвиква вълнение в общността на изкуствения интелект (AI) с представянето на потенциално революционна техника за обучение на водеща международна конференция. Този иновативен метод, подробно описан в изследователска статия, представена на престижната Конференция за системи за обработка на невронна информация (NeurIPS), може да съперничи или дори да надмине ефективността на установените подходи за обучение на AI, използвани от известни изследователски организации като DeepSeek и OpenAI. Този ход отразява собствената траектория на DeepSeek, която привлече значително внимание към своя напредък в AI алгоритмите.

Декодиране на SASR обучителната рамка на Goku

Shanghai Goku Technologies, основана през 2015 г., представи нова рамка за обучение на AI, наречена SASR или стъпково адаптивно хибридно обучение. Този подход има за цел да адресира възприетите ограничения на преобладаващите методи като supervised fine-tuning (SFT) и reinforcement learning (RL). Goku твърди, че SASR, вдъхновен от начина, по който хората развиват умения за разсъждение, предлага по-адаптивен и ефективен път за изграждане на усъвършенствани AI модели.

SFT и RL се считат за крайъгълни камъни в процеса на обучение на AI, използвани от индустриални гиганти като OpenAI и DeepSeek. DeepSeek изрично подчерта критичната роля на тези техники в оптимизирането на производителността на своя V3 модел, който беше пуснат през декември и предизвика значителен интерес в технологичния сектор.

Според изследователската статия на Goku, написана в съавторство с изследователи от Shanghai Jiao Tong University и новосъздаденото й AI дъщерно дружество, Shanghai AllMind Artificial Intelligence Technology, SASR демонстрира по-добри резултати в сравнение със SFT, RL и статичните методики за хибридно обучение. “Експерименталните резултати показват, че SASR превъзхожда SFT, RL и статичните методи за хибридно обучение”, – заяви екипът на Goku в своята изследователска статия.

Последиците от напредъка на Goku

Съобщението за AI пробива на Goku подчертава продължаващия напредък на Китай в областта на AI. То потенциално подчертава ограниченията на настоящите политики, прилагани от правителството на САЩ, с намерението да възпрепятства напредъка на Китай в областта на AI чрез хардуерни ограничения. Jensen Huang, главен изпълнителен директор на Nvidia, наскоро коментира възприеманата неефективност на тези ограничения, заявявайки, че “Китай има 50 процента от AI програмистите в света”.

DeepSeek, китайски AI стартъп, който се появи от хедж фонда High-Flyer, получи широко признание за демонстриране на потенциала на Китай за AI лидерство чрез усъвършенствани алгоритми и интеграция на хардуер и софтуер.

Ролята на AllMind в AI стратегията на Goku

Създаването на AllMind, съвпадащо с публикуването на изследването на Goku, показва стратегически ход за посвещаване на ресурси за AI изследвания и развитие. Китайските записи в търговския регистър показват, че AllMind е регистрирана официално в деня, в който Goku публикува своето изследване.

Wang Xiao, основателят на Goku и законният представител на AllMind, заяви, че новото юридическо лице е създадено, за да изследва нови AI граници. Това отразява подхода, предприет от High-Flyer, койтосъздаде DeepSeek като отделно юридическо лице през 2023 г.

Към края на миналата година, Goku управлява активи на стойност над 15 милиарда юана (приблизително 2,1 милиарда щатски долара) както на вътрешния, така и на международния пазар, използвайки стратегии, управлявани от AI, според информация, налична на официалния уебсайт на компанията.

По-задълбочено проучване на SASR: Стъпково адаптивно хибридно обучение

Рамката SASR на Goku представлява интересна алтернатива в пейзажа на обучението на AI модели. За да се оцени реалният потенциал, е важно по-подробно разбиране на компонентите и начина на работа.

“Стъпковата” част на SASR предполага многостъпков процес на обучение, където AI моделът претърпява итеративно усъвършенстване. Всяка стъпка вероятно включва специфични цели и използва различни данни за обучение, за да развие определени възможности в рамките на модела. Този фазов подход предоставя предимства като смекчаване на предизвикателствата при обучението на сложни модели от нулата и позволява приведена в съответствие оптимизация на всеки етап.

“Адаптивният” елемент предполага, че процесът на обучение не е статичен, а реагира динамично на производителността и характеристиките на модела. Тази адаптивност може да включва коригиране на хиперпараметри, промяна на разпределението на данните за обучение или динамично претегляне на приноса на различни цели на обучение. Адаптивният процес позволява на AI да се учи и подобрява по-ефективно.

“Хибридният” характер на SASR разкрива, че комбинира елементи от различни методики на обучение. Това е жизненоважен аспект, защото има силни и слаби страни в SFT и RL. Смесването на методи позволява на модела да използва предимствата на всеки подход, като същевременно се обръща внимание на неговите ограничения. Чрез интегрирането на тези три характеристики, SARS е теоретично по-добре настроен към разработването на логика и разсъждения.

Сравнение на SASR с традиционните методи

Supervised fine-tuning (SFT) традиционно разчита на голям, етикиран набор от данни, където AI моделът се научава да съпоставя входовете с желаните изходи. Reinforcement learning (RL) включва обучение на модела чрез проби и грешки, награждаване или наказване на действия за максимизиране на определена цел.

SASR се опитва да интегрира двете, като същевременно преодолява ограниченията на всеки метод. Например, SFT може да зависи силно от качеството и изчерпателността на етикираните данни. В много реални сценарии получаването на достатъчно, точни данни може да отнеме много време и да бъде скъпо. RL, макар и да не изисква етикирани данни, може да бъде нестабилен и податлив на хакване на награди. Хакването на награди възниква, когато AI моделът открие непредвидени начини да максимизира наградата си, което потенциално води до нежелано поведение.

Рамката на Goku има възможност да бъде подобрение спрямо ограниченията на SFT и RL. Въпреки това, са необходими допълнителни и продължителни тестове, за да се проверят първоначалните резултати, документирани в статията на компанията.

Алгоритмични иновации и хардуерни ограничения

Новината за рамката SASR на Goku е особено важна в контекста на технологичните отношения между САЩ и Китай. От известно време правителството на САЩ се опитва да ограничи възхода на Китай в областта на AI чрез ограничаване на достъпа до усъвършенстван изчислителен хардуер, особено висок клас графични процесори от компании като Nvidia. Идеята зад тези ограничения е, че ограничаването на достъпа на Китай до мощен хардуер ще забави техните усилия за развитие на AI.

Въпреки това, коментарите на главния изпълнителен директор на Nvidia Jensen Huang и постиженията, които се появяват от китайските AI лаборатории, изглежда предполагат, че тези политики може да не са толкова ефективни, колкото се предполага. Huang е отбелязал, че Китай притежава значителна част от AI програмистите в света и че ограничаването на достъпа до хардуер може да ги мотивира да намерят алтернативни решения.

Твърдяният от Goku AI пробив предполага, че алгоритмичните иновации могат потенциално да компенсират хардуерните ограничения, поне до известна степен. Ако китайските изследователи могат да разработят по-ефективни алгоритми за обучение, те могат да бъдат в състояние да постигнат сравнима AI производителност с по-малко мощен хардуер. Това може да има значителни последици за глобалния AI пейзаж, тъй като предполага, че Китай може да продължи да развива своите AI възможности въпреки продължаващите ограничения.

Това не означава, че хардуерът е без значение. Усъвършенстваните графични процесори все още са от решаващо значение за обучението на най-съвременни AI модели и достъпът до най-новия хардуер несъмнено предлага значително конкурентно предимство. Въпреки това, работата на Goku демонстрира важността на инвестирането както в хардуер, така и в софтуер и че напредъкът в една област може потенциално да компенсира ограниченията в друга.

Възходът на китайския AI: Отвъд DeepSeek

Появата на DeepSeek като виден играч в AI арената беше катализатор, демонстриращ решимостта на Китай да стане глобален лидер в тази трансформираща технология. Въпреки това, DeepSeek е само един пример и възходът на Goku, с неговата рамка за обучение SASR, допълнително илюстрира нарастващата сила и иновации в китайската AI екосистема.

Няколко фактора допринасят за този импулс. Първо, Китай има огромен набор от данни, което е от съществено значение за обучението на AI модели. С голямо население и широко разпространено приемане на дигитални технологии, китайските компании имат достъп до масивни набори от данни, които могат да се използват за разработване и усъвършенстване на техните AI алгоритми.

Второ, Китай има силен акцент върху STEM образованието, произвеждайки голям брой талантливи инженери и учени. Това създаде висококвалифицирана работна сила, способна да стимулира иновациите в AI и свързаните с него области.

Трето, китайското правителство направи AI стратегически приоритет, предоставяйки значително финансиране и подкрепа за изследвания и развитие. Това създаде плодородна среда за AI стартъпи и насърчи сътрудничеството между академичните среди и индустрията.

И накрая, китайските компании често са готови да възприемат по-прагматичен и поемащ риск подход към иновациите, което им позволява да се движат бързо и да експериментират с нови идеи.

В резултат на тези фактори Китай бързо наваксва със САЩ по отношение на AI възможности. Докато САЩ все още водят в определени области, като фундаментални изследвания и висок клас хардуер, Китай постига значителен напредък в области като компютърно зрение, обработка на естествен език и роботика.

Появата на компании като Goku и DeepSeek предполагат, че Китай е в добра позиция да продължи възхода си в AI домейн в следващите години.

Shanghai Goku Technologies: Компанията зад иновацията

Shanghai Goku Technologies е количествен търговски фонд, основан през 2015 г. Компанията управлява значителни активи, използвайки стратегии, управлявани от AI. Декларираната мисия на компанията е да “комбинира технологии и фундаментален анализ”, за да осигури по-добра възвръщаемост за своите клиенти. Освен основната си дейност в управлението на активи, Goku демонстрира ангажимент за разширяване на границите на AI изследванията. AllMind Artificial Intelligence Technology, дъщерното дружество за AI, представлява стратегически ход за формализиране и ускоряване на нейните AI изследвания.

Подробности за вътрешната структура и оперативна динамика на компанията остават сравнително оскъдни. Въпреки това, публичните изявления и скорошните дейности предлагат представа за нейния подход. Слогана на компанията, който се превежда като “логиката и истината са единствените принципи, на които се подчиняваме”, отразява култура, управлявана от данни и аналитична. Инвестицията в AI изследвания и развитие показва дългосрочна визия и осъзнаване на трансформиращия потенциал на AI, не само във финансовия сектор, но и в различни индустрии. Вероятно Goku възнамерява да използва прозрения от AI изследвания, за да подобри своите стратегии за търговия и да постигне конкурентно предимство на пазара.