DeepSeek: Преход към AI за бизнеса

DeepSeek, изгряващ китайски AI стартъп, предизвиква вълни със значително намалените цени на своите фундаментни модели. Този ход има потенциала да революционизира възприемането на AI от бизнеса, като се справи с една от най-съществените бариери: цената.

Високата цена на възприемането на AI

Според анализаторите Брад Силс и Карли Лиу от BofA Global Research, разходите, свързани с AI приложенията, са основната пречка, която възпрепятства тяхното широко разпространение. Техният доклад, публикуван във вторник, 28 януари, предполага, че пробивите в намаляването на разходите биха могли допълнително да понижат цените, което да доведе до увеличени нива на възприемане.

Обявлението на DeepSeek в понеделник, 27 януари, предизвика сътресения в AI индустрията, причинявайки спад в акциите на няколко AI компании. Компанията разкри способността си да обучи фундаментен модел само за 5,58 милиона долара, използвайки 2048 Nvidia H800 чипа. Тази цифра е в рязък контраст с прогнозираните разходи на OpenAI и Anthropic, които варират от 100 милиона до един милиард долара и включват използването на хиляди AI чипове на Nvidia.

Рой Бенеш, CTO в eSIMple, подчерта трансформиращия потенциал на постижението на DeepSeek, заявявайки, че то дава възможност на по-малки компании, индивидуални разработчици и дори изследователи да използват силата на AI, без да плащат прекомерни разходи. Тази увеличена достъпност може да насърчи развитието на иновативни идеи и технологии, което да доведе до по-голяма конкурентоспособност в тази област. В резултат на това клиентите могат да се възползват от нови опции, докато утвърдените AI компании вероятно ще понижат цените си и ще ускорят технологичния напредък.

Анализаторите на BofA предоставиха примери за разходите, свързани със съществуващите AI приложения. Microsoft’s 365 Copilot Chat таксува между 1 цент и 30 цента за подкана, в зависимост от сложността на заявката. Salesforce’s Agentforce for Service Cloud таксува фиксирана ставка от 2 долара за конверсия.

Въпреки че BofA призна, че цифрата от 5,58 милиона долара, представена от DeepSeek, е донякъде подвеждаща поради изключването на разходите, свързани с изследвания, експерименти, архитектури, алгоритми и данни, анализаторите подчертаха значението на иновациите на стартъпа в демонстрирането на осъществимостта на по-евтини методи за обучение.

Предварително обучение срещу извод: Разбиране на разходите

Фундаментните AI модели, като например GPT-4o на OpenAI и Gemini на Google, преминават през процес, наречен предварително обучение, където са изложени на огромни количества данни, като например целия интернет, за да развият общи познания. Въпреки това, за да направят тези модели по-релевантни и полезни за конкретни компании и индустрии, предприятията трябва допълнително да ги обучат или фино да ги настроят, използвайки собствените си данни.

След като AI моделът е фино настроен, той може да обработва потребителски подкани и да генерира релевантни отговори. Въпреки това, процесът на подкана на модела и получаване на отговор води до разходи за извод, които са такси, свързани с ангажирането на модела с нови данни, за да разбере и анализира.

Важно е да се отбележи, че повечето компании не поемат разходите за обучение на фундаментни модели. Тази отговорност се носи от разработчиците на тези модели, включително OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, определени изследователски лаборатории и китайски технологични гиганти като Baidu и Alibaba.

Бизнесите основно поемат разходи за извод за обработка на AI работни натоварвания, които представляват по-голямата част от разходите, свързани с AI.

Връзката с Китай: Разходите за извод на DeepSeek и опасения за поверителност

DeepSeek предлага свои собствени услуги за извод на значително по-ниски цени в сравнение с компаниите от Силициевата долина. Въпреки това, има определени съображения, които трябва да имате предвид, когато използвате тези услуги.

Според политиката за поверителност на DeepSeek, потребителската информация се съхранява на сървъри, разположени в Китай. Компанията също така заявява, че ще спазва правните задължения и ще изпълнява задачи в обществен интерес или за защита на жизненоважните интереси на своите потребители и други хора.

Националният закон за разузнаване на Китай, по-специално член 7, постановява, че всички организации и граждани подкрепят, подпомагат и си сътрудничат с националните разузнавателни усилия в съответствие със закона и защитават тайните на националната разузнавателна работа, за които са осведомени.

Кевин Сърейс, CEO на Appvance, изрази опасения относно поверителността, заявявайки, че събирането на данни от потребителите е обичайна практика в Китай. Той посъветва потребителите да бъдат внимателни.

В експеримент, проведен от PYMNTS, чатботът на DeepSeek беше помолен да обясни как протестите на площад Тянанмън през 1989 г. са повлияли на китайската политика. Чатботът отговори: ‘Съжалявам, не съм сигурен как да подходя към този тип въпрос все още.’

Тим Енекинг, CEO на Presearch, посочи, че DeepSeek е 100% китайска компания, разположена в Китай. Той отбеляза, че неспособността на чатбота да предостави информация за площад Тянанмън или висши китайски правителствени фигури предполага ограничения в обективността на технологията. Въпреки че Енекинг призна вълнуващия потенциал на технологията, той изрази опасения относно нейния контрол.

Въпреки това, Енекинг също подчерта отворения код на моделите на DeepSeek, който позволява ревизии за премахване на правителствения и корпоративен контрол. Той вярва, че инженерната креативност на компанията създава възможности за по-малки компании и държави да участват и да успеят в пейзажа на генеративния AI.

Потенциалът на DeepSeek да намали разходите за извод за всички

Иновативният подход на DeepSeek към обучението на фундаментни модели на по-ниска цена има положителни последици за компании като Microsoft, които могат да продължат да намаляват разходите за AI изчисления и да стимулират мащаба. Според Силс и Лиу, по-ниските разходи за изчисления могат да доведат до подобрени маржове на AI-базираните предложения.

В отделна изследователска бележка анализаторите на BofA Алкеш Шах, Андрю Мос и Брад Силс предположиха, че по-ниските разходи за AI изчисления биха могли да позволят по-широки AI услуги в различни сектори, от автомобили до смартфони.

Въпреки че е малко вероятно разработчиците на фундаментни модели като OpenAI веднага да постигнат разходи за обучение, толкова ниски, колкото тези на DeepSeek, анализаторите вярват, че иновативните техники за обучение и пост-обучение на DeepSeek ще бъдат възприети от конкуриращите се разработчици на модели от фронтовата линия, за да се повиши ефективността. Въпреки това, те подчертават, че настоящите модели все още ще изискват значителни инвестиции, тъй като те формират основата за AI агенти.

В дългосрочен план анализаторите очакват ускорено приемане на AI от предприятията, тъй като чатботовете, пилотите и агентите стават едновременно по-умни и по-евтини, явление, известно като парадокс на Джевонс.

CEO на Microsoft Сатя Надела повтори това мнение в X, заявявайки, че парадоксът на Джевонс е в действие, тъй като AI става по-ефективен и достъпен. Той вярва, че това ще доведе до скок в използването на AI, превръщайки го в стока, от която не можем да се наситим.

По-задълбочен поглед върху фундаментните модели и тяхното въздействие

Фундаментните модели, гръбнакът на съвременния AI, революционизират начина, по който бизнеса оперира и взаимодейства с технологиите. Тези модели, обучени на огромни набори от данни, притежават способността да изпълняват широк спектър от задачи, от обработка на естествен език до разпознаване на изображения. Разработването и внедряването на тези модели обаче включва сложна комбинация от фактори, включително разходи за обучение, разходи за извод, поверителност на данните и етични съображения.

Разбиране на фундаментните модели

В основата си фундаментните модели са големи невронни мрежи, обучени на масивни набори от данни. Този процес на обучение им позволява да научат модели и връзки в данните, което им позволява да изпълняват различни задачи с забележителна точност. Някои примери за фундаментни модели включват:

  • GPT-4o: Мощен езиков модел, разработен от OpenAI, способен да генерира текст с човешко качество, да превежда езици и да отговаря на въпроси по изчерпателен начин.
  • Gemini на Google: Мултимодален AI модел, който може да обработва и разбира различни видове данни, включително текст, изображения и аудио.

Тези модели не са ограничени до конкретни задачи, но могат да бъдат адаптирани към широк спектър от приложения, което ги прави универсални инструменти за бизнеса.

Ролята на предварителното обучение и фината настройка

Разработването на фундаментен модел обикновено включва два ключови етапа: предварително обучение и фина настройка.

  • Предварително обучение: В този етап моделът се обучава на масивен набор от данни, като например целия интернет, за да научи общи познания и езикови умения. Този процес оборудва модела със способността да разбира и генерира текст, да превежда езици и да изпълнява други основни задачи.
  • Фина настройка: В този етап предварително обученият модел се обучава допълнително на по-малък, по-специфичен набор от данни, свързан с конкретна задача или индустрия. Този процес позволява на модела да адаптира своите знания и умения към специфичните нужди на приложението.

Например, предварително обучен езиков модел може да бъде фино настроен на набор от данни от взаимодействия с обслужване на клиенти, за да се създаде чатбот, който може ефективно да отговаря на запитвания на клиенти.

Цената на обучението и извода

Разходите, свързани с фундаментните модели, могат да бъдат разделени на две основни категории: разходи за обучение и разходи за извод.

  • Разходи за обучение: Тези разходи включват изчислителните ресурси, данни и експертиза, необходими за обучение на фундаментния модел. Обучението на голям фундаментен модел може да бъде изключително скъпо, често изискващо милиони долари инвестиции.
  • Разходи за извод: Тези разходи включват изчислителните ресурси, необходими за използване на обучен модел, за да се правят прогнози или да се генерират резултати. Разходите за извод могат да варират в зависимост от размера и сложността на модела, количеството данни, които се обработват, и инфраструктурата, която се използва.

Иновацията на DeepSeek се крие в способността й значително да намали разходите за обучение, свързани с фундаментните модели, което ги прави по-достъпни за по-широк кръг от бизнеси и организации.

Разглеждане на опасенията за поверителност и етика

Използването на фундаментни модели повдига важни въпроси относно поверителността на данните и етичните съображения. Фундаментните модели са обучени на масивни набори от данни, които могат да съдържат чувствителна или лична информация. От решаващо значение е да се гарантира, че тези модели се използват по отговорен и етичен начин, като се зачита поверителността на потребителите и се избягва пристрастие.

Някои стратегии за справяне с тези опасения включват:

  • Анонимизиране на данните: Премахване или маскиране на лична информация от данните за обучение, за да се защити поверителността на потребителите.
  • Откриване и смекчаване на пристрастия: Идентифициране и справяне с пристрастията в данните за обучение, за да се гарантира, че моделът не увековечава вредни стереотипи или дискриминационни практики.
  • Прозрачност и отчетност: Предоставяне на ясна информация за това как работи моделът и как се използва и установяване на механизми за отчетност в случай на грешки или непредвидени последици.

Тъй като фундаментните модели стават по-разпространени, от съществено значение е да се разгледат тези опасения за поверителност и етика проактивно, за да се гарантира, че те се използват за благото на обществото.

Бъдещето на фундаментните модели

Фундаментните модели се развиват бързо и тяхното потенциално въздействие върху обществото е огромно. В бъдеще можем да очакваме да видим:

  • По-мощни и универсални модели: Тъй като изследователите продължават да разработват нови архитектури и техники за обучение, фундаментните модели ще станат още по-мощни и универсални, способни да изпълняват по-широк спектър от задачи с по-голяма точност.
  • Повишена достъпност: Тъй като разходите за обучение намаляват и AI платформи, базирани на облак, стават по-разпространени, фундаментните модели ще станат по-достъпни за бизнеси от всякакъв размер.
  • Нови приложения и случаи на употреба: Фундаментните модели ще продължат да се прилагат към нови и иновативни случаи на употреба в различни индустрии, от здравеопазване до финанси до образование.

Възходът на фундаментните модели представлява промяна на парадигмата в областта на изкуствения интелект. Като разбираме техните възможности, разходи и етични съображения, можем да използваме тяхната сила, за да създадем по-добро бъдеще.

Приносът на DeepSeek за демократизиране на AI

Постижението на DeepSeek в значителното намаляване на разходите за обучение на фундаментни модели бележи важен момент в демократизирането на AI. Чрез понижаване на бариерата за влизане, DeepSeek дава възможност на по-широк кръг от организации и индивиди да участват в AI революцията.

Въздействието върху по-малките бизнеси

По-малките бизнеси често нямат ресурсите и експертизата да разработят и внедрят свои собствени AI модели. Рентабилните фундаментни модели на DeepSeek предоставят на тези бизнеси достъп до най-съвременната AI технология, която преди това беше недостъпна. Това може да изравни условията на игра, позволявайки на по-малките бизнеси да се конкурират по-ефективно с по-големи, по-утвърдени компании.

Например, малък бизнес за електронна търговия може да използва моделите на DeepSeek, за да персонализира продуктовите препоръки за своите клиенти, да подобри обслужването на клиентите си или да автоматизира своите маркетингови кампании.

Овластяването на индивидуалните разработчици

Моделите на DeepSeek също така дават възможност на индивидуалните разработчици и изследователи да изследват нови AI приложения и иновации. С достъп до достъпни фундаментни модели, разработчиците могат да експериментират с различни идеи, да разработват нови AI-базирани инструменти и да допринасят за напредъка на AI технологията.

Това може да доведе до скок в иновациите, тъй като повече хора имат възможност да участват в разработването на AI.

Потенциалът за сътрудничество с отворен код

Подходът с отворен код на DeepSeek допълнително насърчава сътрудничеството и иновациите в AI общността. Като прави своите модели достъпни за обществеността, DeepSeek насърчава разработчиците да допринасят за тяхното подобрение, да идентифицират и отстраняват грешки и да разработват нови функции.

Този съвместен подход може да ускори развитието на AI технологията и да гарантира, че тя се използва за благото на всички.

Ускоряването на приемането на AI

Чрез понижаване на цената на AI, DeepSeek ускорява приемането на AI в различни индустрии. Тъй като AI става по-достъпен и достъпен, повече бизнеси ще могат да го интегрират в своите операции, което ще доведе до повишена производителност, ефективност и иновации.

Това може да има дълбоко въздействие върху глобалната икономика, стимулирайки растежа и създавайки нови възможности.

По-приобщаваща AI екосистема

Усилията на DeepSeek да демократизират AI допринасят за по-приобщаваща AI екосистема, където повече хора имат възможност да участват в разработването и използването на AI. Това може да помогне да се гарантира, че AI се използва по начин, който е от полза за всички членове на обществото, а не само за малцина избрани.

Чрез овластяване на по-малките бизнеси, индивидуалните разработчици и изследователи, DeepSeek насърчава по-разнообразен и иновативен AI пейзаж.