Дженсън Хуанг за AI модела на DeepSeek

Революцията на разсъжденията: Промяна на парадигмата в AI изчисленията

В интервю за CNBC с Джим Креймър в сряда, по време на годишната GTC конференция на Nvidia, главният изпълнителен директор Дженсън Хуанг разясни дълбоките последици от иновативния модел за изкуствен интелект на китайския стартъп DeepSeek. Противно на преобладаващите предположения в индустрията, Хуанг подчерта, че този революционен модел изисква значително повече изчислителна мощност, а не по-малко.

Хуанг похвали R1 модела на DeepSeek като ‘фантастичен’, подчертавайки неговия пионерски статус като ‘първия reasoning модел с отворен код’. Той обясни уникалната способност на модела да анализира проблеми стъпка по стъпка, да генерира различни потенциални решения и стриктно да оценява правилността на своите отговори.

Тази способност за разсъждение, обясни Хуанг, е в основата на увеличеното изчислително търсене. ‘Този reasoning AI консумира 100 пъти повече изчисления от AI, който не разсъждава’, заяви той, подчертавайки рязката разлика с широко разпространените очаквания в индустрията. Това разкритие оспорва общоприетото схващане, че напредъкът в AI моделите неизменно води до по-голяма ефективност и намалени изчислителни нужди.

Разпродажбата през януари: Погрешно тълкуване на иновациите

Представянето на модела на DeepSeek в края на януари предизвика драматична пазарна реакция. Последва масова разпродажба на акции на AI компании, подхранвана от опасенията на инвеститорите, че моделът може да постигне паритет на производителността с водещите конкуренти, като същевременно консумира по-малко енергия и финансови ресурси. Nvidia, доминираща сила на пазара на AI чипове, претърпя зашеметяващ спад от 17% в една търговска сесия, изтривайки близо 600 милиарда долара пазарна капитализация – най-големият еднодневен спад за която и да е американска компания в историята.

Тази пазарна реакция обаче произтича от погрешно тълкуване на истинската същност на модела. Докато R1 моделът на DeepSeek наистина представлява значителен скок напред в AI възможностите, неговият подход, ориентиран към разсъжденията, изисква значително увеличение на изчислителната мощност, факт, който първоначално беше пренебрегнат от много инвеститори.

GTC конференцията на Nvidia: Разкриване на бъдещето на AI инфраструктурата

Хуанг също използва интервюто като възможност да обсъди някои от ключовите съобщения, направени от Nvidia на нейната GTC конференция. Тези съобщения, каза той, подчертават ангажимента на компанията да изгради инфраструктурата, необходима за подкрепа на процъфтяващата AI революция.

Ключови области на фокус, подчертани от Хуанг, включват:

  • AI инфраструктура за роботика: Nvidia активно разработва специализирана AI инфраструктура, съобразена с уникалните изисквания на приложенията за роботика. Това включва хардуерни и софтуерни решения, предназначени да ускорят разработването и внедряването на интелигентни роботи в различни индустрии.

  • Enterprise AI решения: Признавайки трансформиращия потенциал на AI за бизнеса, Nvidia изгражда стратегически партньорства с водещи доставчици на корпоративни технологии. Тези сътрудничества имат за цел да интегрират AI технологиите на Nvidia в корпоративните работни процеси, повишавайки производителността, ефективността и вземането на решения.

    • Dell: Nvidia работи с Dell, за да предостави на бизнеса мощни AI-сървъри и работни станции, оптимизирани за широк спектър от AI натоварвания.
    • HPE: Партньорството с HPE се фокусира върху предоставянето на високопроизводителни изчислителни решения за AI, позволявайки на предприятията да се справят със сложни AI предизвикателства.
    • Accenture: Nvidia си сътрудничи с Accenture, за да помогне на бизнеса в различни индустрии да приеме и внедри AI решения, използвайки консултантския опит на Accenture и технологичната платформа на Nvidia.
    • ServiceNow: Интегрирането на AI възможностите на Nvidia с платформата на ServiceNow има за цел да автоматизира и оптимизира управлението на IT услугите, повишавайки ефективността и потребителското изживяване.
    • CrowdStrike: Nvidia си партнира с CrowdStrike за подобряване на решенията за киберсигурност с AI, позволявайки по-бързо и по-ефективно откриване и реагиране на заплахи.

AI бумът: От генеративни към reasoning модели

Хуанг също предложи своята гледна точка за по-широкия AI пейзаж, отбелязвайки забележима промяна във фокуса от чисто генеративни AI модели към такива, включващи възможности за разсъждение.

  • Генеративен AI: Тази по-ранна вълна на AI се фокусира върху създаването на ново съдържание, като текст, изображения и аудио, въз основа на научени модели от съществуващи данни. Макар и впечатляващи, генеративните AI модели често не разполагаха със способността да разсъждават, да разбират контекста или да решават сложни проблеми.

  • Reasoning AI: Появата на reasoning модели като R1 на DeepSeek бележи значителна стъпка напред. Тези модели могат да анализират информация, да правят изводи и да решават проблеми по по-човекоподобен начин, отваряйки нови възможности за AI приложения.

Прозренията на Хуанг подчертават динамичния характер на AI областта, като непрекъснатите иновации стимулират разработването на все по-сложни и способни модели.

Възможност за трилион долара: Бъдещето на AI изчисленията

Гледайки напред, Хуанг прогнозира драматично разширяване на глобалните капиталови разходи за изчисления, водено предимно от ескалиращите изисквания на AI. Той очаква тези разходи да достигнат зашеметяващите един трилион долара до края на десетилетието, като лъвският пай ще бъде посветен на инфраструктура, свързана с AI.

‘И така, нашата възможност като процент от трилион долара до края на това десетилетие е доста голяма’, отбеляза Хуанг, подчертавайки огромния потенциал за растеж на Nvidia в този бързо развиващ се пейзаж. ‘Имаме много инфраструктура за изграждане.’

Тази смела прогноза отразява увереността на Nvidia в трансформиращата сила на AI и нейния ангажимент да предостави основните технологии, които ще подкрепят тази революция. Тъй като AI моделите продължават да напредват, особено в областта на разсъжденията, търсенето на високопроизводителна изчислителна инфраструктура е готово да се увеличи, създавайки безпрецедентни възможности за компании като Nvidia, които са в челните редици на тази технологична граница.

По-дълбоко потапяне: Значението на Reasoning модела на DeepSeek

За да оценим напълно последиците от забележките на Хуанг, е изключително важно да се задълбочим в същността на R1 модела на DeepSeek и неговите възможности за разсъждение.

Какво е Reasoning модел?

За разлика от традиционните AI модели, които разчитат предимно на разпознаване на модели и статистически корелации, reasoning моделите са проектирани да имитират човешки когнитивни процеси. Те могат:

  • Да анализират информация: Да разбиват сложни проблеми на по-малки, управляеми стъпки.
  • Да правят изводи: Да правят логически изводи въз основа на наличните доказателства.
  • Да оценяват решения: Да оценяват валидността и коректността на потенциалните отговори.
  • Да се адаптират към нова информация: Да коригират своя процес на разсъждение въз основа на нови данни или обратна връзка.

Тези възможности позволяват на reasoning моделите да се справят с проблеми, които са извън обхвата на традиционните AI подходи. Те могат да се справят с неяснота, несигурност и непълна информация, което ги прави подходящи за по-широк спектър от приложения в реалния свят.

Защо разсъжденията изискват повече изчисления?

Увеличените изчислителни изисквания на reasoning моделите произтичат от няколко фактора:

  • Многостъпкова обработка: Разсъжденията включват поредица от взаимосвързани стъпки, всяка от които изисква изчислителни ресурси.
  • Изследване на множество възможности: Reasoning моделите често изследват множество потенциални решения, преди да стигнат до оптималното.
  • Представяне на знания: Reasoning моделите изискват сложни начини за представяне и манипулиране на знания, което може да бъде изчислително интензивно.
  • Проверка и валидиране: Строгата оценка на решенията допринася за изчислителното натоварване.

По същество reasoning моделите правят компромис с изчислителната ефективност за сметка на подобрени когнитивни способности. Те дават приоритет на способността да решават сложни проблеми пред минимизирането на потреблението на ресурси.

По-широкото въздействие: Последици за AI индустрията

Коментарите на Хуанг за модела на DeepSeek и бъдещето на AI изчисленията имат широкообхватни последици за индустрията:

  • Повишено търсене на специализиран хардуер: Възходът на reasoning моделите ще стимулира търсенето на специализиран хардуер, като GPU и AI ускорители, които могат ефективно да се справят с изчислителните изисквания на тези модели.
  • Фокус върху AI инфраструктурата: Компаниите ще трябва да инвестират сериозно в AI инфраструктура, за да подкрепят разработването и внедряването на reasoning модели.
  • Промяна в приоритетите на AI изследванията: Успехът на модела на DeepSeek вероятно ще стимулира по-нататъшни изследвания в AI подходите, базирани на разсъждения.
  • Нови възможности за AI приложения: Reasoning моделите ще отключат нови възможности за AI в области като научни открития, финансово моделиране и медицинска диагностика.
  • Конкуренция и иновации: Надпреварата за разработване на по-мощни и ефективни reasoning модели ще засили конкуренцията и ще стимулира иновациите на пазара на AI чипове.

AI пейзажът се развива бързо и прозренията на Хуанг предоставят ценен поглед към бъдещето на тази трансформираща технология. Възходът на reasoning моделите представлява важен етап, проправяйки пътя за AI системи, които могат да се справят с все по-сложни проблеми и да отключват нови граници на иновациите. Nvidia, със своя фокус върху високопроизводителните изчисления и AI инфраструктурата, е в добра позиция да играе централна роля в тази вълнуваща еволюция. Ангажиментът на компанията да изгради ‘инфраструктурата на бъдещето’ подчертава нейната вяра в трансформиращата сила на AI и неговия потенциал да преобрази индустриите и да предефинира границите на възможното.