Расходы на ИИ: Спрос опережает рост эффективности

Первоначальный толчок: DeepSeek и мираж эффективности

Появление китайского ИИ DeepSeek в начале этого года вызвало шок в ландшафте технологических инвестиций. Его кажущийся революционным подход, обещающий мощный искусственный интеллект со значительно меньшими вычислительными затратами, немедленно породил спекуляции. Быстро сформировался нарратив: возможно, неустанное и дорогостоящее расширение инфраструктуры ИИ, характеризующееся массовыми закупками специализированных чипов и систем, вот-вот замедлится. Рынок отреагировал, отражая веру в то, что новая эра экономически эффективного ИИ может резко сократить ожидаемый бум расходов.

Однако выводы недавней встречи на высоком уровне представителей индустрии рисуют совершенно иную картину. Конференция по генеративному ИИ, созванная в Нью-Йорке Bloomberg Intelligence, показала, что первоначальная интерпретация, сосредоточенная исключительно на потенциальной экономии затрат, упустила из виду более широкую картину. Далекое от сигнализирования о замедлении расходов, мероприятие подчеркнуло почти ненасытный голод по большей мощности ИИ. Консенсус заключался не в сокращении, а в том, как удовлетворить экспоненциально растущий аппетит к интеллектуальным системам, даже при отчаянном желании, чтобы меню было менее дорогим.

Голоса с передовой: Неутолимая жажда мощностей

Дискуссии в течение всего дня мероприятия, собравшего разработчиков, стратегов и инвесторов, постоянно возвращались к теме эскалации спроса, стимулирующего монументальные инвестиции. Mandeep Singh, старший технологический аналитик Bloomberg Intelligence и один из организаторов мероприятия, лаконично отразил преобладающее настроение. Размышляя о многочисленных панельных дискуссиях и экспертных обсуждениях, он отметил универсальный рефрен: никто из участников не чувствовал, что обладает достаточной мощностью ИИ. Подавляющим было ощущение потребности в большем, а не избытка.

Важно отметить, добавил Singh, что призрак ‘инфраструктурного пузыря’, распространенный страх в быстрорастущих технологических секторах, заметно отсутствовал в разговоре. Внимание оставалось сосредоточенным на фундаментальной проблеме, стоящей перед всей отраслью. Anurag Rana, коллега Singh и старший аналитик Bloomberg Intelligence по ИТ-услугам и программному обеспечению, сформулировал это как главный вопрос: ‘Где мы находимся в этом цикле [создания инфраструктуры ИИ]?’

Признавая, что точное определение стадии этого масштабного строительства остается неуловимым (‘Никто не знает’ наверняка, признал Rana), феномен DeepSeek, несомненно, изменил перспективы. Он вселил мощную дозу надежды на то, что значительные рабочие нагрузки ИИ потенциально могут быть обработаны более экономично. ‘DeepSeek встряхнул многих людей’, - заметил Rana. Подразумевалось ясно: если сложные модели ИИ действительно могут эффективно работать на менее требовательном оборудовании, возможно, гигантские проекты, такие как инициативы на сотни миллиардов долларов, по слухам, планируемые консорциумами с участием крупных технологических игроков, могут быть пересмотрены или масштабированы иначе.

Мечта, эхом разносившаяся по всей отрасли, по словам Rana, заключается в том, чтобы операционные расходы на ИИ, особенно на inference (этап, на котором обученные модели генерируют прогнозы или контент), последовали за резкой нисходящей траекторией, наблюдавшейся в облачном хранении данных за последнее десятилетие. Он напомнил, как экономика хранения огромных объемов данных на платформах вроде Amazon Web Services (AWS) значительно улучшилась примерно за восемь лет. ‘Это падение кривой затрат… экономика была хорошей’, - заявил он. ‘И вот на что все надеются, что на стороне inference… если кривая упадет до такого уровня, о боже, темпы внедрения ИИ… будут впечатляющими’. Singh согласился, отметив, что появление DeepSeek фундаментально ‘изменило мышление каждого о достижении эффективности’.

Это стремление к эффективности было ощутимо на протяжении всех сессий конференции. В то время как многочисленные панели углублялись в практические аспекты перевода корпоративных проектов ИИ из концептуальных стадий в рабочую эксплуатацию, параллельная дискуссия постоянно подчеркивала критическую необходимость сокращения затрат, связанных с развертыванием и запуском этих моделей ИИ. Цель ясна: демократизировать доступ, сделав ИИ экономически жизнеспособным для более широкого круга приложений и пользователей. Shawn Edwards, главный технолог самого Bloomberg, предположил, что DeepSeek не был полной неожиданностью, а скорее мощной иллюстрацией всеобщего желания. ‘Это заставило меня подумать, что было бы здорово, если бы можно было взмахнуть волшебной палочкой и заставить эти модели работать невероятно эффективно’, - заметил он, распространяя это пожелание на весь спектр моделей ИИ, а не только на один конкретный прорыв.

Принцип распространения: Подпитка спроса на вычисления

Одной из основных причин, по которым эксперты ожидают продолжения существенных инвестиций в инфраструктуру ИИ, несмотря на стремление к эффективности, является само распространение моделей ИИ. Повторяющейся темой на протяжении всей нью-йоркской конференции был решительный отход от идеи единой монолитной модели ИИ, способной справиться со всеми задачами.

  • Семейное дело: Как выразился Edwards из Bloomberg: ‘Мы используем семейство моделей. Не существует такой вещи, как лучшая модель’. Это отражает растущее понимание того, что разные архитектуры ИИ преуспевают в разных задачах – генерации языка, анализе данных, распознавании изображений, дополнении кода и так далее.
  • Корпоративная кастомизация: Участники панельных дискуссий в целом согласились, что, хотя крупные ‘фундаментальные’ или ‘передовые’ модели общего назначения будут продолжать разрабатываться и совершенствоваться крупными лабораториями ИИ, реальные действия внутри бизнеса включают развертывание потенциально сотен или даже тысяч специализированных моделей ИИ.
  • Fine-tuning и проприетарные данные: Многие из этих корпоративных моделей будут адаптированы из базовых моделей с помощью процесса, называемого fine-tuning. Это включает переобучение предварительно обученной нейронной сети на специфических, часто проприетарных, данных компании. Это позволяет ИИ понимать уникальные бизнес-контексты, терминологию и взаимодействия с клиентами, предоставляя гораздо более релевантные и ценные результаты, чем могла бы дать общая модель.
  • Демократизация разработки: Jed Dougherty, представляющий платформу для науки о данных Dataiku, подчеркнул необходимость ‘вариативности среди моделей’ для корпоративных агентов ИИ. Он подчеркнул важность предоставления компаниям контроля, возможностей создания и аудируемости их инструментов ИИ. ‘Мы хотим дать инструменты для создания этих вещей в руки людей’, - утверждал Dougherty. ‘Мы не хотим, чтобы десять докторов науксоздавали всех агентов’. Это стремление к более широкой доступности в самой разработке подразумевает потребность в большей базовой инфраструктуре для поддержки этих распределенных усилий по созданию.
  • ИИ для конкретного бренда: Креативные индустрии предлагают яркий пример. Hannah Elsakr, возглавляющая новые бизнес-направления в Adobe, объяснила их стратегию, делающую ставку на кастомные модели как ключевой дифференциатор. ‘Мы можем обучить кастомные расширения моделей для вашего бренда, которые могут помочь в новой рекламной кампании’, - проиллюстрировала она, показывая, как ИИ можно адаптировать для поддержания специфической эстетики и сообщений бренда.

Помимо диверсификации моделей, растущее развертывание ИИ-агентов в корпоративных рабочих процессах является еще одним значительным драйвером спроса на обработку данных. Эти агенты рассматриваются не просто как пассивные инструменты, а как активные участники, способные выполнять многоэтапные задачи.

Ray Smith, возглавляющий направления агентов и автоматизации в Microsoft Copilot Studio, предсказал будущее, в котором пользователи будут взаимодействовать с потенциально сотнями специализированных агентов через единый интерфейс, такой как Copilot. ‘Вы не будете втискивать весь процесс в одного агента, вы разобьете его на части’, - объяснил он. Эти агенты, предположил он, по сути являются ‘приложениями в новом мире’ программирования. Видение заключается в том, что пользователи просто заявляют свою цель – ‘сказать ему, чего мы хотим достичь’ – и агент организует необходимые шаги. ‘Агентные приложения – это просто новый способ рабочего процесса’, - заявил Smith, подчеркнув, что реализация этого видения – это меньше вопрос технологической возможности (‘все это технологически возможно’) и больше вопрос ‘темпов, с которыми мы это построим’.

Этот толчок к более глубокому внедрению ИИ-агентов в повседневные организационные процессы еще больше усиливает давление на снижение затрат и эффективное развертывание. James McNiven, руководитель отдела управления продуктами в гиганте микропроцессоров ARM Holdings, сформулировал эту проблему с точки зрения доступности. ‘Как нам обеспечить доступ на все большем количестве устройств?’ - размышлял он. Наблюдая, как модели достигают возможностей почти ‘уровня доктора наук’ в конкретных задачах, он провел параллель с преобразующим воздействием внедрения мобильных платежных систем в развивающихся странах много лет назад. Основной вопрос остается: ‘Как нам донести эту [возможность ИИ] до людей, которые могут использовать эту способность?’ Предоставление сложных ИИ-агентов в качестве легкодоступных помощников широкому кругу работников требует не только умного программного обеспечения, но и эффективного оборудования и, неизбежно, больших инвестиций в базовую инфраструктуру, даже при улучшении эффективности на одно вычисление.

Препятствия масштабирования: Кремний, энергия и гиганты облаков

Даже самые широко используемые, общие фундаментальные модели размножаются с ошеломляющей скоростью, создавая огромную нагрузку на существующую инфраструктуру. Dave Brown, курирующий вычисления и сети в Amazon Web Services (AWS), сообщил, что только их платформа предлагает клиентам доступ примерно к 1800 различным моделям ИИ. Он подчеркнул интенсивную сосредоточенность AWS на ‘многом для снижения стоимости’ запуска этих мощных инструментов.

Ключевой стратегией для облачных провайдеров, таких как AWS, является разработка собственного кастомного кремния. Brown отметил растущее использование чипов, разработанных AWS, таких как их процессоры Trainium, оптимизированные для обучения ИИ, заявив: ‘AWS использует больше наших собственных процессоров, чем процессоров других компаний’. Этот шаг к специализированному, собственному оборудованию направлен на то, чтобы взять под контроль производительность и стоимость, снижая зависимость от поставщиков чипов общего назначения, таких как Nvidia, AMD и Intel. Несмотря на эти усилия, Brown откровенно признал фундаментальную реальность: ‘Клиенты делали бы больше, если бы стоимость была ниже’. Потолок спроса в настоящее время определяется больше бюджетными ограничениями, чем отсутствием потенциальных приложений.

Масштаб ресурсов, требуемых ведущими разработчиками ИИ, огромен. Brown отметил ежедневное сотрудничество AWS с Anthropic, создателями сложного семейства языковых моделей Claude. Michael Gerstenhaber, руководитель отдела интерфейсов прикладного программирования Anthropic, выступая вместе с Brown, указал на вычислительную интенсивность современного ИИ, особенно моделей, предназначенных для сложного рассуждения или ‘мышления’. Эти модели часто генерируют подробные пошаговые объяснения своих ответов, потребляя значительную вычислительную мощность. ‘Мыслящие модели приводят к использованию большого объема мощностей’, - заявил Gerstenhaber.

Хотя Anthropic активно работает с AWS над методами оптимизации, такими как ‘prompt caching’ (хранение и повторное использование вычислений из предыдущих взаимодействий для экономии ресурсов), фундаментальная потребность в оборудовании остается огромной. Gerstenhaber прямо заявил, что Anthropic нуждается в ‘сотнях тысяч ускорителей’ – специализированных чипов ИИ – распределенных ‘по многим центрам обработки данных’ просто для запуска своего текущего набора моделей. Это дает конкретное представление о чистом масштабе вычислительных ресурсов, лежащих в основе всего лишь одного крупного игрока в области ИИ.

Усугубляет проблему закупки и управления огромными парками кремния стремительно растущее энергопотребление, связанное с ИИ. Brown выделил это как критическую и быстро обостряющуюся проблему. Текущие центры обработки данных, поддерживающие интенсивные рабочие нагрузки ИИ, уже потребляют мощность, измеряемую сотнями мегаватт. Прогнозы предполагают, что будущие потребности неизбежно вырастут до гигаваттного диапазона – мощности крупных электростанций. ‘Энергия, которую он потребляет’, - предупредил Brown, имея в виду ИИ, - ‘огромна, и его след велик во многих центрах обработки данных’. Этот эскалирующий спрос на энергию представляет не только огромные операционные расходы, но и значительные экологические и логистические проблемы для размещения и энергоснабжения следующего поколения инфраструктуры ИИ.

Экономический джокер: Тень над планами роста

Несмотря на оптимистичный прогноз, обусловленный технологическими достижениями и растущими вариантами использования, над всеми прогнозами инвестиций в ИИ нависает значительная переменная: более широкий экономический климат. По завершении конференции Bloomberg Intelligence участники уже наблюдали нервозность на рынке, вызванную недавно объявленными глобальными тарифными пакетами, воспринятыми как более масштабные, чем ожидалось.

Это служит мощным напоминанием о том, что амбициозные технологические дорожные карты могут быть быстро нарушены макроэкономическими препятствиями. Rana из Bloomberg предупредил, что, хотя расходы на ИИ могут быть несколько изолированы на начальном этапе, традиционные области корпоративных ИТ-инвестиций, такие как серверы и хранилища, не связанные с ИИ, могут стать первыми жертвами экономического спада. ‘Другая важная вещь, на которой мы сосредоточены, - это расходы на технологии, не связанные с ИИ’, - отметил он, выражая обеспокоенность по поводу потенциального воздействия на крупных поставщиков технологических услуг в преддверии сезона отчетности, даже до рассмотрения бюджетов на ИИ конкретно.

Однако существует преобладающая теория, что ИИ может оказаться уникально устойчивым. Rana предположил, что финансовые директора (CFO) крупных корпораций, столкнувшись с бюджетными ограничениями из-за экономической неопределенности или даже рецессии, могут решить приоритезировать инициативы в области ИИ. Они потенциально могут перераспределить средства из менее критичных областей для защиты стратегических инвестиций в ИИ, воспринимаемых как ключевые для будущей конкурентоспособности.

Тем не менее, этот оптимистичный взгляд далек от гарантии. Окончательным испытанием, по словам Rana, будет то, сохранят ли крупные корпорации свои агрессивные цели по капитальным затратам, особенно на строительство центров обработки данных для ИИ, перед лицом растущей экономической неопределенности. Критический вопрос остается: ‘Скажут ли они: ‘Знаете что? Слишком неопределенно’’. Ответ определит, продолжит ли кажущийся неудержимым импульс расходов на инфраструктуру ИИ свой неуклонный рост или столкнется с неожиданной паузой, продиктованной глобальными экономическими реалиями.