Амбиции Google в сфере ИИ: стратегия Apple

Google все больше стремится быть похожей на Apple, особенно в области больших генеративных моделей ИИ (GenAI). Недавняя конференция Google Cloud Next продемонстрировала амбициозное видение Google. Оно включает в себя инновации, начиная от чипа TPU v7 Ironwood, призванного конкурировать с Nvidia GB200, и заканчивая протоколом Agent2Agent (A2A), направленным на превосходящий MCP от Anthropic, а также средой исполнения Pathways для развертывания GenAI.

Google также активно разрабатывает инструменты, такие как ADK и Agentspace, чтобы дать разработчикам возможность создавать агентов ИИ. Центральное место в этих усилиях занимает Vertex AI, облачная платформа Google для разработки и развертывания ИИ. Vertex AI теперь предлагает широкий спектр услуг по созданию контента, включая Veo 2 для видео, Imagen 3 для изображений, Chirp 3 для аудио и Lyria для музыки. Очевидно, что Google Cloud позиционирует себя как поставщик комплексного набора приложений для разработки больших моделей GenAI для разработчиков и пользователей.

Хотя фактическая пригодность этих сервисов и возможностей еще предстоит оценить, Google создала полную, мультимодальную экосистему аппаратного и программного обеспечения ИИ, которая является собственной разработкой, имеет закрытый исходный код и легко доступна.

Этот комплексный подход рисует картину Google как Apple эпохи ИИ.

Ironwood TPU: Мощный претендент

Особого внимания заслуживает представление чипа TPU седьмого поколения, Ironwood.

  • Каждый TPU оснащен 192 ГБ памяти HBM с пропускной способностью от 7,2 до 7,4 ТБ/с, вероятно, с использованием технологии HBM3E. Это выгодно отличается от чипа Nvidia B200, который предлагает пропускную способность 8 ТБ/с.
  • Каждый TPU v7 с жидкостным охлаждением может достигать 4,6 петафлопс плотной вычислительной мощности FP8. Это несколько меньше, чем 20 петафлопс B200.
  • Однако сеть центров обработки данных Jupiter от Google позволяет масштабироваться для поддержки до 400 000 чипов или 43 кластеров TPU v7x. Опыт Google в области серверных технологий позволяет ей не акцентировать внимание на показателях производительности одного чипа.
  • Ключевым моментом является то, что Google представила Pathways, специальную среду исполнения ИИ, которая повышает гибкость развертывания модели GenAI, еще больше укрепляя ее преимущества в области кластеров сервисов.
  • Ironwood доступен в двух конфигурациях кластера: 256 чипов или 9216 чипов, адаптированных к конкретным задачам. Один кластер может достигать вычислительной мощности 42,5 эксафлопс. Google утверждает, что эта производительность превосходит самый большой суперкомпьютер в мире, El Capitan, в 24 раза. Однако этот показатель измеряется с точностью FP8, а AMD El Capitan еще не предоставила данные о точности FP8. Google признала это, что затрудняет прямое сравнение.

Принятие экосистемы GenAI с закрытым исходным кодом

Google придерживается комплексной экосистемы с закрытым исходным кодом в области GenAI. Хотя Gemma с открытым исходным кодом имеет свои преимущества, Google направляет ресурсы на свои решения с закрытым исходным кодом.

В связи с ростом интереса к агентам ИИ Google объявила на конференции о протоколе A2A, заручившись поддержкой 50 основных поставщиков для конкуренции с MCP от Anthropic.

В то время как OpenAI предоставила SDK для агентов с открытым исходным кодом, интегрируя свои возможности больших моделей, Google расширяет Vertex AI с помощью ADK, Agentspace, AutoML, AIPlatform и Kubeflow, внедряя различные возможности моделей.

Однако, если сравнить генерацию изображений GPT-4o с эквивалентными функциями Gemini 2.0 Flash, предложения Google, хотя и амбициозные, могут быть недостаточно отшлифованы. Интеграция многочисленных моделей, сервисов и инструментов, хотя и полезна для конкуренции, может показаться преждевременной. Рынку нужны зрелые, хорошо интегрированные мультимодальные большие модели и сервисы внутри моделей.

Воспроизведение модели Gmail, Chrome и Google в ИИ

Успех Google с Gmail, Chrome и ее подходом “трехступенчатой ракеты” позволил ей доминировать на мировом технологическом рынке. Эта стратегия быстро реализуется в области GenAI. Однако, в отличие от своей прежней поддержки открытого исходного кода, Google все больше склоняется к разработке с закрытым исходным кодом.

Google эффективно превращает открытый исходный код в форму закрытого исходного кода, консолидируя свои ресурсы для создания доминирующей экосистемы в определенной области, а затем взимая плату. Этот подход сталкивается с растущей критикой со стороны разработчиков.

Фреймворки машинного обучения Google с открытым исходным кодом, TensorFlow и Jax, достигли глобального успеха. Однако новая среда исполнения Pathways имеет закрытый исходный код, даже изолируя инструменты разработки CUDA от Nvidia.

Google против Nvidia: Битва за доминирование в области ИИ

Поскольку Nvidia выступает за Physical AI и представляет общую модель гуманоидного робота с открытым исходным кодом Isaac GR00T N1, Google DeepMind выходит на рынок с Gemini Robotics и Gemini Robotics-ER на базе Gemini 2.0.

В настоящее время Google не хватает присутствия только на рынке настольных компьютеров с ИИ. Как DGX Spark от Nvidia (ранее Project DIGITS) и DGX Station, а также Mac Studio от Apple будут конкурировать с облачными сервисами Google? Этот вопрос стал центром внимания в отрасли после конференции.

Зависимость Apple от Google Cloud и чипа M3 Ultra

Сообщается, что Apple использует кластеры TPU Google Cloud для обучения своих больших моделей, даже отказавшись от решений для обучения на чипах Nvidia из-за соображений стоимости! Несмотря на слабые места в программном обеспечении, Apple уделяет особое внимание своим чипам серии M. Новейший Mac Studio, оснащенный чипом M3 Ultra, теперь может похвастаться до 512 ГБ унифицированной памяти. Потенциальное раннее внедрение Apple технологии Pathways от Google могло согласовать ее с Google.

Антимонопольный фактор

Основная проблема связана с антимонопольными опасениями. В настоящее время бизнес-модель Apple занимает уникальную позицию для защиты от глобальных антимонопольных исков, в отличие от Microsoft и Google, которым грозит потенциальный распад. Размер Google подвергает ее риску принудительного отказа от основных бизнесов операционной системы Android и браузера Chrome.

Google недавно прекратила поддержку проекта Android Open Source Project (AOSP), что делает переход к модели Apple неизбежным в эпоху ИИ. По мере появления прорывов в области ИИ стратегический сдвиг Google становится все более очевидным.

Дополнительная информация о Google TPU v7 Ironwood

Более глубокое изучение спецификаций TPU v7 Ironwood показывает тщательно спроектированное аппаратное обеспечение. 192 ГБ памяти High Bandwidth Memory (HBM) являются важнейшим компонентом, обеспечивающим быстрый доступ к данным, который необходим для обучения и запуска сложных моделей ИИ. Предполагаемое использование технологии HBM3E подчеркивает стремление Google использовать передовые достижения в области технологий памяти. Пропускная способность 7,2-7,4 ТБ/с - это не просто впечатляющее число; оно напрямую преобразуется в более быстрое время обработки и возможность работы с большими и более сложными наборами данных.

Сравнение с Nvidia B200 неизбежно, учитывая доминирование Nvidia на рынке графических процессоров. В то время как B200 предлагает немного более высокую пропускную способность 8 ТБ/с, Ironwood стремится отличиться общей системной архитектурой и интеграцией в экосистему Google.

4,6 петафлопс плотной вычислительной мощности FP8 - это показатель способности чипа выполнять операции с плавающей запятой, которые являются основополагающими для вычислений ИИ. Разница по сравнению с 20 петафлопсами B200 подчеркивает различные философии проектирования. Google делает упор на масштабируемость и интеграцию своих TPU в инфраструктуру центров обработки данных, в то время как Nvidia фокусируется на необработанной вычислительной мощности на уровне чипа.

Значение сети центров обработки данных Jupiter от Google

Сеть центров обработки данных Jupiter от Google является важным активом, обеспечивающим беспрепятственное подключение огромного количества чипов TPU. Возможность поддержки до 400 000 чипов или 43 кластеров TPU v7x подчеркивает масштаб работы Google. Эта масштабируемость является ключевым отличием, поскольку она позволяет Google распределять рабочие нагрузки по массивной инфраструктуре, оптимизируя производительность и эффективность.

Опыт Google в области серверных технологий является решающим фактором в ее стратегии ИИ. Отдавая приоритет производительности на уровне системы, а не спецификациям отдельных чипов, Google может использовать свою инфраструктуру для достижения превосходных результатов. Этот подход особенно актуален в контексте масштабного обучения моделей ИИ, где возможность распределять вычисления по сети взаимосвязанных процессоров имеет важное значение.

Представляем среду исполнения AI Pathways

Внедрение Pathways - это стратегический шаг, который повышает гибкость и эффективность развертывания модели GenAI. Эта специализированная среда исполнения ИИ позволяет разработчикам оптимизировать свои модели для инфраструктуры Google, в полной мере используя доступные аппаратные и программные ресурсы.

Pathways представляет собой значительную инвестицию в программный стек ИИ, предоставляя унифицированную платформу для развертывания и управления моделями ИИ. Упрощая процесс развертывания, Google стремится снизить барьер входа для разработчиков и стимулировать внедрение своих сервисов ИИ. Это, в свою очередь, будет стимулировать инновации и создаст динамичную экосистему вокруг платформы ИИ Google.

Более глубокое понимание стратегии с закрытым исходным кодом Google

Переход Google к стратегии с закрытым исходным кодом в области GenAI - это обдуманный выбор, который отражает ее долгосрочное видение ИИ. В то время как Gemma с открытым исходным кодом внесла ценный вклад в сообщество ИИ, Google явно отдает приоритет своим решениям с закрытым исходным кодом, признавая, что они предлагают больший контроль и возможности настройки.

Сосредоточившись на разработке с закрытым исходным кодом, Google может оптимизировать свои модели ИИ и инфраструктуру для конкретных задач, обеспечивая максимальную производительность и эффективность. Этот подход также позволяет Google защищать свою интеллектуальную собственность и поддерживать конкурентное преимущество в быстро развивающейся области ИИ.

Подход с закрытым исходным кодом не лишен критики, которая утверждает, что он подавляет инновации и ограничивает сотрудничество. Однако Google утверждает, что это необходимо для обеспечения качества, безопасности и надежности своих сервисов ИИ.

Протокол A2A и битва за доминирование агента ИИ

Появление агентов ИИ создало новую площадку для сражений в индустрии ИИ, и Google полна решимости быть лидером в этой области. Объявление о протоколе A2A на конференции Google Cloud Next является четким указанием на амбиции Google.

Заручившись поддержкой 50 основных поставщиков для поддержки протокола A2A, Google пытается создать единый стандарт для связи агентов ИИ. Это позволит агентам ИИ с разных платформ беспрепятственно взаимодействовать, создавая более взаимосвязанную и совместную экосистему ИИ.

Конкуренция с MCP от Anthropic является ключевым аспектом стратегии агента ИИ Google. Anthropic - уважаемая исследовательская компания в области ИИ, и ее протокол MCP завоевал популярность в отрасли. Протокол A2A от Google представляет собой прямой вызов MCP, и исход этой конкуренции окажет значительное влияние на будущее агентов ИИ.

Vertex AI: Комплексная платформа для разработки ИИ

Google Vertex AI - это комплексная платформа для разработки ИИ, которая предоставляет разработчикам широкий спектр инструментов и сервисов. Интегрируя ADK, Agentspace, AutoML, AIPlatform и Kubeflow, Google создает универсальный магазин для разработки ИИ.

Vertex AI стремится упростить процесс разработки ИИ, облегчая разработчикам создание, обучение и развертывание моделей ИИ. Платформа также предоставляет доступ к обширной библиотеке предварительно обученных моделей, что позволяет разработчикам быстро внедрять возможности ИИ в свои приложения.

Интеграция различных возможностей модели является ключевым преимуществом Vertex AI. Предлагая широкий спектр моделей, Google обслуживает широкий спектр случаев использования, от распознавания изображений до обработки естественного языка. Этот комплексный подход делает Vertex AI привлекательным выбором для разработчиков, которым нужна универсальная и мощная платформа для разработки ИИ.

Интеграция моделей Google: амбиции против исполнения

В то время как стремление Google интегрировать многочисленные модели, сервисы и инструменты заслуживает похвалы, исполнение может потребовать дальнейшего уточнения. Рынок требует зрелых, хорошо интегрированных мультимодальных больших моделей и сервисов внутри моделей. Текущие предложения Google, хотя и многообещающие, могут нуждаться в дальнейшей доработке, чтобы соответствовать этим ожиданиям.

Интеграция различных возможностей ИИ - сложная задача, и Google сталкивается с проблемой обеспечения беспрепятственной совместной работы различных моделей и сервисов. Это требует пристального внимания к деталям и стремления к постоянному совершенствованию.

В конечном счете, успех усилий Google по интеграции моделей будет зависеть от ее способности обеспечить пользовательский интерфейс, который будет одновременно мощным и интуитивно понятным. Это потребует глубокого понимания потребностей пользователей и неустанного внимания к качеству.