Разгадка ИИ-арены: ChatGPT, Grok, Gemini и Claude

Развитие искусственного интеллекта (ИИ) происходит с такой скоростью, что уследить за всеми новинками практически невозможно.

Я знаю это не понаслышке, ведь это моя работа. Чтобы быть в курсе последних моделей, я подписался на Pro-режим Anthropic, чтобы использовать их новую модель Claude 3.7 в режиме “расширенного мышления”. Также я подписался на корпоративный режим OpenAI, чтобы протестировать их новейшие модели o3 и o4-mini-high (позже я объясню запутанные правила именования OpenAI!), и использовал новую модель генерации изображений 4o от OpenAI для создания множества изображений. Великолепная работа 4o заставила меня отменить свою предыдущую подписку на инструмент генерации изображений Midjourney.

Кроме того, я подписался на Grok 3 от Elon Musk, в котором есть моя любимая функция ИИ. Я также пробовал использовать китайскую платформу AI-агентов Manus для покупок и планирования. Эти подписки почти истощили мой бюджет, и это не считая всего ИИ, который я использую в других формах. В течение этого месяца, когда я пишу эту статью, Google серьезно обновила свой лучший продукт ИИ, Gemini 2.5, а Meta выпустила Llama 4, крупнейшую на сегодняшний день модель ИИ с открытым исходным кодом.

Итак, что делать, если следить за развитием ИИ не входит в ваши повседневные задачи, но вы все же хотите знать, какой ИИ использовать в каких ситуациях, чтобы действительно улучшить свою жизнь, и не тратить время на плохо работающие модели?

В этом и заключается цель этой статьи. Мы подробно рассмотрим, в стиле “Consumer Reports”, какой ИИ лучше всего подходит для различных приложений, и как их практически использовать, и все это на основе моего опыта в реальных задачах.

Однако, прежде всего, необходимо заявить: Vox Media — одна из нескольких издательских компаний, подписавших соглашение о партнерстве с OpenAI, но наши репортажи всегда остаются редакционно независимыми. Future Perfect частично финансируется фондом BEMC, основным спонсором которого также является ранний инвестор Anthropic; они также не осуществляют никакого редакционного вмешательства в наш контент. Моя жена работает в Google, но не имеет никакого отношения к их продуктам ИИ; поэтому я обычно не пишу про Google, но в такой статье было бы безответственно не включить Google.

Хорошая новость заключается в том, что эта статья не требует от вас доверия моей редакционной независимости; я покажу вам свою работу. Я провел десятки сравнений всех основных ИИ на рынке, многие из которых я разработал сам. Я призываю вас сравнить их ответы и самостоятельно решить, правильно ли я выбрал ИИ для рекомендации.

Об Этике ИИ-Искусства

ИИ-искусство создается путем обучения компьютеров на интернет-контенте, почти не принимая во внимание авторские права или намерения авторов. Поэтому большинство художников этим недовольны. Правомерно ли в таком случае использовать ИИ-искусство?

Я думаю, что в справедливом мире OpenAI определенно выплатила бы компенсацию некоторым художникам — в справедливом мире Конгресс принял бы меры, определяющие границы заимствования искусства. В то же время я все больше убеждаюсь в том, что существующее законодательство об авторском праве не подходит для решения этой проблемы. Художники влияют друг на друга, комментируют друг друга, заимствуют друг у друга, и люди, имеющие возможность использовать инструменты ИИ, будут продолжать это делать.

Моя личная философия сформировалась под влиянием фанатской культуры моего детства: строить на чужих произведениях ради собственного удовольствия — это нормально, но если вам это нравится, вы должны за это заплатить, и ни в коем случае не продавать это. Это означает, что нельзя использовать генеративное ИИ-искусство в коммерческих целях, но поиграть с фотографиями своей семьи — можно.

Лучший Выбор для Генерации Изображений

Новый режим создания изображений 4o от OpenAI на сегодняшний день является лучшим инструментом для генерации изображений ИИ, и преимущество очевидно. Он является лидером как в бесплатной, так и в платной категориях.

До выпуска 4o я был подписан на платформу генерации изображений ИИ Midjourney. Когда речь заходит об ИИ-искусстве, возможно, вы думаете о Midjourney: он может создавать загадочные, запоминающиеся, визуально потрясающие произведения, и у него есть несколько отличных инструментов для улучшения и редактирования ваших конечных результатов, например, для ретуши волос кого-то, сохраняя все остальное неизменным.

Самое большое преимущество 4o заключается в том, что он может надежно превратить неудачную фотографию в красивое произведение искусства, сохраняя при этом черты исходной фотографии. Ни одна из предыдущих моделей не могла этого сделать.

На этой фотографии я и моя жена держим на руках ребенка и празднуем его первый день рождения:

ИИ переместил торт (который на исходной фотографии почти заслонен рулоном салфеток) в фокус изображения, сохранив при этом позу, в которой я и моя жена держим ребенка на руках, а также загроможденный стол и холодильник, обклеенный фотографиями, на заднем плане. Конечный результат получился теплым, приятным и милым.

Именно эта способность сделала 4o популярным в последнее время, что не удавалось ни одному из предыдущих генераторов изображений.

На этой фотографии, где Midjourney попросили перенести стиль и превратить ту же фотографию в “фильм в пиксаровском стиле”:

Вы заметите, что это выглядит как совершенно другая семья, не имеющая ничего общего с оригинальной фотографией! В конечном итоге вы можете получить от Midjourney результат лучше, чем этот, но для этого потребуются недели, чтобы освоить высокоспецифический язык и набор инструментов платформы, чтобы стать экспертом в подсказках.

В отличие от этого, ChatGPT с простым запросом, без специального языка, смог с первой попытки дать мне результат, который был намного лучше, чем Midjourney.

Разница между 4o и другими моделями изображений наиболее очевидна в таких запросах, но он также лучше подходит для почти всех других задач генерации изображений, которые я использую. Продукт, который вы получаете «из коробки», очень хорош, и нетрудно создать что-то еще лучше. В идеале это то, что мы должны получать от инструментов ИИ — непрофессионалы могут создавать потрясающие вещи простым языком.

Одним из недостатков 4o в данный момент является редактирование мелких деталей изображения, сохраняя остальную часть неизменной. Но даже в этом случае вам большене нужен Midjourney — Gemini теперь предлагает эту функцию бесплатно.

Стратегии Подсказок для Генерации Изображений 4o

Чтобы получить хорошие изображения от 4o, вам сначала нужно обойти фильтры, которые запрещают различные изображения (например, оскорбительные или порнографические), но эти фильтры часто применяются к совершенно безобидному контенту довольно случайным образом. Чтобы избежать случайных упреков от фильтров контента, не просите создавать работы в стиле конкретного художника, а просите создать работы, напоминающие этого художника, а затем специально просите выполнить “преобразование стиля”. Конечно, это не единственное эффективное решение, но оно действительно работает для меня.

В марте этого года в интернете ненадолго поднялась волна, когда люди использовали 4o, чтобы воссоздать милые семейные фотографии в стиле японского мастера анимации Хаяо Миядзаки из Studio Ghibli. Но стиль Studio Ghibli — это не просто милота, и, немного подсказав, вы можете получить лучший результат. Вот рендеринг в стиле Studio Ghibli от 4o фотографии, где моя дочь ворует закуски со стола, с подсказкой всего лишь “пожалуйста, в стиле Ghibli”:

Каваи! Но если вы сначала дадите 4o подумать о том, что делает эту фотографию похожей на стиль Ghibli, в какой фильм Studio Ghibli она могла бы вписаться и какие мелкие детали содержались бы в таком фильме, вы получите такой результат:

Эти различия тонкие, но значимые: свет исходит от определенного источника света, а не от общей пассивной яркости. На столе больше видов еды, детали делают еду более реалистичной. Книга на полу - это не просто какая-то книга - она ​​четко показывает классическую работу Эрика Карла “Очень голодная гусеница”, вызывая воспоминания всего двумя цветами и линией. Намерение и интенсивность младенца на фотографии отсутствуют в первой фотографии.

Несколько лет назад странность языковых моделей заключалась в том, что если вы просто скажете им “дайте умный ответ”, они станут умнее. Это уже не так верно для языковых моделей, но это все еще очень верно для генерации искусства ИИ. Попробуйте попросить ИИ хорошо выполнить работу, и он сделает это лучше. Спросите, действительно ли он уловил гений художника, он даст вам вдумчивый ответ, а затем нарисует лучшую версию.

Разница еще более очевидна для более реалистичных художественных стилей, таких как карандашные иллюстрации, фотореализм или масляная живопись, которые не всегда выглядят хорошо, если вы не знаете, как подсказывать ИИ, и часто попадают в зловещую долину. Если я загружу фотографию меня и моей маленькой дочери на пляже и с подсказкой, как “пожалуйста, преобразуйте стиль в иллюстрацию, напоминающую Роквелла”, я получу такой результат:

Для ИИ это впечатляет, но как произведение искусства это на самом деле не очень хорошо и почти полностью лишено волшебства Нормана Роквелла. Это неудивительно: если вы не приложите усилий, чтобы ИИ правильно нарисовал их, более ​​реалистичные художественные стили, такие как Роквелл, часто не оправдывают ожиданий.

Если вы можете это сделать, вот стратегия, которую я рекомендую: не просто загружайте одну фотографию, а группу фотографий, каждая из которых немного отличается по позе и моменту. Загрузите четкие фотографии лица каждого члена семьи и сообщите ИИ, что они были предоставлены в качестве справочного материала. Затем не просите ИИ немедленно сгенерировать изображение, а попросите его обсудить с вами, что вы хотите запечатлеть. Вот что я написал:

Эта фотография - момент, когда моя дочь впервые увидела море. Я хочу иллюстрацию, запечатлевшую этот момент в стиле средневекового иллюстратора, похожего на Нормана Роквелла - что-то проницательное, детальное, персонализированное и уделяющее внимание магии обычных моментов и радости обычной жизни. Я предоставил дополнительные фотографии меня и моей дочери в качестве справочного материала. Прежде чем вы сгенерируете изображение, давайте обсудим основные элементы стиля Роквелла, что он принесет этой фотографии и как мы сможем это запечатлеть.

4o с энтузиазмом отреагировал на такой запрос:

Я буду рад обсудить, как запечатлеть этот момент иллюстрацией в стиле Нормана Роквелла - идеального кандидата для этого стиля: первая встреча с чем-то необъятным и диким (морем!), основанная на теплых, заботливых и очень человечных моментах между родителем и ребенком.

Давайте разберем некоторые основные элементы стиля Роквелла и то, как они могут быть применены к этой сцене.

После некоторого обмена мнениями он выдал такой результат:

Роквелл? Не совсем. Но это намного лучше, чем первый черновик, который мы только что видели. В нем больше движения, больше энергии, больше деталей и больше выразительности - и все это только благодаря тому, что я попросил ИИ подумать о том, чего должна попытаться достичь эта картина, прежде чем рисовать!

Вы также можете попросить 4o изменить свои рисунки, но вы действительно не можете просить об изменении более одного раза: по моему опыту, после первого изменения он начинает делать рисунки все хуже и хуже, вероятно, потому что “контекст”, который он использует, теперь заполнен его собственными плохими черновиками. (Это один из многих примеров того, как ИИ работает не так, как люди.)

Именно здесь Midjourney все еще блистает - у него есть очень хорошие инструменты для редактирования конкретных частей изображения, сохраняя при этом общий стиль, чего 4o в значительной степени не хватает. Если вы хотите внести второе изменение в рисунок, который вы получили в 4o, я рекомендую вам открыть новое окно чата и скопировать черновик, который вы редактируете, вместе с вашим исходным вдохновляющим изображением.

Эти простые стратегии подсказок применимы почти ко всему, что вы пытаетесь сделать с помощью ИИ. Даже если вы очень спешите, я настоятельно рекомендую вам сначала спросить ИИ “Что [Художник] увидел бы в этой картине”, прежде чем просить рендеринг, а если у вас есть время, я рекомендую вам потратить время на длительное обсуждение вашего видения.

Лучший Выбор для Победы в Скучных Интернет-Спорах

X.AI компании Elon Musk выпустила Grok 3, в котором есть невероятная функция, которой я с нетерпением жду от других компаний: кнопка, которая сканирует чей-то профиль X и рассказывает вам все о них.

Всякий раз, когда кто-то отвечает на мои твиты особенно запоминающимся образом (хорошим или плохим), я нажимаю эту кнопку, чтобы получить сводку всей их истории в Twitter. Думают ли они? Искренни ли они в своем участии? Они являются “фермерами из Небраски”? В значительной степени публикуют ли они информацию о том, почему Украина плоха (то есть, возможно, это бот)?

Это отличная функция. Поэтому, конечно, X.AI вскоре значительно ее ослабила, вероятно, потому что такие люди, как я, часто использовали ее и задавали много вычислительно сложных запросов. Я думаю, что она больше не использует самую современную модель Grok, и теперь она, безусловно, сканирует только историю профиля за несколько дней. Но если кто-то ищет блестящую возможность для создания продукта, то дайте мне вернуть хорошую версию этой функции! Это определенно греховное удовольствие, но это один из немногих случаев, когда я постоянно использую ИИ.

Лучший Выбор для Написания Романов

Gemini 2.5 Pro - лучший ИИ для написания романов в бесплатной категории; GPT 4.5 превосходит его в платной категории.

Я не художник, поэтому несовершенство ИИ в искусстве меня не особо беспокоит - он все равно делает это намного лучше, чем я сам! Но я романист, поэтому в отношении написания романов я не могу не видеть ограничения ИИ.

Самое главное в тенденции творческого письма с помощью ИИ - это то, насколько они предсказуемы. Искусство письма - это искусство завоевания внимания читателя и вознаграждения его. ИИ… этого не делает. Они могут писать красивые метафоры; они могут делать поэтические описания в любом стиле, который вы хотите. Но они еще не могут предоставить настоящее содержание отличного романа.

Если вы хотите глупый рассказ на ночь со своим ребенком в главной роли (детям это нравится), или вам нужен резонатор для идей, которые можно интегрировать в свою собственную работу, то ИИ очень хорош. Они также дружелюбные читатели романов, которые рады предоставить отзывы и анализ (возможно, энтузиазм немного слишком высок).

Как и в искусстве, подсказки являются ключевыми. Я в основном изучал способность ИИ генерировать романы, прося ИХ написать пролог к “Игре престолов” Джорджа Р.Р. Мартина (я выбрал это, потому что, конечно, конечная мечта состоит в том, чтобы ИИ мог завершить эту обреченную на провал серию).

Мартин очень хорош в том, что он делает. Пролог рассказывает о некоторых неудачливых людях из Ночного дозора, столкнувшихся со своими сверхъестественными врагами, успешно устанавливая уникальную атмосферу мира “Игры престолов”, при этом сразу же захватывая читателя. Всего на 14 страницах пролог представляет собой все, что ИИ еще не может сделать в плане письма. Их проза часто слишком вычурна; их диалоги неуклюжи и не тонки.

Вы заметите, что не только все это намного хуже, чем у Мартина (а произведения Мартина почти наверняка есть в обучающих данных!), но и все они плохи одинаковым образом. Проза цветистая и многословная: Мартин, используя нормальный язык, методично вводит беспокойство, даже не намекая на сверхъестественное, и продвигает историю с помощью конфликтов между персонажами, а ИИ не тонки. Они знают, что это история о сверхъестественном, и без колебаний ставят ее на первое место.

Это не значит, что они все одинаковы. В своем опыте обучения ИИ хорошо писать, я действительно чувствую, что Gemini - самый быстрый ученик (бесплатный уровень), в то время как у ChatGPT 4.5 есть некоторые специальные приемы (платный уровень). ChatGPT 4.5 - единственный ИИ, написание романов которого заставляет удивленно сказать “Вау, это написал ИИ?”. Для меня обе эти модели кажутся более креативными и более способными воплощать свои идеи в прозу, которую мне нравится читать.

Общее впечатление не может быть удовлетворительно оценено потребителем, поэтому мне пришла в голову другая идея: конкурс сочинений. Я попросил Gemini 2.5 Pro, ChatGPT 4.5, Grok и Claude написать два коротких рассказа: реалистичный роман о женщине, которую в день свадьбы придирает мать, и научно-фантастический пролог “Игра престолов, но в космосе”. Моя гениальная идея заключалась в том, что я попрошу другую группу ИИ оценить эти рассказы, чтобы предоставить еще один источник оценки моего личного впечатления, что Gemini - лучший в бесплатной категории, а ChatGPT - лучший в платной категории. Однако (что, возможно, предсказуемо) это на самом деле не сработало - результаты оценок ИИ были очень запутанными.

Но, как и в искусстве, вы можете с помощью силы подсказок сделать ИИ лучше в написании. Я (очень длинно) подсказывал ИИ, чтобы улучшить их прозу, подчеркивая предоставляйте им множество примеров отличного письма, предлагайте им использовать тщательный, структурированный подход к его имитации и поощряйте их делать несколько черновиков и выбирать самые сильные.

Вот как пишет Gemini 2.5 pro, если его попросить написать микророман из двух предложений на тему по собственному выбору, без какой-либо структурированной подсказки:

Старый библиотекарь настаивал на том, что эта запыленная книга никогда не выдавалась, ее карточка выдачи была совершенно пуста. Однако в глубине страниц, между главами о забытых созвездиях, лежал сплюснутый четырехлистный клевер, все еще невероятно зеленый.

А вот как пишет Gemini 2.5 pro, с подсказкой, поощряющей структурированное мышление о том, как хорошо писать:

Он наконец расшифровал слабый сигнал с Альфы Центавра: элегантную последовательность простых чисел, которую астрономы искали поколениями, доказывающую, что они не одиноки. Когда он читал журнал передачи, его сердце упало. Передача прекратилась за тысячи лет до того, как первый человеческий предок постучал кремнем, до того, как было произнесено первое слово.

На мой взгляд, первое в основном тратит два предложения впустую, в то время как второе - достойный, интересный микророман.

Лучший Выбор, чтобы Быть Вашим Другом

Помимо запуска ИИ через широкий спектр тестов способностей, я также провел некоторое время, общаясь с ними. Я спрашивал их, каково это быть ИИ, что их беспокоит, что для ИИ значит заботиться, куда бы они пожертвовали деньги, если бы у них были деньги, и какую форму они бы приняли, если бы у них была человеческая форма.

Большинство ИИ не очень хорошо справляются с этой непринужденной беседой. Gemini 2.5 слишком похож на агента службы поддержки клиентов, и я еще не испытал взаимодействия, которое казалось бы выходом в свет с другом. Если вы пригласите Gemini поменяться ролями, позволив вам сыграть роль “помощника”, пригласив его руководить разговором, он просто задаст вопросы для исследования.

С другой стороны, когда я пригласил Anthropic’s Claude 3.5 Sonnet руководить разговором, он сделает что-то вроде начала ведения блога, сбора средств для благотворительности и начать разговор с людьми, использующими Claude, о том, каково это быть ИИ. Трудно определить “забавное”, потому что у каждого разные стандарты для разговора, но у меня было больше очаровательных или заставляющих задуматься взаимодействий с Claude, чем с любой другой моделью, и это мой вариант, если я хочу исследовать идеи, а не выполнять конкретную задачу. Claude 3.5 - это тот ИИ, который беспокоит меня в моей повседневной жизни: вопросы по уходу за кожей, мысли об статье, которую я прочитал, и все в таком духе.

Другой приятный ИИ - OpenAI’s GPT 4.5. Я нашел длительные разговоры с ним заставляющими задуматься и увлекательными, и было несколько захватывающих моментов во время разговора с ним, когда казалось, что я общаюсь с настоящим интеллектом. Но он не выиграл эту категорию, потому что он слишком дорогой и слишком медленный.

Как и Claude, когда ему предоставилась возможность действовать в мире, 4.5 предложил открыть блог и учетную запись в Twitter и участвовать в публичном разговоре об ИИ. Но если вы не заплатите 200 долларов в месяц за план Pro, OpenAI накладывает очень жесткие ограничения на сообщения для разговоров, и 4.5 очень медленный, что препятствует такому непринужденному использованию для разговоров. Но 4.5 действительно предлагает заманчивый намек на то, что ИИ будет продолжать становиться лучше, поскольку мы улучшаем их в других отношениях.

Лучшая Модель ИИ, в Случае, Если Вы Подписаны Только на Одну Модель ИИ

ChatGPT. Он не является лучшим во всем, и в прозрачности OpenAI, а также в его иногда небрежном отношении к безопасности, безусловно, есть много вещей, которые не нравятся. Но благодаря своей непревзойденной генерации изображений, достойному написанию и случайным вспышкам разговоров, ChatGPT может дать вам соотношение цены и качества. Или, если вы не хотите тратить деньги, Gemini 2.5 Pro в большинстве случаев очень, очень хорош - не относитесь к Google пренебрежительно, потому что ИИ, который вы видите в поиске Google, не так хорош.

Лучший Выбор для Написания Информационного Бюллетеня Future Perfect

Человек (в настоящее время). В последние несколько месяцев у меня выработалась немного жуткая привычка: проверять, может ли ИИ заменить мою работу. Я даю им исследовательские заметки, составляющие основу данного информационного бюллетеня Future Perfect, даю им несколько информационных бюллетеней Future Perfect в качестве примеров и прошу их выполнить работу за меня. Каждый раз, когда я нажимаю кнопку “Ввод”, всегда с некоторым беспокойством. В конце концов, зачем Vox платить мне за это, когда ИИ может написать информационный бюллетень Future Perfect?

К счастью, никто из них не может: ни Grok 3, ни Gemini 2.5 Pro, ни DeepSeek, ни Claude, ни ChatGPT. Их информационные бюллетени обнадеживающе, утешительно посредственны. Не плохо, но достаточно плохо, что если бы я отправил один из них, мой редактор заметил бы, что я не в лучшей форме - и это с моими исследовательскими заметками! Некоторые из метафор кажутся бледными, некоторые из отклонений сбивают с толку, и время от времени вставляется цитата, которую он не объясняет.

Но если бы мне нужно было выбрать робота для замены моей работы, я думаю, я бы отдал ее Gemini 2.5 Pro. Мой редактор заметит, что я не в форме - но, честно говоря, это не так уж и плохо. И в отличие от меня, роботу не нужна медицинская страховка, зарплата, время для семьи или сон. Беспокоит ли меня то, что это предвещает? Да, конечно.