Поэтапные улучшения, астрономические затраты
GPT-4.5 может похвастаться усовершенствованиями в нескольких ключевых областях. OpenAI заявляет об улучшении точности, снижении склонности к ‘галлюцинациям’ (генерации ложной информации) и повышении способности убеждать. Однако эти улучшения обходятся дорого. Ценовая структура использования GPT-4.5 установлена на уровне 75 долларов США за миллион входных токенов и ошеломляющие 150 долларов США за миллион выходных токенов. Такое ценообразование вызвало ожесточенные дебаты в сообществе AI, причем мнения экспертов резко разделились относительно того, оправдывают ли постепенные улучшения такие значительные финансовые затраты.
Ключевой вопрос вращается вокруг фактической ценности GPT-4.5. Хотя более плавное общение и немного улучшенная точность приветствуются, остается фундаментальный вопрос: представляет ли это значительный скачок вперед в возможностях AI или это просто дорогостоящее усовершенствование существующей технологии?
Тестирование в реальных условиях: несоответствие заявлениям OpenAI?
Независимые оценки GPT-4.5 еще больше подогрели дебаты. Андрей Карпати, видный деятель в области AI, провел сравнительный эксперимент, противопоставив GPT-4 и GPT-4.5. Пользователям было предложено пять заданий по креативному письму, после чего их попросили оценить качество результата. Удивительно, но результаты оказались в пользу более старой модели GPT-4 в четырех из пяти задач. Этот результат напрямую ставит под сомнение утверждение о том, что GPT-4.5 представляет собой универсально превосходящую итерацию.
Технические оценки доктора Раджа Дандекера дали столь же тревожные результаты. Его тесты были сосредоточены на областях, в которых OpenAI явно заявляла об улучшениях, таких как математические рассуждения и логический вывод. Однако, как сообщается, GPT-4.5 испытывал трудности в этих областях, демонстрируя незначительное преимущество или вообще не имея его по сравнению со своим предшественником. Эти выводы напрямую противоречат утверждениям OpenAI и поднимают серьезные вопросы о прозрачности и точности маркетинговых заявлений компании.
Реакция СМИ и отрасли: спектр мнений
Реакция СМИ на GPT-4.5 отразила разделение мнений в сообществе AI. Журнал Wired, видный голос в технологической журналистике, предложил критическую точку зрения, поставив под сомнение неустанное стремление OpenAI к Artificial General Intelligence (AGI) и охарактеризовав GPT-4.5 как дорогостоящее обновление с лишь незначительными улучшениями. Futurism, другое влиятельное издание, отметило снижение первоначального ажиотажа вокруг релиза, предполагая растущий скептицизм в отношении истинного потенциала технологии.
Однако не все реакции были отрицательными. Джейкоб Ринтамаки, связанный со Стэнфордским университетом, предложил более позитивную оценку, особо отметив улучшенное чувство юмора GPT-4.5. Он утверждал, что это представляет собой значительный шаг вперед в способности AI понимать социальные взаимодействия и участвовать в них. Это подчеркивает потенциальную нишу для GPT-4.5: превосходство в областях, где первостепенное значение имеют тонкое общение и чувство юмора.
Конкуренты высказываются
Даже конкурирующие модели AI, в некотором смысле, ‘прокомментировали’ выпуск GPT-4.5. Grok от xAI, конкурирующая языковая модель, признала улучшения GPT-4.5 в разговорных способностях, но также указала на его ресурсоемкость. Это подчеркивает критическую проблему: огромная вычислительная мощность, необходимая для работы GPT-4.5, что напрямую приводит к более высоким эксплуатационным расходам и большему воздействию на окружающую среду.
Сам ChatGPT, при запросе, подчеркнул улучшенное удержание контекста, креативность и точность GPT-4.5. Однако он также признал, что модель по-прежнему имеет недостатки, особенно в длительных беседах, где она иногда может терять нить диалога или генерировать непоследовательные ответы. Эта самооценка, хотя и кажется объективной, еще больше усиливает восприятие того, что GPT-4.5, несмотря на свои достижения, остается несовершенной технологией.
Углубляясь в детали
Чтобы понять неоднозначный прием, важно более подробно изучить конкретные утверждения и контрутверждения, связанные с GPT-4.5.
1. Заявление о повышенной точности:
OpenAI утверждает, что GPT-4.5 точнее своего предшественника. Хотя это может быть правдой в определенных узко определенных задачах, независимые тесты Карпати и Дандекера ставят под сомнение обобщаемость этого утверждения. Похоже, что улучшения точности не являются единообразными во всех областях и могут быть менее значительными, чем первоначально рекламировалось.
2. Обещание уменьшения галлюцинаций:
‘Галлюцинации’, склонность языковых моделей генерировать ложную или бессмысленную информацию, были постоянной проблемой в этой области. OpenAI утверждает, что GPT-4.5 добилась успехов в смягчении этой проблемы. Однако отчеты пользователей и отдельные свидетельства показывают, что галлюцинации, хотя, возможно, и менее частые, остаются проблемой. Модель по-прежнему может выдавать уверенно заявленные неточности, особенно при работе со сложными или тонкими темами.
3. Искусство убеждения:
OpenAI подчеркивает улучшенные способности GPT-4.5 к убеждению. Это вызывает этические опасения, поскольку более убедительный AI может быть использован в манипулятивных целях, таких как распространение дезинформации или нежелательное влияние на мнения. Степень, в которой убедительность GPT-4.5 представляет собой подлинное улучшение или потенциальный риск, остается предметом продолжающихся дебатов.
4. Разговорное преимущество:
GPT-4.5, несомненно, является более беглым и увлекательным собеседником, чем GPT-4. Это, пожалуй, его самое значительное и очевидное улучшение. Модель генерирует текст, который течет более естественно, более эффективно имитирует человеческую речь и демонстрирует большее понимание нюансов разговора. Это делает его более подходящим для таких приложений, как чат-боты, виртуальные помощники и инструменты для креативного письма.
5. Дефицит рассуждений:
Несмотря на улучшения в разговорной речи, отсутствие существенного прогресса в способностях к рассуждению является основным камнем преткновения для многих критиков. GPT-4.5 по-прежнему испытывает трудности с задачами, требующими логического вывода, математических рассуждений и здравого смысла. Это ограничение препятствует его применению в областях, требующих точного, аналитического мышления, таких как научные исследования, финансовое моделирование и юридический анализ.
6. Фактор стоимости:
Непомерно высокая стоимость использования GPT-4.5 является существенным препятствием для многих потенциальных пользователей. Ценовая структура, основанная на входных и выходных токенах, делает его непомерно дорогим для крупномасштабных приложений или длительного использования. Это вызывает опасения по поводу доступности и справедливости, поскольку только хорошо финансируемые организации и частные лица могут позволить себе использовать эту технологию.
7. Ярлык ‘Research Preview’:
Решение OpenAI выпустить GPT-4.5 как ‘research preview’ заслуживает внимания. Это говорит о том, что модель все еще находится в стадии разработки и может претерпеть дальнейшие усовершенствования. Это также подразумевает, что OpenAI осознает ограничения и ищет отзывы пользователей, чтобы направлять будущие улучшения. Однако ярлык ‘research preview’ не полностью оправдывает высокую стоимость или несоответствия между заявлениями OpenAI и фактической производительностью модели.
Более широкий контекст: гонка вооружений AI
Выпуск GPT-4.5 необходимо понимать в более широком контексте продолжающейся ‘гонки вооружений AI’. Такие компании, как OpenAI, Google и Anthropic, ведут ожесточенную конкуренцию за разработку самых передовых и мощных моделей AI. Это конкурентное давление может привести к поспешным релизам, преувеличенным заявлениям и сосредоточению внимания на постепенных улучшениях, а не на фундаментальных прорывах.
Стремление к AGI, гипотетическому AI с интеллектом человеческого уровня и способностью решать общие проблемы, остается движущей силой большей части исследований и разработок в этой области. Однако GPT-4.5, несмотря на свои достижения, далек от этой амбициозной цели. Он служит напоминанием о том, что путь к AGI, вероятно, будет долгим и трудным, и что подлинные прорывы редки и труднодостижимы.
Будущее GPT-4.5
Окончательная судьба GPT-4.5 остается неопределенной. Как ‘research preview’, он, вероятно, будет развиваться со временем. OpenAI может устранить критические замечания и улучшить способности модели к рассуждению, снизить ее стоимость или усовершенствовать ее производительность в определенных областях.
Однако неоднозначный прием GPT-4.5 подчеркивает важность критической оценки и независимого тестирования в области AI. Он также подчеркивает необходимость большей прозрачности со стороны таких компаний, как OpenAI, особенно в отношении возможностей и ограничений их моделей.
На данный момент GPT-4.5 является свидетельством продолжающегося прогресса в области AI, но также и предостережением об опасностях ажиотажа, проблемах достижения подлинных прорывов и важности баланса между инновациями, этическими соображениями и практическими реалиями. Высокая цена в сочетании с сомнительной окупаемостью инвестиций делает его роскошью, которую немногие могут себе позволить, и еще меньше могут оправдать. Это служит убедительным напоминанием о том, что прогресс в AI не всегда линеен, и что более крупные и дорогие модели не всегда лучше.