Шаг вперед, а не гигантский скачок
GPT-4.5 предоставляется пользователям ChatGPT Pro в качестве предварительного просмотра для исследований. OpenAI рекламирует ее как свою ‘самую знающую модель на сегодняшний день’, но первоначальные сообщения предупреждали, что она может не соответствовать производительности таких моделей, как o1 или o3-mini. Это предполагает акцент на усовершенствовании и эффективности, а не на революционных достижениях.
Расширенные возможности, утонченное взаимодействие
Чего пользователи могут ожидать от GPT-4.5? OpenAI выделяет улучшения в нескольких ключевых областях:
- Мастерство письма: Модель разработана, чтобы быть более способным помощником в написании текстов.
- Расширенные знания о мире: GPT-4.5 обладает более широким пониманием концепций и информации реального мира.
- ‘Утонченная индивидуальность’: OpenAI утверждает, что взаимодействие с этой моделью будет ощущаться более естественным и интуитивно понятным.
Компания подчеркивает способность GPT-4.5 распознавать закономерности и устанавливать связи, что делает ее особенно подходящей для таких задач, как написание текстов, программирование и решение практических задач.
Не передовая модель: понимание различий
Несмотря на эти улучшения, OpenAI ясно дает понять, что GPT-4.5 не представляет собой скачка к совершенно новым возможностям. Просочившийся документ, позже пересмотренный, предоставил дополнительный контекст:
‘GPT-4.5 не является передовой моделью, но это самая большая LLM OpenAI, улучшающая вычислительную эффективность GPT-4 более чем в 10 раз’, — говорится в документе. ‘Она не вводит 7 принципиально новых передовых возможностей по сравнению с предыдущими выпусками, и ее производительность ниже, чем у o1, o3-mini и глубоких исследований по большинству оценок готовности’.
Это различие важно. Оно предполагает, что, хотя GPT-4.5 является значительным обновлением с точки зрения масштаба и эффективности, она не раздвигает границы возможностей ИИ так, как это делала бы ‘передовая’ модель.
Обучение и разработка
Отчеты показывают, что OpenAI использовала свою модель рассуждений o1 (под кодовым названием Strawberry) и синтетические данные для обучения GPT-4.5. Компания подтверждает сочетание новых методов обучения с учителем и устоявшихся методов:
- Supervised Fine-Tuning (SFT)
- Reinforcement Learning from Human Feedback (RLHF)
Они аналогичны подходам, использованным при разработке GPT-4o.
Устранение галлюцинаций и улучшение сотрудничества
Одним из заметных улучшений является уменьшение галлюцинаций. По данным OpenAI, GPT-4.5 галлюцинирует реже, чем GPT-4o, и даже немного реже, чем модель o1.
Рафаэль Гонтихо Лопес, исследователь OpenAI, подчеркнул акцент на сотрудничестве: ‘Мы настроили GPT-4.5, чтобы она была лучшим сотрудником, делая разговоры более теплыми, интуитивно понятными и эмоционально нюансированными’. Он отметил, что люди-тестировщики оценили GPT-4.5 выше, чем GPT-4o, по различным категориям.
Перспектива генерального директора: признание ограничений
Генеральный директор OpenAI Сэм Альтман в сообщении на X признал природу GPT-4.5: ‘гигантская, дорогая модель’, которая ‘не сокрушит тесты’. Эта откровенная оценка подкрепляет идею о том, что этот выпуск посвящен постепенному прогрессу, а не революционным прорывам.
План развертывания
Развертывание GPT-4.5 осуществляется поэтапно:
- Пользователи Pro: Немедленный доступ в качестве предварительного просмотра для исследований.
- Пользователи Plus и Team: Ожидается доступность на следующей неделе.
- Пользователи Enterprise и Edu: Доступ будет предоставлен после пользователей Plus и Team.
Модель также доступна через платформу Microsoft Azure AI Foundry, наряду с предложениями от Stability, Cohere и самой Microsoft.
Точность и уменьшение галлюцинаций
OpenAI подчеркивает повышенную точность GPT-4.5, утверждая, что она генерирует более точные ответы и меньше галлюцинирует по сравнению с другими моделями. Это важный шаг вперед, поскольку галлюцинации (генерация ложной или бессмысленной информации) были постоянной проблемой в больших языковых моделях.
Взгляд в будущее: GPT-5 и путь к AGI
Ранее сообщалось о сроках выпусков OpenAI: GPT-4.5 к концу февраля и GPT-5 уже в конце мая. Альтман описал GPT-5 как ‘систему, которая объединяет множество наших технологий’. Ожидается, что она будет включать новую модель рассуждений o3 от OpenAI, которая была анонсирована во время ‘12 дней Рождества’ компании в декабре.
В то время как o3-mini была выпущена ранее, полная модель o3 зарезервирована для системы GPT-5. Это согласуется с более широким видением OpenAI по объединению своих больших языковых моделей для создания более способной системы, потенциально приближающейся к области общего искусственного интеллекта (AGI).
Более глубокое погружение в архитектуру GPT-4.5
Хотя OpenAI не опубликовала исчерпывающих технических подробностей, можно сделать несколько выводов об архитектуре GPT-4.5 на основе доступной информации:
Большее количество параметров: Описываемая как ‘самая большая LLM OpenAI’, разумно предположить, что GPT-4.5 может похвастаться значительно большим количеством параметров, чем ее предшественники. Эта увеличенная емкость, вероятно, способствует улучшению базы знаний и способностей к рассуждению.
Оптимизированная вычислительная эффективность: В просочившемся документе упоминалось об улучшении вычислительной эффективности ‘более чем в 10 раз’ по сравнению с GPT-4. Это предполагает усовершенствование архитектуры, которое позволяет модели более эффективно обрабатывать информацию, что потенциально приводит к более быстрому времени отклика и снижению энергопотребления.
Улучшенные механизмы внимания: Учитывая акцент на распознавании образов и установлении связей, вполне вероятно, что GPT-4.5 включает в себя усовершенствования в механизмах внимания. Эти механизмы позволяют модели сосредотачиваться на наиболее релевантных частях входного текста, что приводит к более связным и контекстуально-зависимым ответам.
Улучшенные данные обучения: Использование ‘новых методов обучения с учителем’ намекает на улучшение качества и разнообразия данных обучения. Это может включать в себя включение более специализированных наборов данных, использование генерации синтетических данных или применение более сложных методов фильтрации и очистки существующих данных.
Роль синтетических данных
Сообщается об использовании синтетических данных при обучении GPT-4.5, что особенно примечательно. Синтетические данные, сгенерированные самими моделями ИИ, предлагают несколько потенциальных преимуществ:
Преодоление нехватки данных: Их можно использовать для дополнения существующих наборов данных, особенно в тех областях, где реальные данные ограничены или их трудно получить.
Устранение предвзятости: Синтетические данные можно тщательно రూపొрядочить, чтобы смягчить предвзятость, присутствующую в реальных наборах данных, что приводит к более справедливым и равноправным моделям ИИ.
Изучение гипотетических сценариев: Это позволяет исследователям обучать модели на сценариях, которые могут быть редкими или невозможными для наблюдения в реальном мире, повышая их способность справляться с неожиданными ситуациями.
Однако использование синтетических данных также вызывает опасения:
Потенциал для усиления предвзятости: При отсутствии тщательного контроля синтетические данные могут непреднамеренно усилить существующую предвзятость или ввести новую.
Риск переобучения: Модели, обученные в основном на синтетических данных, могут хорошо работать с аналогичными синтетическими данными, но с трудом обобщаться на реальные входные данные.
Подход OpenAI к использованию синтетических данных, вероятно, включает тщательную проверку и тестирование для снижения этих рисков.
‘Утонченная индивидуальность’: более пристальный взгляд
Утверждение OpenAI о том, что GPT-4.5 обладает ‘утонченной индивидуальностью’, интригует. Это предполагает усилия, направленные на то, чтобы сделать взаимодействие модели более привлекательным, естественным и эмоционально интеллектуальным. Это может включать в себя несколько методов:
Тонкая настройка на разговорных данных: Обучение модели на больших наборах данных человеческих разговоров, чтобы лучше понимать нюансы языка, тона и социальных сигналов.
Включение моделей эмоционального интеллекта: Интеграция специализированных моделей, предназначенных для распознавания человеческих эмоций и реагирования на них, что позволяет GPT-4.5 соответствующим образом адаптировать свой стиль общения.
Обучение с подкреплением с обратной связью от человека: Использование обратной связи от человека для поощрения ответов, которые воспринимаются как более естественные, привлекательные и эмпатичные.
Цель состоит в том, чтобы создать более человечный разговорный опыт, выходящий за рамки чисто функциональных взаимодействий, чтобы способствовать ощущению связи и взаимопонимания.
Последствия для различных групп пользователей
Поэтапное развертывание GPT-4.5 предполагает различные последствия для различных групп пользователей:
Пользователи Pro: Как первые пользователи, пользователи Pro получат возможность экспериментировать с возможностями модели и предоставлять обратную связь OpenAI. Эта обратная связь будет иметь решающее значение для формирования дальнейшего развития модели.
Пользователи Plus и Team: Эти пользователи, вероятно, выиграют от улучшенной производительности и утонченного стиля взаимодействия GPT-4.5 в своих повседневных задачах, таких как написание текстов, кодирование и исследования.
Пользователи Enterprise и Edu: Для этих пользователей повышенная точность и уменьшение галлюцинаций могут быть особенно ценными, обеспечивая более надежные и заслуживающие доверия результаты в профессиональной и образовательной среде.
Пользователи Microsoft Azure AI Foundry: Доступность GPT-4.5 на этой платформе расширяет доступ к модели для разработчиков и исследователей, способствуя инновациям и созданию новых приложений на базе ИИ.
Более широкий контекст: стратегия OpenAI
Выпуск GPT-4.5, хотя и не является передовой моделью, вписывается в более широкую стратегию OpenAI по итеративной разработке и постепенному продвижению к AGI. Выпуская постепенные улучшения, OpenAI может:
Собирать отзывы пользователей: Постоянно совершенствовать свои модели на основе реального использования и отзывов.
Управлять ожиданиями: Избегать чрезмерного ажиотажа и устанавливать реалистичные ожидания для каждого выпуска.
Поддерживать конкурентное преимущество: Оставаться впереди в быстро развивающейся области ИИ.
Подготовиться к будущим прорывам: Заложить основу для более значительных достижений, таких как GPT-5.
Этот подход контрастирует с выпусками ‘большого взрыва’ некоторых других компаний, занимающихся ИИ, что предполагает более осторожный и взвешенный подход к разработке и развертыванию все более мощных систем ИИ. Основное внимание уделяется не только расширению границ возможного, но и обеспечению безопасности, надежности и удовлетворенности пользователей.
Разработка и развертывание таких моделей, как GPT-4.5, поднимает множество вопросов:
- Как мы можем измерить, обладает ли модель ‘утонченной индивидуальностью’?
- Каковы последствия модели, которая меньше галлюцинирует?
- В чем важность выпуска модели, которая не является передовой?
Это все хорошие вопросы, и на них нет однозначных ответов.