o1-pro от OpenAI: дорогая модель

Расширенные возможности рассуждения

Модель o1-pro отличается от оригинальной модели o1 тем, что использует значительно больше вычислительной мощности. Это увеличенная вычислительная способность, по словам OpenAI, приводит к ‘стабильно лучшим ответам’. Модели рассуждения, такие как o1-pro, предназначены для достижения большей точности, чем стандартные большие языковые модели (LLM), такие как GPT-4 от OpenAI. Они достигают этого, уделяя больше времени анализу и формулированию ответов на запросы пользователей.

Ограниченный доступ и высокая стоимость

В настоящее время доступ к o1-pro ограничен избранной группой разработчиков. Только те, кто потратил минимум 5 долларов на API-сервисы OpenAI, имеют право на участие. Кроме того, стоимость использования o1-pro значительна.

OpenAI установила цену в 150 долларов за миллион входных токенов (примерно 750 000 обработанных слов) и 600 долларов за миллион выходных токенов. Эта структура ценообразования делает o1-pro вдвое дороже, чем GPT-4.5, самая мощная стандартная модель OpenAI, и в десять раз дороже, чем оригинальная модель o1. По сравнению с самой доступной моделью OpenAI, GPT-4o-mini, o1-pro в 10 000 раз дороже.

Оправдание премии

Основным оправданием этой премиальной цены является увеличенная вычислительная мощность, ведущая к улучшению качества ответа. Другие спецификации в значительной степени отражают спецификации модели o1. К ним относятся контекстное окно на 200 000 токенов, ограничение на вывод в 100 000 токенов и дата окончания знаний 30 сентября 2023 года. O1-pro также поддерживает ввод изображений и вызов функций, что позволяет подключаться к внешним источникам данных. Кроме того, он предлагает структурированные выходные данные — функцию, позволяющую разработчикам гарантировать, что ответы генерируются в определенном формате данных.

Фокус на AI-агентах

Первоначальная доступность o1-pro исключительно через Responses API предполагает, что основное внимание уделяется AI-агентам. Эти агенты представляют собой приложения, предназначенные для автономного выполнения задач от имени пользователей. Разработчики, создавшие приложения с использованием API Chat Completions от OpenAI, в настоящее время не имеют доступа к o1-pro.

Удовлетворение спроса разработчиков?

Несмотря на значительно более высокую стоимость по сравнению с o1, OpenAI ожидает, что некоторые разработчики сочтут повышенную производительность стоящей инвестиций.

Представитель OpenAI объяснил TechCrunch: ‘O1-pro в API — это версия o1, которая использует больше вычислений, чтобы думать усерднее и давать еще лучшие ответы на самые сложные проблемы. Получив множество запросов от нашего сообщества разработчиков, мы рады представить его в API, чтобы предложить еще более надежные ответы’.

OpenAI поделилась скриншотами в X, демонстрирующими многочисленные запросы от сообщества разработчиков на более мощную версию o1 с доступом к API. Однако еще неизвестно, будут ли эти пользователи полностью удовлетворены предложением.

Прошлая производительность и будущий потенциал

Предыдущая итерация o1-pro, ставшая доступной подписчикам ChatGPT Pro в декабре, получила смешанные отзывы. Пользователи сообщали, что модель испытывала трудности с определенными задачами, такими как головоломки судоку и восприятие оптических иллюзий.

Результаты тестов, опубликованные в декабре, показали, что o1-pro дает лишь незначительно лучшие результаты, чем o1, при решении математических задач и задач по кодированию.

OpenAI также разработала еще более продвинутую модель рассуждений, o3, но она еще не выпущена. Существование o3 предполагает постоянное стремление раздвинуть границы возможностей AI в области рассуждений, даже если текущая модель o1-pro имеет ограничения. Стратегия ценообразования для o1-pro также может быть показателем того, как OpenAI намерена позиционировать и монетизировать свои будущие, более продвинутые модели. Высокая стоимость может быть способом управления спросом, а также сигнализировать о значительной ценности и вычислительных ресурсах, связанных с этими передовыми технологиями AI.

Углубляясь в модели рассуждений

Концепция ‘рассуждения’ в AI является сложной. В отличие от стандартных LLM, которые в первую очередь фокусируются на распознавании образов и генерации текста на основе обширных наборов данных, модели рассуждений стремятся имитировать когнитивные процессы, подобные человеческим. Это включает в себя не только извлечение информации, но и ее анализ, построение выводов и логические умозаключения.

Увеличенная вычислительная мощность, выделенная o1-pro, предназначена для облегчения этой более глубокой обработки. Вместо того, чтобы просто предсказывать наиболее вероятное следующее слово в последовательности, модель предназначена для рассмотрения нескольких возможностей, оценки их релевантности и построения ответа на основе более тонкого понимания входных данных.

Проблемы оценки рассуждений

Оценка истинных способностей AI-моделей к рассуждению — сложная задача. Традиционные тесты, часто ориентированные на точность в конкретных задачах, могут не полностью отражать нюансы рассуждений. Модель может хорошо работать в стандартизированном тесте, но при этом испытывать трудности с реальными сценариями, требующими здравого смысла или адаптивности.

Смешанные отзывы о более ранней версии o1-pro подчеркивают эту сложность. Хотя она, возможно, и показала небольшие улучшения в определенных тестах, ее трудности с такими задачами, как судоку и оптические иллюзии, указывают на ограничения в ее способности применять логику и пространственное мышление по-настоящему человеческим способом.

Роль Responses API

Решение о первоначальном выпуске o1-pro исключительно через Responses API является стратегическим. Этот API специально разработан для создания AI-агентов, которые представляют собой приложения, способные автоматизировать сложные задачи. Сосредоточив внимание на этом варианте использования, OpenAI может ориентироваться на разработчиков, которые, скорее всего, выиграют от расширенных возможностей рассуждений o1-pro и потенциально готовы платить премиальную цену.

AI-агентам часто требуется больше, чем просто генерация текста. Им необходимо взаимодействовать с другими системами, принимать решения на основе меняющихся условий и выполнять действия скоординированным образом. Responses API в сочетании с возможностями o1-pro предоставляет основу для создания таких интеллектуальных агентов.

Будущее рассуждений в AI

Разработка o1-pro и существование еще более продвинутой модели o3 сигнализируют о значительной тенденции в области AI. По мере того, как LLM становятся все более искусными в генерации текста, подобного человеческому, фокус смещается в сторону когнитивных способностей более высокого порядка, таких как рассуждение.

Долгосрочная цель состоит в том, чтобы создать AI-системы, которые могут не только понимать информацию и реагировать на нее, но и решать проблемы, адаптироваться к новым ситуациям и даже проявлять некую форму творчества. Это требует выхода за рамки простого сопоставления шаблонов и перехода к моделям, которые могут по-настоящему рассуждать и принимать обоснованные решения.

Экономические последствия

Высокая стоимость o1-pro также поднимает важные вопросы об экономике продвинутого AI. Если доступ к этим мощным моделям останется чрезвычайно дорогим, это может создать разрыв в ландшафте AI. Более крупные компании и хорошо финансируемые исследователи могут иметь значительное преимущество, в то время как небольшие организации и отдельные разработчики могут оказаться вытесненными из-за цены.

Это может иметь последствия для инноваций и конкуренции в этой области. Это также поднимает вопросы о справедливом распределении преимуществ AI. По мере того, как эти технологии становятся все более мощными, обеспечение широкого доступа и доступности будет иметь решающее значение для предотвращения концентрации власти и возможностей. Ценообразование o1-pro служит ранним индикатором этих потенциальных проблем и необходимости тщательного рассмотрения экономических и социальных последствий продвинутого AI. Эволюция моделей ценообразования и возможность появления более доступных вариантов в будущем станут ключевым фактором в формировании доступности и демократизации этих мощных технологий.