ИИ в космосе, GPT-4.5 и будущее | ru

GPT-4.5: Улучшение, а не революция

OpenAI недавно предоставила доступ к GPT-4.5 пользователям ChatGPT Pro, а в дальнейшем планируется предоставить доступ и для аккаунтов Plus, Team, Enterprise и Education. Эта модель, известная внутри компании как ‘Orion’, по словам OpenAI, обладает “лучшим пониманием человеческих намерений, интерпретируя тонкие сигналы и неявные ожидания с большей нюансировкой и эмоциональным интеллектом”. Она использует новые методы обучения с учителем наряду с традиционной тонкой настройкой и обучением с подкреплением на основе отзывов людей, что отражает процесс разработки GPT-4o. GPT-4.5 предлагает возможности поиска в реальном времени, поддерживает загрузку файлов и изображений, а также интегрируется с холстом для написания кода и текста. Однако в настоящее время ей не хватает мультимодальных функций, таких как голосовой режим, видео или демонстрация экрана, которые есть в ChatGPT.

OpenAI подчеркивает, что обучение без учителя повышает точность и интуицию модели. Этот подход был движущей силой прогресса в таких моделях, как GPT-3.5, GPT-4, а теперь и GPT-4.5. Отдельно, масштабирование рассуждений обучает модели систематически обрабатывать информацию, генерируя цепочку мыслей перед ответом. Этот методичный подход улучшает их способность решать сложные STEM-задачи и логические головоломки, как это продемонстрировали такие модели, как OpenAI o1 и OpenAI o3-mini. GPT-4.5 представлена как яркий пример масштабирования обучения без учителя, использующего увеличенную вычислительную мощность, большие наборы данных и архитектурные инновации. Обученная на суперкомпьютерах Microsoft Azure AI, она, предположительно, обладает более широкими знаниями и более глубоким пониманием мира, уменьшая галлюцинации и повышая надежность.

Несмотря на эти достижения, GPT-4.5 не вызвала значительного энтузиазма. Она воспринимается как постепенное улучшение, а не как революционный прорыв. Хотя OpenAI заявляет об улучшенном эмоциональном интеллекте, нюансировке и креативности, многие пользователи не заметили существенной разницы по сравнению с GPT-4o. Отсутствие мультимодальных улучшений, ключевой особенности GPT-4o, еще больше способствует этому восприятию.

Более того, GPT-4.5 продемонстрировала склонность к созданию бессмысленных результатов. Внутренний инструмент OpenAI для проверки фактов, SimpleQA, показывает, что GPT-4.5 галлюцинирует (представляет выдумки как факт с уверенностью) в 37,1% случаев. Это вызывает серьезную озабоченность, даже по сравнению с GPT-4o, другой продвинутой моделью “рассуждений”, которая галлюцинирует в 61,8% случаев на том же тесте. Меньшая и более дешевая модель o3-mini демонстрирует еще более высокий уровень галлюцинаций - 80,3%.

Текущий ландшафт ИИ, с такими конкурентами, как Anthropic с Claude 3.7 и достижениями Google с Gemini, повысил ожидания значительных обновлений. Пользователи ищут прорывы, а не просто улучшения, и GPT-4.5 в ее нынешнем виде, похоже, не соответствует этим ожиданиям.

Рост моделей рассуждений и доверие инвесторов

Илон Маск недавно предположил в X, что искусственный общий интеллект (AGI) уже не за горами. Это заявление прозвучало на фоне лихорадочной гонки между технологическими гигантами, такими как OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic и xAI самого Маска, за разработку моделей рассуждений – систем ИИ, предназначенных для эмуляции человеческого мышления.

Инвесторы явно демонстрируют энтузиазм по поводу этого стремления. Вскоре после запуска Claude 3.7 Sonnet с гибридным рассуждением Anthropic получила значительный раунд финансирования серии E в размере 3,5 миллиарда долларов. Это утроило ее оценку до 61,5 миллиарда долларов, укрепив ее позиции в качестве основного конкурента OpenAI. Инвестиции, возглавляемые Lightspeed Venture Partners и включающие Salesforce Ventures, Cisco, Fidelity, Jane Street и других, будут использованы для расширения вычислительных мощностей для разработки ИИ, улучшения исследований в области безопасности и ускорения глобального роста.

Расширение границ рассуждений: бенчмарк BBEH

Большие языковые модели (LLM) все чаще интегрируются в повседневные приложения, требуя надежных возможностей рассуждений в различных областях. Однако существующие тесты часто отдают приоритет математике и кодированию, пренебрегая другими важными типами рассуждений. Хотя набор данных BIG-Bench широко использовался для оценки LLM в сложных задачах рассуждения, модели добились такого значительного прогресса, что теперь они достигают почти идеальных результатов как на BIG-Bench, так и на его более сложном варианте, BIG-Bench Hard (BBH). Это насыщение делает эти тесты менее эффективными для оценки дальнейших достижений.

Чтобы решить эту проблему, исследователи представили BIG-Bench Extra Hard (BBEH). Этот новый тест заменяет каждую задачу в BBH значительно более сложной версией, при этом оценивая те же навыки рассуждения. Тесты на BBEH показывают, что даже лучшие модели общего назначения достигают лишь 9,8% баллов, в то время как лучшая модель, специально разработанная для рассуждений, достигает 44,8%. Эти результаты подчеркивают сохраняющиеся проблемы, с которыми сталкиваются LLM при сложном рассуждении, указывая на значительные возможности для улучшения. Полная исследовательская работа содержит более подробную информацию об этом новом тесте.

Спутники с искусственным интеллектом: новая эра в исследовании и эксплуатации космоса

TakeMe2Space, стартап в области космических технологий из Хайдарабада, недавно получил 5,5 крор рупий в рамках предварительного посевного раунда финансирования, возглавляемого Seafund, при участии Blume Ventures, Artha Venture Fund, AC Ventures и других бизнес-ангелов. Это финансирование, хотя и скромное, знаменует собой значительный шаг к созданию первой в Индии лаборатории искусственного интеллекта в космосе. TakeMe2Space планирует использовать средства для разработки MOI-1 (My Orbital Infrastructure–Technology Demonstrator), платформы, которая позволит пользователям загружать модели ИИ для наблюдения за Землей или другие космические эксперименты непосредственно на орбитальный спутник через веб-консоль под названием Orbitlab. Пользователи будут платить только за время использования спутника по ставке 2 доллара в минуту.

Сообщается, что платформа MOI-TD компании продемонстрировала возможность загрузки больших моделей ИИ с наземной станции, выполнения внешнего кода на спутнике и безопасной передачи закодированных и зашифрованных результатов. Это представляет собой движение к более автономным и эффективным спутниковым операциям.

TakeMe2Space не одинока в этом начинании. Такие организации, как ESA (с OPS-SAT) и Globalstar, также являются пионерами в реальных приложениях спутниковых технологий с использованием искусственного интеллекта, начиная от безопасной связи IoT и заканчивая выполнением моделей ИИ на орбите. По мере развития технологий спутники с искусственным интеллектом становятся все более автономными, что ведет к более эффективным космическим операциям и открывает новые возможности для исследований, безопасности и глобальной связи.

Традиционно спутники в значительной степени полагались на наземные станции для обработки данных, принятия решений и выполнения команд. Данные должны были быть переданы вниз, проанализированы на Земле, а затем обработанные результаты передавались обратно на спутник – процесс, который был одновременно трудоемким и требовал большой пропускной способности. Однако достижения в области искусственного интеллекта и периферийных вычислений (обработка данных на самом устройстве, а не в облаке) теперь позволяют спутникам обрабатывать данные на борту, принимать автономные решения и безопасно передавать только самые важные результаты. Это приводит к более быстрым, умным и эффективным операциям.

Работа современных спутников с искусственным интеллектом обычно включает в себя три ключевых этапа:

Загрузка алгоритмов ИИ: Алгоритмы ИИ передаются с наземных станций на спутники, предоставляя им расширенные возможности обработки данных.
Анализ данных на борту: Модели ИИ анализируют изображения, данные датчиков и другие входные данные непосредственно на орбите, сводя к минимуму необходимость постоянного вмешательства с земли.
Безопасная передача результатов: Вместо передачи необработанных данных спутники отправляют зашифрованные результаты, экономя пропускную способность и повышая безопасность.

Этот подход, основанный на искусственном интеллекте, предлагает несколько преимуществ. Он значительно сокращает задержку, позволяя спутникам обрабатывать данные в космосе, что обеспечивает более быструю реакцию на условия в реальном времени без ожидания инструкций от наземных станций. Использование полосы пропускания оптимизировано, поскольку передаются только наиболее релевантные результаты, а не большие объемы необработанных данных. Безопасность также повышается за счет зашифрованной связи, что снижает риск киберугроз и утечек данных. Эти преимущества особенно ценны в таких приложениях, как реагирование на стихийные бедствия, военные операции и исследование космоса.

Реальные применения спутников с искусственным интеллектом разнообразны и эффективны:

Управление стихийными бедствиями: Спутники, оснащенные искусственным интеллектом, могут обнаруживать лесные пожары, наводнения и ураганы в режиме реального времени, обеспечивая быстрое реагирование со стороны служб экстренной помощи.
Точное земледелие: Модели ИИ анализируют состояние посевов и почвы для улучшения методов точного земледелия.
Мониторинг окружающей среды: Экологические агентства используют спутниковые данные для отслеживания уровня загрязнения воздуха и воды.
Автономная навигация и космические операции: ИИ улучшает предотвращение столкновений, прогнозируя и реагируя на потенциальные угрозы, обеспечивая безопасность спутников. Он также облегчает координацию спутниковых группировок, повышая охват и эффективность. Кроме того, ИИ играет решающую роль в отслеживании и прогнозировании движения космического мусора, снижая риск повреждения космической инфраструктуры.
Оборона и безопасность: Системы наблюдения с искусственным интеллектом обнаруживают несанкционированные действия и перемещения войск с повышенной точностью.
Телекоммуникации и IoT: Спутники с искусственным интеллектом способствуют более умной маршрутизации трафика, улучшая подключение к спутниковому интернету и обеспечивая бесперебойную глобальную связь.
Исследование космоса: ИИ повышает эффективность космических телескопов в обнаружении астероидов и экзопланет, значительно продвигая усилия по исследованию космоса.

Несмотря на многочисленные преимущества, остаются проблемы в разработке и развертывании спутников с искусственным интеллектом:

Ограниченная вычислительная мощность: Спутники должны работать на маломощных, радиационно-стойких чипах, что ограничивает возможности ИИ.
Суровая космическая среда: Радиационное воздействие создает риск сбоев оборудования.
Угрозы безопасности: Загрузка и выполнение внешнего кода в космосе требуют тщательного управления для предотвращения кибератак.
Стоимость и время разработки: Создание, тестирование и проверка совместимого с ИИ спутникового оборудования - дорогостоящий и трудоемкий процесс.
Требования к адаптивности: Модели ИИ, развернутые на орбите, должны быть высокоадаптивными, функционировать с минимальными обновлениями и автономно адаптироваться к новым сценариям.

AI Unlocked: устранение повторяющихся фраз в ChatGPT

ИИ может быть ценным инструментом в создании контента, помогая с написанием, мозговым штурмом, улучшением ясности, уточнением структуры и повышением общей читабельности. Однако распространенной проблемой текста, сгенерированного ИИ, является его склонность к шаблонному языку из-за повторяющегося выбора слов. Вместо того, чтобы доставлять свежие, впечатляющие сообщения, ИИ часто полагается на знакомые шаблоны, снижая эффективность и оригинальность.

Чрезмерно используемые слова и фразы, такие как “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” и “A testament to…,” могут значительно ухудшить качество контента, сгенерированного ИИ. Для маркетологов продуктов это повторение может сделать сообщения менее убедительными, снизить вовлеченность аудитории, ослабить дифференциацию бренда и помешать выделению идей и стратегических сообщений на переполненном рынке.

Используя функцию памяти ChatGPT, можно смягчить эту проблему и устранить чрезмерно используемые слова и фразы. Вот как эффективно использовать эту функцию:

Доступ: Доступ к ChatGPT можно получить через его веб-сайт или мобильное приложение.

Преимущества:

Повышенная оригинальность: Обеспечивает, чтобы контент, сгенерированный ИИ, казался менее роботизированным и более человечным.
Улучшенные сообщения бренда: Избегает общих фраз, которые ослабляют дифференциацию бренда.
Повышенная вовлеченность: Способствует более эффективному общению за счет уменьшения избыточности.

Пример: создание контента для маркетинга продукта

Представьте себе маркетолога продукта, которому поручено составить контент для запуска нового продукта. Первоначальный запрос к ChatGPT может привести к ответу, заполненному повторяющимися и общими фразами, такими как “delving into an intricate landscape of innovation…,” что делает сообщение не вдохновляющим.

Чтобы создать более убедительный и уникальный контент, маркетолог может выполнить следующие действия:

Настройка подсказки: Маркетолог явно инструктирует ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” Это указывает ChatGPT активно фильтровать эти термины в своих ответах.
Использование постоянной памяти: Фраза “Commit this to memory” гарантирует, что ChatGPT сохранит эти конкретные инструкции в течение нескольких взаимодействий. Это обеспечивает постоянное избегание указанных слов и фраз. ChatGPT проверит свою память перед генерацией текста и будет следовать инструкциям, чтобы избежать указанных терминов.
Ручной обзор: После генерации ответа маркетолог просматривает контент на предмет оставшейся избыточности и корректирует язык для ясности и воздействия.

Эффективность:

Настройка подсказки: Конкретные инструкции помогают формировать вывод ИИ.
Сохранение памяти: ChatGPT может хранить и следовать правилам избегания слов в разных беседах.
Ручная доработка: Окончательное редактирование человеком обеспечивает ясность и подлинность.

Примечание: Инструменты и анализ, представленные в этом разделе, основаны на внутреннем тестировании и демонстрируют явную ценность. Рекомендации являются независимыми и не зависят от создателей инструментов.

Дополнительные новости и разработки в области ИИ

Рост популярности смартфонов с искусственным интеллектом: Deutsche Telekom объявила о планах на Mobile World Congress 2025 в Барселоне запустить смартфон с искусственным интеллектом, оснащенный помощником Perplexity. Этот помощник предназначен для упрощения повседневных задач, таких как заказ такси, бронирование столиков, перевод языков в режиме реального времени и ответы на запросы пользователей. Компания видит в этом виртуального помощника, который будет поддерживать миллионы клиентов, составляя электронные письма, инициируя звонки, обобщая тексты и управляя календарями. AI Phone будет интегрировать Google Cloud AI, ElevenLabs и Picsart для расширения своей функциональности, и его запуск запланирован на конец этого года. Glance, подразделение InMobi, и Google Cloud также объявили о сотрудничестве, чтобы использовать модели ИИ Google для разработки ориентированных на потребителя приложений ИИ для улучшения взаимодействия с пользователем на экранах блокировки смартфонов и экранах телевизоров. Glance в настоящее время поддерживает более 450 миллионов смартфонов на базе Android по всему миру.
В государственном секторе наблюдается снижение числа критических киберинцидентов: Согласно последнему отчету аналитиков Kaspersky Managed Detection and Response (MDR), в 2024 году в государственном и девелоперском секторах наблюдалось значительное снижение числа инцидентов высокой степени серьезности, связанных с прямым участием человека. Однако в пищевой, ИТ, телекоммуникационной и промышленной отраслях наблюдался рост таких инцидентов.
OpenAI планирует интегрировать Sora в ChatGPT: OpenAI работает над интеграцией своего инструмента генерации видео с помощью ИИ, Sora, непосредственно в ChatGPT. В настоящее время Sora доступна только через специальное веб-приложение, позволяющее пользователям создавать кинематографические клипы продолжительностью до 20 секунд. OpenAI также разрабатывает генератор изображений с искусственным интеллектом на базе Sora.

обновлено 2025-03-08

# OpenAI # GPT # AGI