Генеративный ИИ меняет освещение PGA TOUR: 30 000 ударов

Мир профессионального гольфа, часто воспринимаемый через узкую призму телевизионных трансляций, сосредоточенных на лидерах турнира, охватывает гораздо более широкую драму. На обширных полях десятки участников одновременно преодолевают трудности, выполняют блестящие удары и борются со стихией. Охват всей полноты этого соревнования долгое время был сложной задачей с точки зрения логистики и ресурсов. Теперь слияние сложного сбора данных и передового искусственного интеллекта переписывает сценарий, позволяя PGA TOUR предоставлять фанатам беспрецедентный уровень детализации и повествовательного контекста, выходя далеко за рамки традиционных ограничений освещения. В ходе яркой демонстрации во время THE PLAYERS Championship генеративный ИИ был использован для создания уникальных письменных описаний более чем 30 000 отдельных ударов в гольфе, предлагая подписчикам более богатое и полное понимание происходящего на всем поле.

Неизменная проблема: Масштабирование всестороннего освещения гольфа

На протяжении десятилетий повествование о профессиональном турнире по гольфу в значительной степени диктовалось ограничениями традиционных СМИ. Комментаторы-люди и съемочные группы естественным образом тяготеют к игрокам, возглавляющим таблицу лидеров, или к тем, кто обладает признанной звездной силой. Хотя такой подход обеспечивает захватывающие моменты, он неизбежно оставляет огромные пласты соревнований недокументированными. Учитывая, что поля часто превышают 140 игроков, каждый из которых выполняет более 70 ударов за раунд в течение четырех дней, сам объем действий огромен.

Scott Gutterman, старший вице-президент по цифровым и вещательным технологиям в PGA TOUR, формулирует основную проблему: ‘Обычно наш персонал может охватить 25 или 30 гольфистов’. Эта операционная реальность означала, что истории потенциально десятков других игроков – их триумфы, трудности и решающие моменты – оставались в значительной степени нерассказанными, доступными только через необработанную статистику, если вообще доступными. Фанаты, следящие за конкретными игроками вне лидирующей группы, часто имели фрагментарное представление об их результатах.

Амбиции PGA TOUR были ясны: использовать невероятно богатый поток данных, предоставляемый ShotLink, работающим на базе CDW, который фиксирует точные детали каждого выполненного удара, для создания более справедливого и полного повествовательного ландшафта. Проблема заключалась не в недостатке данных, а в неспособности обрабатывать, интерпретировать и представлять эти данные в убедительном, повествовательном формате в масштабе, необходимом для охвата каждого игрока и каждого удара. Человеческие ресурсы просто не могли эффективно или экономично преодолеть этот разрыв. Желание состояло в том, чтобы выйти за рамки базовых метрик – ‘JJ Spaun выполнил драйв на 300 ярдов, и ему осталось 125 ярдов до лунки’ – которые, как отмечает Gutterman, были стандартом в течение многих лет. Цель заключалась в том, чтобы наполнить эти точки данных смыслом и контекстом, превратив необработанные цифры в увлекательные элементы повествования для каждого участника.

Встречайте генеративный ИИ: Технологический катализатор перемен

Признав потенциал искусственного интеллекта для преодоления проблемы масштабирования, PGA TOUR приступил к целенаправленному изучению возможностей генеративного ИИ примерно два года назад. Это было не просто академическое упражнение; оно было обусловлено фундаментальным вопросом: как эта быстро развивающаяся технология может улучшить создание контента и, что особенно важно, лучше служить основным заинтересованным сторонам – фанатам, игрокам и самим турнирам?

Путь включал тесное сотрудничество с ключевым технологическим партнером, Amazon Web Services (AWS). TOUR стал одним из основателей AWS Bedrock, управляемого сервиса, предлагающего доступ к различным ведущим базовым моделям (FMs) через единый API. Gutterman объясняет стратегическое преимущество: ‘Bedrock эффективно позволяет использовать практически любую модель генеративного ИИ и набор инструментов для создания такого рода опыта’. Этот платформенный подход обеспечил гибкость и перспективность, избегая зависимости от одного поставщика ИИ или архитектуры модели.

Для конкретной задачи генерации описательного текста TOUR выбрал модели, разработанные Anthropic, доступные через Bedrock. ‘Мы используем модели Claude от Anthropic для создания такого рода опыта. В частности, мы используем Anthropic Claude 3.5 Sonnet’, - уточняет Gutterman. Прошлый год ознаменовал критический переход, выйдя за рамки первоначальных доказательств концепции (POCs) к полной операционализации. Это включало создание надежной инфраструктуры и рабочих процессов, необходимых для надежной и масштабной интеграции ИИ в освещение турниров в реальном времени. Фокус сместился с демонстрации возможностей на внедрение практической, воспроизводимой системы, способной справляться с динамичной, высокообъемной средой профессионального турнира по гольфу. Выбор Claude 3.5 Sonnet отражает выбор, основанный на его предполагаемых сильных сторонах в генерации нюансированного, контекстно-зависимого текста, подходящего для спортивных комментариев.

Создание повествования: За кулисами ИИ

Генерация десятков тысяч уникальных, точных и контекстуально релевантных описаний ударов почти в реальном времени – это сложная оркестровка. Она включает в себя гораздо больше, чем просто подачу необработанных данных в модель ИИ. PGA TOUR совместно с AWS разработали сложный конвейер для преобразования данных ShotLink в убедительные повествования.

1. Прием и контекстуализация данных:
Процесс начинается с потока данных от ShotLink. Это не просто конечная точка удара, но и такие детали, как положение мяча, расстояние, использованная клюшка и многое другое. Однако необработанным данным не хватает повествовательной силы. Следующий решающий шаг включает набор контекстных сервисов. Эти сервисы действуют как интерпретирующий слой, анализируя входящие данные с помощью движка правил.

2. Движок правил: Добавление интеллекта:
Этот движок жизненно важен для обеспечения осмысленности генерируемого текста и избежания распространенных ошибок. Gutterman приводит примеры: ‘после того, как игрок выполняет первый удар с ти на первой лунке, он не пишет, что игрок выполнил самый длинный драйв дня’. Правила диктуют приоритеты, обеспечивая разнообразие и релевантность. ‘Например, мы можем указать ему говорить о попаданиях на грин в регуляции (greens in regulations) при ударах на подход каждые три повествования, чтобы текст не становился избыточным для всех игроков’. Систему также обучают различным способам формулирования описаний для схожих действий – гарантируя, что драйв не описывается одинаково каждый раз, или так же, как описывался бы патт. Это включает в себя кодирование знаний о гольфе и лучших практик повествования в логику системы.

3. Инженерия промптов:
Вооружившись данными и контекстными правилами, движок промптов формулирует конкретную инструкцию, передаваемую модели ИИ. Этот промпт фактически просит ИИ сгенерировать повествование, включающее предоставленные точки данных и придерживающееся контекстных указаний. Создание эффективных промптов – это критически важный навык при работе с генеративным ИИ, формирующий стиль, тон и содержание вывода.

4. Генерация повествования ИИ:
Тщательно сконструированный промпт затем отправляется модели Anthropic Claude 3.5 Sonnet через платформу AWS Bedrock. ИИ обрабатывает запрос и генерирует описательный текст – повествование об ударе – включая факты и желаемый контекст. Например, вместо простого указания метража, он может добавить: ‘он только что выполнил свой самый длинный драйв дня’ или предоставить статистический контекст, например: ‘с расстояния 125 ярдов он попадает в пределах 10 футов от лунки в 20% случаев’. Это наслоение информации – то, что поднимает вывод за рамки простого отчета о данных.

5. Строгая валидация:
Прежде чем любой сгенерированный ИИ текст достигнет общественности, он проходит многоэтапный процесс валидации для обеспечения точности и качества.

  • Верификация данных (DataVerification): Выходное повествование проверяется на соответствие входным данным ShotLink. ‘Выходное повествование от Claude 3.5 Sonnet проходит через сервис валидации, чтобы убедиться, что данные ShotLink, упомянутые в выводе, совпадают с тем, что было введено в систему (например, дистанция драйва)’, - объясняет Gutterman. Этот шаг защищает от потенциальных ‘галлюцинаций’ ИИ или фактических ошибок.
  • Косинусное сходство (Cosine Similarity): Далее следует более тонкая проверка с использованием анализа косинусного сходства. Этот метод измеряет семантическое сходство между сгенерированным текстом и корпусом приемлемых описаний для данного типа удара. ‘Система убеждается, что текст попадает в диапазон того, как можно было бы говорить о драйве’, - добавляет Gutterman. Это гарантирует, что тон и формулировки являются подходящими и соответствуют тому, как обычно описываются действия в гольфе.
  • Проверки движка публикации (Publishing Engine Checks): Если повествование проходит эти тесты, оно поступает в движок публикации, где происходят окончательные проверки перед интеграцией в платформы, такие как приложение TOURCAST.

Этот тщательный процесс подчеркивает приверженность точности и надежности, что необходимо для поддержания доверия при предоставлении спортивной информации.

Реализация в реальном мире: Успех на THE PLAYERS Championship

Теоретический потенциал этой системы, управляемой ИИ, прошел серьезное испытание в реальных условиях во время THE PLAYERS Championship, одного из флагманских событий в календаре PGA TOUR. Это было не мелкомасштабное испытание; система была развернута для генерации повествований для всего поля на протяжении всех четырех раундов.

Результаты были впечатляющими. Система генеративного ИИ успешно создала описательный текст для более чем 30 000 отдельных ударов в течение недели турнира. Это представляет собой монументальный скачок в глубине освещения, эффективно предоставляя повествовательное понимание каждого отдельного удара, выполненного каждым участником.

Не менее важной была надежность системы. ‘Во время THE PLAYERS Championship точность по 30 000 ударам составила около 96%, что соответствует нашим ожиданиям’, - сообщает Gutterman. Достижение такого уровня точности в живом, динамичном спортивном событии, где данные постоянно поступают, а контекст быстро меняется, является свидетельством надежности базовой технологии и тщательности процессов валидации. Хотя 96% подразумевает небольшой процент, требующий проверки или отбраковки, общий показатель успеха продемонстрировал жизнеспособность системы для крупномасштабного развертывания. Это достижение подтвердило два года разработки и ознаменовало важную веху в контентной стратегии TOUR.

Намечая будущее: За пределами текста и к персонализации

Успешное внедрение текстовых повествований – это только начало видения PGA TOUR по использованию ИИ. Текущая система ориентирована на текст в первую очередь потому, что модели ИИ, способные обрабатывать и интерпретировать живые видео- и аудиопотоки в реальном времени, все еще находятся в стадии созревания. Однако дорожная карта ясно указывает на более захватывающее, мультисенсорное будущее.

Интеграция мультимодального ИИ:
‘Мы движемся к дню, когда это будет комбинация живых данных, живого аудио, живого видео, а затем использование мультимодального вывода для создания видео и генерации голоса’, - предвидит Gutterman. Это предполагает будущее, в котором ИИ потенциально сможет анализировать видеопотоки для комментирования механики свинга, интерпретации реакций игроков или даже оценки шума толпы, интегрируя эти наблюдения с данными ShotLink для создания еще более богатого контента, возможно, даже автоматизированных видео-хайлайтов с озвучкой, сгенерированной ИИ.

Комментарии синтетическим голосом:
Более непосредственная цель – решение проблемы отсутствия комментариев на многочисленных потоках ‘Every Shot Live’, доступных фанатам. В течение многих лет эти потоки, часто насчитывающие около 50 одновременных трансляций, показывали только естественный звук и статистические наложения. ‘Наша цель всегда – чтобы историю рассказывал человек, но иметь двух комментаторов на 48 потоках весь день – это непомерно дорого’, - признает Gutterman. Генеративный ИИ предлагает масштабируемое решение. ‘Мы работаем с AWS над синтетическим голосом, который сможет зачитывать промпты [повествования]. С ИИ зритель сможет включить комментарии так же, как он включает скрытые субтитры’. Эта возможность также может легко распространяться на несколько языков, предлагая, например, комментарии на испанском языке одним нажатием переключателя, что значительно повысит доступность.

Стратегическая независимость от моделей:
В основе этих будущих разработок лежит стратегическое преимущество, предоставляемое AWS Bedrock – независимость от моделей. TOUR не привязан к одному поставщику моделей ИИ. ‘Bedrock позволяет PGA TOUR быть независимым от моделей и находить лучшую модель для задачи’, - подчеркивает Gutterman. Эта гибкость имеет решающее значение в быстро развивающемся ландшафте ИИ. ‘Если будущие модели смогут выполнять функцию по более низкой цене, Tour сможет без проблем перейти на нее’. Он отвергает идею единой, всемогущей модели, отмечая: ‘То, что мы видим, это не так’. Стратегия заключается в использовании лучшего инструмента для работы: Claude от Anthropic для нюансированной генерации текста, потенциально новой модели AWS Nova для задач распознавания изображений и, возможно, других специализированных моделей для таких функций, как перевод. Этот подход максимизирует возможности при оптимизации затрат и производительности в долгосрочной перспективе.

Главный приз: Гиперперсонализированный опыт для фанатов

Хотя технологические достижения впечатляют сами по себе, движущей силой инициатив PGA TOUR в области генеративного ИИ является стремление к фундаментально преобразованному опыту фанатов: гиперперсонализации.

Способность генерировать повествовательный контекст для каждого удара закладывает основу для предоставления контента, специально адаптированного к индивидуальным предпочтениям. ‘Это продвигает нас по пути гиперперсонализации, где фанат может получить историю в конце дня с лучшим видео от своих любимых игроков’, - объясняет Gutterman. Представьте себе приложение, автоматически собирающее подборку ярких моментов, включающую каждый значимый удар, сыгранный вашим любимым гольфистом, с контекстными повествовательными описаниями, доставленную вскоре после завершения его раунда.

Это выходит за рамки простой курации. TOUR предвидит системы, способные к прогнозному вовлечению. ‘Приложение уже знает, что вам нравится, и просто предлагает вам то, что вы хотите’, - предполагает Gutterman. Изучая предпочтения фаната – любимых игроков, интерес к конкретной статистике (например, дальность драйва или результативность паттинга) или даже предпочитаемые форматы контента – платформа могла бы проактивно доставлять самую релевантную информацию и истории, возможно, даже предупреждая фаната, когда его любимый игрок сталкивается с критическим паттом или пытается выполнить удар с исторически сложной позиции.

Этот уровень персонализации направлен на углубление вовлеченности, делая потребление контента о гольфе более релевантным, эффективным и, в конечном счете, более удовлетворительным для каждого отдельного фаната. Используя генеративный ИИ для раскрытия повествовательного потенциала, скрытого в его обширных запасах данных, PGA TOUR не просто масштабирует свое освещение; он прокладывает путь к будущему, где технология адаптирует историю игры к уникальной перспективе каждого подписчика. Эпоха пассивного получения единого вещательного потока уступает место динамичному, персонализированному и богатому данными взаимодействию со спортом.