生成式AI革新PGA TOUR报道:解说超3万次击球

职业高尔夫的世界,通常通过电视转播聚焦于领先者的狭窄视角来呈现,但其蕴含的戏剧性远不止于此。在广阔的球场上,数十名选手同时应对挑战,打出精彩击球,并与自然环境搏斗。长期以来,捕捉这场竞赛的全貌一直是一项后勤和资源密集型的挑战。如今,复杂的数据收集与尖端人工智能的融合正在改写剧本,使 PGA TOUR 能够向球迷提供前所未有的细节和叙事背景,远远超越了传统报道的局限性。在 THE PLAYERS Championship 期间的一次引人注目的演示中,生成式 AI 被用来为超过 30,000 次独立的高尔夫击球制作独特的书面描述,让关注者对整个赛场的动态有了更丰富、更全面的理解。

长期挑战:扩展全面高尔夫报道的规模

几十年来,职业高尔夫锦标赛的叙事在很大程度上受到传统媒体限制的支配。人类评论员和制作团队自然会倾向于关注排行榜顶端的球员或那些已成名的明星球员。虽然这种方法能提供引人入胜的精彩集锦,但不可避免地会遗漏比赛的大部分内容。参赛选手通常超过 140 人,每人在四天的比赛中每轮要击球 70 次以上,总的动作量是巨大的。

PGA TOUR 数字与广播技术高级副总裁 Scott Gutterman 阐述了核心问题:’通常,我们的工作人员只能覆盖 25 或 30 名高尔夫球手。’ 这种运营现实意味着,其他数十名球员的故事——他们的胜利、挣扎和关键时刻——在很大程度上仍然不为人知,最多只能通过原始统计数据获取。关注领先集团之外特定球员的球迷通常只能看到他们表现的零散片段。

PGA TOUR 内部的雄心很明确:利用由 CDW 支持的 ShotLink 提供的极其丰富的数据流(它捕捉了每一次击球的精确细节),来创建一个更公平、更完整的叙事版图。挑战不在于缺乏数据,而在于无法以引人入胜的叙事格式,按覆盖每位球员和每次击球所需的规模来处理、解释和呈现这些数据。人力资源根本无法有效或经济地弥补这一差距。目标是超越基本指标——‘JJ Spaun 开球 300 码,距离球洞还有 125 码’——Gutterman 指出,这多年来一直是标准。目标是为这些数据点注入意义和背景,将原始数字转化为为每位参赛者量身打造的引人入胜的故事元素。

生成式 AI 登场:技术变革的催化剂

认识到人工智能在克服规模化挑战方面的潜力,PGA TOUR 大约在两年前开始了对生成式 AI 能力的专项探索。这不仅仅是一项学术研究;它由一个根本性问题驱动:这项快速发展的技术如何能增强内容创作,并更关键地,更好地服务于核心利益相关者——球迷、球员和赛事本身?

这一过程涉及与关键技术合作伙伴 Amazon Web Services (AWS) 的紧密合作。PGA TOUR 成为了 AWS Bedrock 的基础合作伙伴,AWS Bedrock 是一项托管服务,通过单一 API 提供对各种领先基础模型 (FMs) 的访问。Gutterman 解释了其战略优势:’Bedrock 实际上允许你使用几乎任何生成式 AI 模型和一套工具来创建这类体验。’ 这种平台方法提供了灵活性和面向未来的保障,避免了对单一 AI 提供商或模型架构的依赖。

对于生成描述性文本的具体任务,PGA TOUR 选择了可通过 Bedrock 访问的、由 Anthropic 开发的模型。’我们正在使用 Anthropic 的 Claude 模型来创建这些体验。特别是,我们正在使用 Anthropic Claude 3.5 Sonnet,’ Gutterman 明确指出。过去一年标志着一个关键的转变,从最初的概念验证 (POCs) 走向全面运营化。这涉及到构建强大的基础设施和工作流程,以便将 AI 可靠且大规模地集成到现场赛事报道中。重点从展示可能性转向实施一个实用、可重复的系统,能够处理职业高尔夫锦标赛动态、高容量的环境。选择 Claude 3.5 Sonnet 反映了基于其在生成细致入微、具有语境意识的文本方面的优势,这种文本非常适合体育评论。

打造叙事:AI 幕后揭秘

在近乎实时的情况下生成数以万计独特、准确且与语境相关的击球描述是一项复杂的编排工作。它远不止是将原始数据输入 AI 模型那么简单。PGA TOUR 与 AWS 合作,设计了一个复杂的流程管道,将 ShotLink 数据转化为引人入胜的叙事。

1. 数据提取与语境化:
过程始于来自 ShotLink 的数据流。这不仅仅是击球的终点,还包括球位、距离、使用的球杆等细节。然而,原始数据缺乏叙事力量。关键的下一步涉及一系列语境服务 (context services)。这些服务充当解释层,根据规则引擎 (rules engine) 分析传入的数据。

2. 规则引擎:增加智能:
该引擎对于确保生成的文本有意义并避免常见陷阱至关重要。Gutterman 举例说明:’在球员打出当天第一洞的第一杆后,它不会写成球员打出了当天最远的一杆。’ 规则规定了优先级,确保了多样性和相关性。’例如,我们可以告诉它,在处理攻果岭击球时,每三个叙述中提及一次标准杆上果岭 (greens in regulations),这样文本就不会在所有球员中变得冗余。’ 系统还被教导用不同的方式来描述类似动作——确保开球不会每次都被相同地描述,或者与推杆的描述方式相同。这涉及到将高尔夫知识和叙事最佳实践编码到系统的逻辑中。

3. 提示工程 (Prompt Engineering):
有了数据和语境规则,提示引擎 (prompt engine) 会构建给予 AI 模型的具体指令。这个提示有效地要求 AI 生成一个叙述,其中包含所提供的数据点并遵守语境指南。制作有效的提示是使用生成式 AI 的一项关键技能,它塑造了输出的风格、语气和内容。

4. AI 叙事生成:
精心构建的提示随后通过 AWS Bedrock 平台发送给 Anthropic Claude 3.5 Sonnet 模型。AI 处理请求并生成描述性文本——即击球叙事——融合了事实和期望的语境。例如,它可能不仅仅说明码数,还会补充说,’他刚刚打出了今天最远的一杆’ 或提供统计背景,如 ‘在 125 码外,他有 20% 的时间能将球打到距离球洞 10 英尺以内。’ 这种信息的层叠正是将输出提升到简单数据报告之上的原因。

5. 严格验证:
在任何 AI 生成的文本公开发布之前,它都要经过多阶段的验证过程,以确保准确性和质量。

  • 数据验证 (Data Verification): 将输出的叙述与输入的 ShotLink 数据进行核对。’来自 Claude 3.5 Sonnet 的输出叙述会经过一个验证服务,以确保输出中引用的 ShotLink 数据与输入系统的数据相匹配(例如,开球距离),’ Gutterman 解释说。这一步可以防止潜在的 AI ‘幻觉’ 或事实错误。
  • 余弦相似度 (Cosine Similarity): 接下来是一个更细致的检查,使用余弦相似度分析。这种技术测量生成的文本与针对给定类型击球的可接受描述语料库之间的语义相似度。’系统确保文本落在描述一次开球的合理表达范围内,’ Gutterman 补充道。这确保了语气和措辞是恰当的,并且与通常描述高尔夫动作的方式一致。
  • 发布引擎检查 (Publishing Engine Checks): 如果叙述通过了这些测试,它将进入发布引擎,在那里进行最终检查,然后集成到像 TOURCAST 应用程序这样的平台中。

这个细致的过程强调了对准确性和可靠性的承诺,这对于在体育信息传递中保持公信力至关重要。

实际应用:在 THE PLAYERS Championship 取得成功

这个由 AI 驱动的系统的理论潜力在 THE PLAYERS Championship 期间经受了一次重大的实际考验,这是 PGA TOUR 赛程中的旗舰赛事之一。这不是一次小规模试验;该系统被部署用于为整个赛场的所有四轮比赛生成叙事。

结果令人印象深刻。生成式 AI 系统在锦标赛周期间成功地为超过 30,000 次独立击球生成了描述性文本。这代表了报道深度的巨大飞跃,有效地为每位参赛者的每一次击球提供了叙事洞察。

同样重要的是系统的可靠性。’在 THE PLAYERS Championship 期间,这 30,000 次击球的准确率约为 96%,这符合我们的预期,’ Gutterman 报告说。在一个实时的、动态的体育赛事中达到这样的准确率水平,数据不断流动且语境快速变化,证明了底层技术的稳健性和验证过程的彻底性。虽然 96% 意味着有小部分需要审查或舍弃,但总体成功率证明了该系统在大规模部署中的可行性。这一成就验证了两年来的开发工作,并标志着 PGA TOUR 内容战略的一个重要里程碑。

规划未来:超越文本,迈向个性化

基于文本的叙事成功实施仅仅是 PGA TOUR 利用 AI 愿景的开端。当前的系统以文本为中心,主要是因为能够实时处理和解释直播视频和音频流的 AI 模型仍在成熟中。然而,发展路线图清晰地指向一个更沉浸式、多感官的未来。

多模态 AI 集成:
‘我们正在朝着一个目标努力,即结合实时数据、实时音频、实时视频,然后使用多模态输出来创建视频并生成语音,’ Gutterman 设想道。这预示着未来 AI 可能能够分析视频流来评论挥杆机制,解读球员反应,甚至评估人群噪音,将这些观察结果与 ShotLink 数据相结合,创造出更丰富的内容体验,甚至可能是带有 AI 生成画外音的自动化视频集锦。

合成语音评论:
一个更近期的目标是解决为球迷提供的众多 ‘Every Shot Live’(每次击球直播)流缺乏评论的问题。多年来,这些通常接近 50 个同步流的直播画面只有自然声音和统计数据叠加。’我们的目标始终是有人类来讲述故事,但在全天 48 个流中配备两名评论员成本过高,’ Gutterman 承认。生成式 AI 提供了一个可扩展的解决方案。’我们正在与 AWS 合作开发一种可以朗读提示 [叙事] 的合成语音。有了 AI,观众可以像打开隐藏式字幕一样打开评论。’ 这种能力还可以轻松扩展到多种语言,例如,只需轻点开关即可提供西班牙语评论,从而极大地提高可访问性。

战略性的模型无关性:
支撑这些未来发展的是 AWS Bedrock 提供的战略优势——模型无关性。PGA TOUR 并未锁定单一的 AI 模型提供商。’Bedrock 允许 PGA TOUR 保持模型无关性,并为任务找到最佳模型,’ Gutterman 强调。在快速发展的 AI 领域,这种灵活性至关重要。’如果未来的模型能够以更低的成本完成某项功能,PGA TOUR 可以毫无问题地转向它。’ 他否定了存在单一、全能模型的观点,观察到:’我们看到的情况并非如此。’ 策略是为特定任务使用最佳工具:Anthropic 的 Claude 用于细致的文本生成,可能使用新的 AWS Nova 模型处理图像识别任务,以及可能使用其他专门模型处理翻译等功能。这种方法在最大化能力的同时,优化了长期成本和性能。

终极目标:超个性化球迷体验

虽然技术进步本身令人印象深刻,但推动 PGA TOUR 生成式 AI 计划的驱动力是对从根本上转变球迷体验的追求:超个性化 (hyper-personalization)

为每次击球生成叙事背景的能力为提供根据个人偏好量身定制的内容奠定了基础。’它推动我们走向超个性化之路,球迷可以在一天结束时获得包含他们最喜爱球员最佳视频的故事,’ Gutterman 解释说。想象一下,一个应用程序能自动汇编一个精彩集锦,包含你最喜爱的高尔夫球手打出的每一次重要击球,并配有上下文叙事描述,在他们完成一轮比赛后不久就发送给你。

这超出了简单的内容策展。PGA TOUR 设想了能够进行预测性互动 (predictive engagement) 的系统。’应用程序已经知道你喜欢什么,并只为你提供你想要的内容,’ Gutterman 建议。通过学习球迷的偏好——最喜爱的球员、对特定统计数据(如开球距离或推杆表现)的兴趣,甚至偏爱的内容格式——平台可以主动提供最相关的信息和故事,甚至可能在球迷最喜爱的球员面临关键推杆或试图从历史上具有挑战性的位置击球时提醒他们。

这种级别的个性化旨在加深参与度,使高尔夫内容的消费对每个球迷来说更具相关性、效率,并最终更令人满意。通过利用生成式 AI 解锁其庞大数据储备中隐藏的叙事潜力,PGA TOUR 不仅仅是在扩展其报道范围;它正在开创一个未来,技术将根据每个关注者的独特视角来定制比赛的故事。被动接收单一广播信号的时代正在让位于与这项运动的动态、个性化和数据丰富的互动。