生成式AI革新PGA TOUR報導:解說逾三萬次擊球

職業高爾夫的世界,常透過電視轉播聚焦於領先者的狹窄視角來呈現,但其涵蓋的戲劇性遠比此更為廣闊。在 sprawling 的球場上,數十名競爭者同時應對挑戰、打出精彩擊球,並與自然環境搏鬥。捕捉這場競賽的全貌,長期以來一直是後勤與資源上的巨大挑戰。如今,精密數據收集與尖端人工智能的融合正在改寫劇本,讓 PGA TOUR 得以向球迷傳遞前所未有的細節與敘事背景,遠遠超越傳統報導的限制。在 THE PLAYERS Championship 期間一場引人注目的展示中,生成式 AI 被部署來為超過 30,000 次獨立的高爾夫擊球製作獨特的文字描述,為追隨者提供對整個賽場動態更豐富、更全面的理解。

持續的挑戰:擴展全面高爾夫報導的規模

數十年來,職業高爾夫錦標賽的敘事在很大程度上受到傳統媒體限制的支配。人類評論員和製作團隊自然會傾向於報導排行榜頂端的球員或那些已建立明星光環的球員。雖然這種方法提供了引人入勝的精彩片段,但無可避免地遺漏了競賽的大部分內容。賽事陣容常超過 140 名球員,每位球員在四天內每輪擊球次數可能超過 70 次,其行動總量極其龐大。

PGA TOUR 數位與廣播技術高級副總裁 Scott Gutterman 闡述了核心問題:「通常,我們的員工只能報導 25 或 30 位高爾夫球員。」這個營運現實意味著,潛在的數十名其他球員的故事——他們的勝利、掙扎和關鍵時刻——基本上未被講述,最多只能透過原始統計數據得知。追蹤領先群以外特定球員的球迷,對其表現的看法往往是零碎的。

PGA TOUR 內部的雄心很明確:利用由 CDW 支援的 ShotLink 所提供的極其豐富的數據流(捕捉每次擊球的精確細節),來創造一個更公平、更完整的敘事版圖。挑戰不在於缺乏數據,而在於無法以引人入勝的敘事格式,在涵蓋每位球員和每次擊球所需的規模下,處理、解釋和呈現這些數據。人力資源根本無法有效或經濟地彌補這一差距。期望是超越基本的指標——「JJ Spaun 開球 300 碼,距離球洞還有 125 碼」——Gutterman 指出,這多年來一直是標準。目標是為這些數據點注入意義和背景,將原始數字轉化為每位競爭者的引人入勝的敘事元素。

生成式 AI 登場:變革的技術催化劑

認識到人工智能克服規模挑戰的潛力,PGA TOUR 大約在兩年前開始了對生成式 AI 能力的專門探索。這不僅僅是一項學術研究;它是由一個根本問題驅動的:這項快速發展的技術如何能增強內容創作,並且至關重要地,更好地服務於核心利害關係人——球迷、球員和錦標賽本身?

這段旅程涉及與關鍵技術合作夥伴 Amazon Web Services (AWS) 的密切合作。TOUR 成為 AWS Bedrock 的基礎合作夥伴,AWS Bedrock 是一項託管服務,透過單一 API 提供對各種領先基礎模型 (FMs) 的存取。Gutterman 解釋了其策略優勢:「Bedrock 實際上讓你可以使用幾乎任何生成式 AI 模型和一套工具來創建這類體驗。」這種平台方法提供了靈活性和未來保障,避免了對單一 AI 提供商或模型架構的依賴。

對於生成描述性文本的具體任務,TOUR 選擇了由 Anthropic 開發、可透過 Bedrock 存取的模型。「我們正在使用 Anthropic 的 Claude 模型來創建這類體驗。特別是,我們正在使用 Anthropic Claude 3.5 Sonnet,」Gutterman 具體說明。過去一年標誌著一個關鍵的轉變,從最初的概念驗證 (POCs) 走向全面營運化。這涉及建立強大的基礎設施和工作流程,以便可靠且大規模地將 AI 整合到現場錦標賽報導中。焦點從展示可能性轉向實施一個實用、可重複的系統,能夠處理職業高爾夫錦標賽動態、高流量的環境。選擇 Claude 3.5 Sonnet 反映了基於其在生成細膩、具備語境感知能力、適合體育評論的文本方面的感知優勢所做的選擇。

打造敘事:AI 幕後一瞥

在近乎即時的情況下生成數以萬計獨特、準確且與語境相關的擊球描述,是一項複雜的協調工作。它涉及的不僅僅是將原始數據輸入 AI 模型。PGA TOUR 與 AWS 合作,設計了一個精密的流程管道,將 ShotLink 數據轉化為引人入勝的敘事。

1. 數據擷取與語境化:
過程始於來自 ShotLink 的數據流。這不僅僅是擊球的終點,還包括球位、距離、使用的球桿等細節。然而,原始數據缺乏敘事力。關鍵的下一步涉及一組語境服務 (context services)。這些服務扮演解釋層的角色,根據規則引擎 (rules engine) 分析傳入的數據。

2. 規則引擎:增添智慧:
該引擎對於確保生成的文本有意義並避免常見陷阱至關重要。Gutterman 舉例說明:「在球員打出當天第一洞的第一桿後,它不會寫成該球員打出了當天最遠的開球。」規則設定了優先級,確保多樣性和相關性。「例如,我們可以告訴它在處理進攻果嶺的擊球時,每三個敘述提及一次標準桿上果嶺 (greens in regulations),這樣文本就不會在所有球員之間變得重複。」系統也被教導用不同的方式來描述相似的動作——確保開球不會每次都被相同地描述,或者與推桿的描述方式相同。這涉及到將高爾夫知識和敘事最佳實踐編碼到系統的邏輯中。

3. 提示工程 (Prompt Engineering):
有了數據和語境規則,一個提示引擎 (prompt engine) 會構建給予 AI 模型的具體指令。這個提示有效地要求 AI 生成一個包含所提供數據點並遵守語境指南的敘事。製作有效的提示是使用生成式 AI 的一項關鍵技能,它塑造了輸出的風格、語氣和內容。

4. AI 敘事生成:
精心構建的提示隨後透過 AWS Bedrock 平台發送給 Anthropic Claude 3.5 Sonnet 模型。AI 處理請求並生成描述性文本——即擊球敘事——融合了事實和期望的語境。例如,它可能不僅僅陳述碼數,還會補充說,「他剛剛打出了今天最遠的開球」,或者提供統計背景,如「在 125 碼外,他有 20% 的機率將球打到距離洞口 10 英尺內。」這種信息的層疊正是將輸出提升到超越簡單數據報告水平的原因。

5. 嚴格驗證:
在任何 AI 生成的文本向公眾發布之前,它都會經過多階段的驗證過程,以確保準確性和品質。

  • 數據驗證 (Data Verification): 輸出的敘事會與輸入的 ShotLink 數據進行核對。「來自 Claude 3.5 Sonnet 的輸出敘事會經過一個驗證服務,以確保輸出中引用的 ShotLink 數據與輸入系統的數據相符(例如,開球距離),」Gutterman 解釋道。這一步驟防範了潛在的 AI「幻覺」或事實錯誤。
  • 餘弦相似度 (Cosine Similarity): 接著進行更細緻的檢查,使用餘弦相似度分析。這項技術測量生成文本與針對給定類型擊球的可接受描述語料庫之間的語義相似度。「系統確保文本落在描述一次開球的合理範圍內,」Gutterman 補充道。這確保了語氣和措辭是適當的,並且與通常描述高爾夫動作的方式一致。
  • 發布引擎檢查 (Publishing Engine Checks): 如果敘事通過了這些測試,它將進入發布引擎,在那裡進行最終檢查,然後整合到像 TOURCAST 應用程式這樣的平台中。

這個細緻的過程強調了對準確性和可靠性的承諾,這對於在體育資訊傳遞中維持公信力至關重要。

現實世界實施:在 THE PLAYERS Championship 取得成功

這個由 AI 驅動的系統的理論潛力,在 THE PLAYERS Championship 期間經受了一次重大的現實世界考驗,這是 PGA TOUR 賽程中的旗艦賽事之一。這並非小規模試驗;該系統被部署來為整個賽事陣容在全部四輪比賽中生成敘事。

結果令人印象深刻。生成式 AI 系統在錦標賽週期間成功地為超過 30,000 次獨立擊球生成了描述性文本。這代表了報導深度的一次巨大飛躍,有效地為每位參賽者打出的每一次擊球提供了敘事洞察。

同樣重要的是系統的可靠性。「在 THE PLAYERS Championship 期間,這 30,000 次擊球的準確率約為 96%,這符合我們的預期,」Gutterman 報告說。在一個現場、動態的體育賽事中達到這樣的準確率水平,數據不斷流動且語境快速變化,證明了底層技術的穩健性以及驗證流程的周密性。雖然 96% 意味著有小部分需要審查或捨棄,但總體成功率證明了該系統在大規模部署方面的可行性。這一成就驗證了兩年的開發工作,並標誌著 TOUR 內容策略的一個重要里程碑。

規劃未來:超越文本,邁向個人化

基於文本的敘事成功實施,僅僅是 PGA TOUR 利用 AI 願景的開端。目前的系統以文本為中心,主要是因為能夠即時處理和解釋現場視頻和音頻流的 AI 模型仍在成熟中。然而,路線圖明確指向一個更沉浸式、多感官的未來。

多模態 AI 整合:
「我們正在朝著這樣一天努力,屆時將結合現場數據、現場音頻、現場視頻,然後使用多模態輸出來創建視頻並生成語音,」Gutterman 設想道。這暗示著未來 AI 可能能夠分析視頻饋送來評論揮桿機制、解讀球員反應,甚至評估人群噪音,將這些觀察結果與 ShotLink 數據整合,創造更豐富的內容體驗,甚至可能是帶有 AI 生成配音的自動化視頻集錦。

合成語音評論:
一個更近期的目標是解決球迷可觀看的大量「Every Shot Live」直播流缺乏評論的問題。多年來,這些通常接近 50 個同步直播流的饋送,僅提供自然聲音和統計數據疊加。「我們的目標始終是讓人類來講述故事,但在全天 48 個直播流中安排兩名評論員的成本過高,」Gutterman 承認。生成式 AI 提供了一個可擴展的解決方案。「我們正在與 AWS 合作開發一種可以讀出提示 [敘事] 的合成語音。有了 AI,觀眾可以像打開隱藏式字幕一樣打開評論。」這項功能也可以輕易擴展到多種語言,例如,只需輕按開關即可提供西班牙語評論,從而顯著提高可及性。

策略性的模型無關性 (Model Agnosticism):
支撐這些未來發展的是 AWS Bedrock 提供的策略優勢——模型無關性。TOUR 並未被鎖定在單一 AI 模型提供商。「Bedrock 讓 PGA TOUR 能夠保持模型無關,並為任務找到最佳模型,」Gutterman 強調。在快速發展的 AI 領域,這種靈活性至關重要。「如果未來的模型能以更低的成本完成某項功能,Tour 可以毫無問題地轉向它。」他駁斥了單一、全能模型的概念,觀察到:「我們看到的情況並非如此。」策略是為工作選擇最佳工具:Anthropic 的 Claude 用於細膩的文本生成,可能新的 AWS Nova 模型用於圖像識別任務,或許還有其他專門模型用於翻譯等功能。這種方法在最大化能力的同時,也優化了長期的成本和性能。

終極獎賞:超個人化球迷體驗

雖然技術進步本身令人印象深刻,但推動 PGA TOUR 生成式 AI 計劃的驅動力是對從根本上轉變球迷體驗的追求:超個人化 (hyper-personalization)

為每次擊球生成敘事背景的能力,為提供根據個人偏好量身定制的內容奠定了基礎。「它推動我們走向超個人化的道路,球迷可以在一天結束時獲得包含他們最喜愛球員最佳視頻的故事,」Gutterman 解釋道。想像一下,一個應用程式自動彙編一個包含你最喜愛的高爾夫球員打出的每一次重要擊球的精彩集錦,配有語境敘事描述,在他們完成該輪比賽後不久就送達。

這超越了簡單的內容策劃。TOUR 設想了能夠進行預測性互動 (predictive engagement) 的系統。「應用程式已經知道你喜歡什麼,並只提供你想要的內容,」Gutterman 建議。通過學習球迷的偏好——最喜愛的球員、對特定統計數據(如開球距離或推桿表現)的興趣,甚至偏好的內容格式——平台可以主動提供最相關的信息和故事,甚至可能在球迷最喜愛的球員面臨關鍵推桿或試圖從歷史上具有挑戰性的位置擊球時提醒他們。

這種程度的個人化旨在加深參與度,使高爾夫內容的消費對每個球迷來說更具相關性、效率,並最終更令人滿意。通過利用生成式 AI 解鎖其龐大數據儲備中隱藏的敘事潛力,PGA TOUR 不僅僅是在擴大其報導規模;它正在開創一個未來,讓技術根據每位追隨者的獨特視角來量身定制比賽的故事。被動接收單一廣播饋送的時代正在讓位於與這項運動的動態、個人化和數據豐富的互動。