Świat profesjonalnego golfa, często postrzegany przez wąski pryzmat transmisji telewizyjnych skupiających się na liderach turniejów, obejmuje znacznie szerszy dramat. Na rozległych polach golfowych dziesiątki zawodników jednocześnie stawiają czoła wyzwaniom, wykonują genialne uderzenia i walczą z żywiołami. Uchwycenie pełnego zakresu tej rywalizacji od dawna stanowiło wyzwanie logistyczne i wymagające dużych zasobów. Teraz połączenie zaawansowanego zbierania danych i najnowocześniejszej sztucznej inteligencji pisze scenariusz na nowo, pozwalając PGA TOUR dostarczać fanom bezprecedensowy poziom szczegółowości i kontekstu narracyjnego, wykraczając daleko poza ograniczenia tradycyjnych relacji. W uderzającej demonstracji podczas THE PLAYERS Championship, generatywna AI została wykorzystana do stworzenia unikalnych opisów pisemnych dla ponad 30 000 indywidualnych uderzeń golfowych, oferując kibicom bogatsze, bardziej kompleksowe zrozumienie akcji rozgrywającej się na całym polu.
Trwałe wyzwanie: Skalowanie kompleksowych relacji z golfa
Przez dziesięciolecia narracja profesjonalnego turnieju golfowego była w dużej mierze dyktowana ograniczeniami tradycyjnych mediów. Komentatorzy i ekipy produkcyjne naturalnie тяжіють do graczy zajmujących czołowe miejsca w tabeli liderów lub tych o ugruntowanej pozycji gwiazd. Chociaż takie podejście dostarcza fascynujących skrótów, nieuchronnie pozostawia ogromne obszary rywalizacji nieudokumentowane. Przy polach często przekraczających 140 graczy, z których każdy wykonuje ponad 70 uderzeń na rundę przez cztery dni, sama objętość akcji jest ogromna.
Scott Gutterman, Senior Vice President of Digital and Broadcast Technologies w PGA TOUR, artykułuje główny problem: ‘Zazwyczaj nasz personel może objąć relacją 25 lub 30 golfistów’. Ta operacyjna rzeczywistość oznaczała, że historie potencjalnie dziesiątek innych graczy – ich triumfy, zmagania i kluczowe momenty – pozostawały w dużej mierze nieopowiedziane, dostępne co najwyżej poprzez surowe statystyki. Fani śledzący konkretnych graczy spoza czołówki często mieli fragmentaryczny obraz ich występów.
Ambicja w PGA TOUR była jasna: wykorzystać niezwykle bogaty strumień danych dostarczany przez ShotLink, wspierany przez CDW, który przechwytuje precyzyjne szczegóły każdego wykonanego uderzenia, aby stworzyć bardziej sprawiedliwy i kompletny krajobraz narracyjny. Wyzwaniem nie był brak danych, ale niemożność przetworzenia, zinterpretowania i zaprezentowania tych danych w przekonującym, narracyjnym formacie na skalę wymaganą do objęcia każdego gracza i każdego uderzenia. Zasoby ludzkie po prostu nie mogły skutecznie ani ekonomicznie wypełnić tej luki. Pragnieniem było wyjście poza podstawowe metryki – ‘JJ Spaun uderzył drive na 300 jardów i ma 125 jardów do dołka’ – co, jak zauważa Gutterman, było standardem przez lata. Celem było nadanie tym punktom danych znaczenia i kontekstu, przekształcając surowe liczby w angażujące elementy opowieści dla każdego zawodnika.
Wejście generatywnej AI: Technologiczny katalizator zmian
Dostrzegając potencjał sztucznej inteligencji do pokonania wyzwania skalowania, PGA TOUR rozpoczęło dedykowane badanie możliwości generatywnej AI około dwa lata temu. Nie było to jedynie ćwiczenie akademickie; kierowało nim fundamentalne pytanie: jak ta szybko ewoluująca technologia może usprawnić tworzenie treści i, co kluczowe, lepiej służyć głównym interesariuszom – fanom, graczom i samym turniejom?
Podróż ta obejmowała ścisłą współpracę z kluczowym partnerem technologicznym, Amazon Web Services (AWS). TOUR stał się fundamentalnym partnerem dla AWS Bedrock, zarządzanej usługi oferującej dostęp do różnorodnych wiodących modeli podstawowych (FMs) za pośrednictwem jednego API. Gutterman wyjaśnia strategiczną przewagę: ‘Bedrock skutecznie pozwala używać niemal każdego modelu generatywnej AI i zestawu narzędzi do tworzenia tego typu doświadczeń’. Takie podejście platformowe zapewniło elastyczność i przyszłościowe zabezpieczenie, unikając zależności od jednego dostawcy AI lub architektury modelu.
Do konkretnego zadania generowania tekstu opisowego, TOUR wybrał modele opracowane przez Anthropic, dostępne za pośrednictwem Bedrock. ‘Używamy modeli Claude firmy Anthropic do tworzenia tego typu doświadczeń. W szczególności używamy Anthropic Claude 3.5 Sonnet’, precyzuje Gutterman. Miniony rok oznaczał krytyczne przejście, wykraczające poza początkowe dowody koncepcji (POCs) w kierunku pełnej operacjonalizacji. Obejmowało to budowę solidnej infrastruktury i przepływów pracy potrzebnych do niezawodnego i skalowalnego integrowania AI z relacjami na żywo z turniejów. Skupiono się na przejściu od demonstrowania możliwości do wdrożenia praktycznego, powtarzalnego systemu zdolnego do obsługi dynamicznego środowiska o dużej objętości danych profesjonalnego turnieju golfowego. Wybór Claude 3.5 Sonnet odzwierciedla selekcję opartą na jego postrzeganych mocnych stronach w generowaniu zniuansowanego, świadomego kontekstu tekstu odpowiedniego dla komentarza sportowego.
Tworzenie narracji: Spojrzenie za kulisy AI
Generowanie dziesiątek tysięcy unikalnych, dokładnych i kontekstowo istotnych opisów uderzeń w czasie zbliżonym do rzeczywistego jest złożoną orkiestracją. Wymaga znacznie więcej niż tylko wprowadzenia surowych danych do modelu AI. PGA TOUR, we współpracy z AWS, zaprojektowało zaawansowany potok przetwarzania, aby przekształcić dane ShotLink w fascynujące narracje.
1. Pozyskiwanie danych i kontekstualizacja:
Proces rozpoczyna się od strumienia danych z ShotLink. Nie jest to tylko punkt końcowy uderzenia, ale obejmuje szczegóły takie jak położenie piłki (lie), dystans, użyty kij i inne. Jednak surowe dane nie mają siły narracyjnej. Kluczowym następnym krokiem jest zestaw usług kontekstowych. Usługi te działają jako warstwa interpretacyjna, analizując przychodzące dane w odniesieniu do silnika reguł.
2. Silnik reguł: Dodawanie inteligencji:
Ten silnik jest niezbędny do zapewnienia, że generowany tekst jest znaczący i unika typowych pułapek. Gutterman podaje przykłady: ‘po tym, jak gracz wykona pierwsze uderzenie z tee w danym dniu z pierwszego dołka, system nie pisze, że gracz uderzył najdłuższy drive dnia’. Reguły dyktują priorytety, zapewniając różnorodność i trafność. ‘Na przykład, możemy mu powiedzieć, aby mówił o greens in regulation przy uderzeniach podejściowych co trzy narracje, aby tekst nie stał się redundantny dla wszystkich graczy’. System jest również uczony różnych sposobów formułowania opisów dla podobnych działań – zapewniając, że drive nie jest opisywany identycznie za każdym razem, ani w ten sam sposób co putt. Obejmuje to kodowanie wiedzy golfowej i najlepszych praktyk narracyjnych w logice systemu.
3. Inżynieria promptów (Prompt Engineering):
Uzbrojony w dane i reguły kontekstowe, silnik promptów formułuje konkretną instrukcję przekazywaną modelowi AI. Ten prompt skutecznie prosi AI o wygenerowanie narracji uwzględniającej dostarczone punkty danych i przestrzegającej wytycznych kontekstowych. Tworzenie skutecznych promptów jest kluczową umiejętnością w pracy z generatywną AI, kształtując styl, ton i treść wyniku.
4. Generowanie narracji przez AI:
Starannie skonstruowany prompt jest następnie wysyłany do modelu Anthropic Claude 3.5 Sonnet za pośrednictwem platformy AWS Bedrock. AI przetwarza żądanie i generuje tekst opisowy – narrację uderzenia – uwzględniając fakty i pożądany kontekst. Na przykład, zamiast tylko podawać odległość, może dodać: ‘właśnie uderzył swój najdłuższy drive dnia’ lub podać kontekst statystyczny, np.: ‘z odległości 125 jardów, trafia w promieniu 10 stóp od dołka w 20% przypadków’. To warstwowanie informacji podnosi jakość wyniku ponad proste raportowanie danych.
5. Rygorystyczna walidacja:
Zanim jakikolwiek tekst wygenerowany przez AI dotrze do publiczności, przechodzi wieloetapowy proces walidacji w celu zapewnienia dokładności i jakości.
- Weryfikacja danych (Data Verification): Wynikowa narracja jest sprawdzana pod kątem zgodności z wejściowymi danymi ShotLink. ‘Wynikowa narracja z Claude 3.5 Sonnet przechodzi przez usługę walidacji, aby upewnić się, że dane ShotLink, do których odnosi się wynik, zgadzają się z tym, co zostało wprowadzone do systemu (na przykład dystans drive’u)’, wyjaśnia Gutterman. Ten krok chroni przed potencjalnymi ‘halucynacjami’ AI lub błędami faktycznymi.
- Podobieństwo kosinusowe (Cosine Similarity): Następuje bardziej zniuansowana kontrola, wykorzystująca analizę podobieństwa kosinusowego. Technika ta mierzy podobieństwo semantyczne między wygenerowanym tekstem a korpusem akceptowalnych opisów dla danego typu uderzenia. ‘System upewnia się, że tekst mieści się w zakresie tego, jak można by mówić o drive’ie’, dodaje Gutterman. Zapewnia to, że ton i sformułowania są odpowiednie i spójne z tym, jak zazwyczaj opisuje się akcje w golfie.
- Kontrole silnika publikacji (Publishing Engine Checks): Jeśli narracja przejdzie te testy, przechodzi do silnika publikacji, gdzie odbywają się ostateczne kontrole przed zintegrowaniem jej z platformami takimi jak aplikacja TOURCAST.
Ten skrupulatny proces podkreśla zaangażowanie w dokładność i niezawodność, niezbędne do utrzymania wiarygodności w dostarczaniu informacji sportowych.
Wdrożenie w świecie rzeczywistym: Sukces na THE PLAYERS Championship
Teoretyczny potencjał tego systemu napędzanego przez AI został poddany znaczącemu testowi w świecie rzeczywistym podczas THE PLAYERS Championship, jednego z flagowych wydarzeń w kalendarzu PGA TOUR. Nie była to próba na małą skalę; system został wdrożony do generowania narracji dla całego pola graczy przez wszystkie cztery rundy.
Wyniki były imponujące. System generatywnej AI z powodzeniem wyprodukował tekst opisowy dla ponad 30 000 indywidualnych uderzeń podczas tygodnia turniejowego. Stanowi to monumentalny skok w głębi relacji, skutecznie dostarczając wglądu narracyjnego dla każdego pojedynczego uderzenia wykonanego przez każdego zawodnika.
Równie ważna była niezawodność systemu. ‘Podczas THE PLAYERS Championship dokładność dla 30 000 uderzeń wyniosła około 96%, co było zgodne z naszymi oczekiwaniami’, raportuje Gutterman. Osiągnięcie tego poziomu dokładności w dynamicznym wydarzeniu sportowym na żywo, gdzie dane stale napływają, a kontekst szybko się zmienia, jest świadectwem solidności podstawowej technologii i dokładności procesów walidacji. Chociaż 96% oznacza niewielki odsetek wymagający przeglądu lub odrzucenia, ogólny wskaźnik sukcesu zademonstrował żywotność systemu do wdrożenia na dużą skalę. To osiągnięcie potwierdziło dwa lata rozwoju i stanowiło znaczący kamień milowy w strategii treści TOUR.
Wytyczanie przyszłości: Poza tekst i w kierunku personalizacji
Pomyślne wdrożenie narracji tekstowych to dopiero początek wizji PGA TOUR dotyczącej wykorzystania AI. Obecny system jest skoncentrowany na tekście głównie dlatego, że modele AI zdolne do przetwarzania i interpretowania strumieni wideo i audio na żywo w czasie rzeczywistym wciąż dojrzewają. Jednak mapa drogowa wyraźnie wskazuje na bardziej immersyjną, wielozmysłową przyszłość.
Integracja multimodalnej AI:
‘Budujemy w kierunku dnia, w którym będzie to połączenie danych na żywo, audio na żywo, wideo na żywo, a następnie wykorzystanie multimodalnego wyjścia do tworzenia wideo i generowania głosu’, przewiduje Gutterman. Sugeruje to przyszłość, w której AI mogłaby potencjalnie analizować materiały wideo, aby komentować mechanikę swingu, interpretować reakcje graczy, a nawet oceniać hałas tłumu, integrując te obserwacje z danymi ShotLink, aby tworzyć jeszcze bogatsze doświadczenia treściowe, być może nawet zautomatyzowane skróty wideo z lektorem generowanym przez AI.
Komentarz głosem syntetycznym:
Bardziej bezpośrednim celem jest rozwiązanie problemu braku komentarza w licznych strumieniach ‘Every Shot Live’ dostępnych dla fanów. Przez lata te transmisje, często liczące blisko 50 jednoczesnych strumieni, zawierały tylko naturalny dźwięk i nakładki statystyczne. ‘Naszym celem jest zawsze, aby człowiek opowiadał historię, ale posiadanie dwóch komentatorów dla 48 strumieni przez cały dzień jest kosztowne’, przyznaje Gutterman. Generatywna AI oferuje skalowalne rozwiązanie. ‘Pracujemy z AWS nad syntetycznym głosem, który może odczytywać prompty [narracje]. Dzięki AI widz mógłby włączyć komentarz w taki sam sposób, w jaki włącza napisy’. Ta możliwość mogłaby również łatwo rozszerzyć się na wiele języków, oferując na przykład komentarz w języku hiszpańskim za jednym kliknięciem, dramatycznie zwiększając dostępność.
Strategiczna agnostyczność modelowa:
U podstaw tych przyszłych zmian leży strategiczna przewaga zapewniana przez AWS Bedrock – agnostyczność modelowa. TOUR nie jest związany z jednym dostawcą modeli AI. ‘Bedrock pozwala PGA TOUR być agnostycznym modelowo i znaleźć najlepszy model do zadania’, podkreśla Gutterman. Ta elastyczność jest kluczowa w szybko ewoluującym krajobrazie AI. ‘Jeśli przyszłe modele będą mogły wykonać funkcję po niższych kosztach, Tour może bez problemu się na nie przestawić’. Odrzuca on ideę jednego, wszechmocnego modelu, zauważając: ‘To, co widzimy, to że tak nie jest’. Strategia polega na używaniu najlepszego narzędzia do pracy: Claude firmy Anthropic do zniuansowanego generowania tekstu, potencjalnie nowego modelu AWS Nova do zadań rozpoznawania obrazów, a być może innych wyspecjalizowanych modeli do funkcji takich jak tłumaczenie. Takie podejście maksymalizuje możliwości, jednocześnie optymalizując koszty i wydajność w dłuższej perspektywie.
Ostateczna nagroda: Hiper-spersonalizowane doświadczenia fanów
Chociaż postępy technologiczne są imponujące same w sobie, siłą napędową inicjatyw generatywnej AI PGA TOUR jest dążenie do fundamentalnie przekształconego doświadczenia fanów: hiper-personalizacji.
Zdolność do generowania kontekstu narracyjnego dla każdego uderzenia kładzie podwaliny pod dostarczanie treści dostosowanych specjalnie do indywidualnych preferencji. ‘To posuwa nas naprzód drogą hiper-personalizacji, gdzie fan może otrzymać historię na koniec dnia z najlepszym wideo od swoich ulubionych graczy’, wyjaśnia Gutterman. Wyobraź sobie aplikację automatycznie kompilującą skrót najważniejszych wydarzeń zawierający każde znaczące uderzenie wykonane przez Twojego ulubionego golfistę, wraz z kontekstowymi opisami narracyjnymi, dostarczony wkrótce po zakończeniu jego rundy.
Wykracza to poza prostą kurację. TOUR przewiduje systemy zdolne do predykcyjnego zaangażowania. ‘Aplikacja już wie, co lubisz i po prostu serwuje Ci to, czego chcesz’, sugeruje Gutterman. Ucząc się preferencji fana – ulubionych graczy, zainteresowania konkretnymi statystykami (jak dystans drive’u czy skuteczność puttowania), a nawet preferowanych formatów treści – platforma mogłaby proaktywnie dostarczać najbardziej istotne informacje i historie, być może nawet powiadamiając fana, gdy jego ulubiony gracz staje przed krytycznym puttem lub próbuje uderzenia z historycznie trudnej pozycji.
Ten poziom personalizacji ma na celu pogłębienie zaangażowania, czyniąc konsumpcję treści golfowych bardziej trafną, efektywną i ostatecznie bardziej satysfakcjonującą dla każdego indywidualnego fana. Wykorzystując generatywną AI do odblokowania potencjału narracyjnego ukrytego w ogromnych zasobach danych, PGA TOUR nie tylko skaluje swoje relacje; jest pionierem przyszłości, w której technologia dostosowuje historię gry do unikalnej perspektywy każdego kibica. Era pasywnego odbierania pojedynczej transmisji ustępuje miejsca dynamicznemu, spersonalizowanemu i bogatemu w dane zaangażowaniu w sport.