دنیای گلف حرفهای، که اغلب از دریچه تنگ پخش تلویزیونی متمرکز بر پیشتازان مسابقات دیده میشود، درامی بسیار گستردهتر را در بر میگیرد. در زمینهای وسیع، دهها رقیب به طور همزمان با چالشها دست و پنجه نرم میکنند، ضربات درخشانی را اجرا میکنند و با عوامل طبیعی مبارزه میکنند. پوشش کامل این رقابتها مدتهاست که یک چالش لجستیکی و نیازمند منابع فراوان بوده است. اکنون، همگرایی جمعآوری دادههای پیچیده و هوش مصنوعی پیشرفته در حال بازنویسی این سناریو است و به PGA TOUR اجازه میدهد تا سطح بیسابقهای از جزئیات و زمینه روایی را به طرفداران ارائه دهد و بسیار فراتر از محدودیتهای پوشش سنتی حرکت کند. در نمایشی چشمگیر در طول مسابقات قهرمانی THE PLAYERS Championship، هوش مصنوعی مولد برای ایجاد توضیحات نوشتاری منحصر به فرد برای بیش از ۳۰۰۰۰ ضربه گلف فردی به کار گرفته شد و به دنبالکنندگان درک غنیتر و جامعتری از اتفاقاتی که در کل زمین رخ میدهد، ارائه داد.
چالش همیشگی: مقیاسپذیری پوشش جامع گلف
برای دههها، روایت یک تورنمنت گلف حرفهای عمدتاً توسط محدودیتهای رسانههای سنتی دیکته شده است. مفسران انسانی و تیمهای تولید به طور طبیعی به سمت بازیکنانی که در صدر جدول امتیازات قرار دارند یا آنهایی که قدرت ستارهای تثبیت شده دارند، گرایش پیدا میکنند. در حالی که این رویکرد نکات برجسته جذابی را ارائه میدهد، به ناچار بخشهای وسیعی از رقابت را بدون مستندسازی باقی میگذارد. با حضور بیش از ۱۴۰ بازیکن در زمین، که هر کدام بیش از ۷۰ ضربه در هر دور در طول چهار روز میزنند، حجم عظیم اتفاقات بسیار زیاد است.
Scott Gutterman، معاون ارشد فناوریهای دیجیتال و پخش در PGA TOUR، مشکل اصلی را بیان میکند: ‘معمولاً، کارکنان ما میتوانند ۲۵ یا ۳۰ گلفباز را پوشش دهند.’ این واقعیت عملیاتی به این معنی بود که داستانهای دهها بازیکن دیگر - پیروزیها، تلاشها و لحظات حساس آنها - عمدتاً ناگفته باقی میماند و در صورت امکان، فقط از طریق آمار خام قابل دسترسی بود. طرفدارانی که بازیکنان خاصی را خارج از گروه پیشرو دنبال میکردند، اغلب دیدگاه پراکندهای از عملکرد آنها داشتند.
جاهطلبی در PGA TOUR واضح بود: استفاده از جریان داده فوقالعاده غنی ارائه شده توسط ShotLink، که توسط CDW پشتیبانی میشود و جزئیات دقیقی از هر ضربه زده شده را ثبت میکند، برای ایجاد یک چشمانداز روایی عادلانهتر و کاملتر. چالش کمبود داده نبود، بلکه ناتوانی در پردازش، تفسیر و ارائه آن دادهها در قالبی روایی و جذاب در مقیاس مورد نیاز برای پوشش هر بازیکن و هر ضربه بود. منابع انسانی به سادگی نمیتوانستند این شکاف را به طور مؤثر یا اقتصادی پر کنند. تمایل این بود که فراتر از معیارهای اساسی حرکت کنیم - ‘JJ Spaun یک درایو ۳۰۰ یاردی زد و ۱۲۵ یارد تا حفره فاصله دارد’ - که Gutterman اشاره میکند، سالها استاندارد بوده است. هدف این بود که به این نقاط داده معنا و زمینه تزریق شود و اعداد خام به عناصر داستانسرایی جذاب برای هر رقیب تبدیل شوند.
ورود هوش مصنوعی مولد: کاتالیزور فناورانه برای تغییر
PGA TOUR با تشخیص پتانسیل هوش مصنوعی برای غلبه بر چالش مقیاسپذیری، حدود دو سال پیش کاوش اختصاصی در قابلیتهای هوش مصنوعی مولد را آغاز کرد. این صرفاً یک تمرین آکادمیک نبود؛ بلکه توسط یک سوال اساسی هدایت میشد: چگونه این فناوری به سرعت در حال تکامل میتواند تولید محتوا را بهبود بخشد و مهمتر از آن، به ذینفعان اصلی - طرفداران، بازیکنان و خود مسابقات - بهتر خدمت کند؟
این سفر شامل همکاری نزدیک با یک شریک کلیدی فناوری، Amazon Web Services (AWS) بود. TOUR به یک شریک بنیادی برای AWS Bedrock تبدیل شد، یک سرویس مدیریت شده که دسترسی به انواع مدلهای پایه (FMs) پیشرو را از طریق یک API واحد ارائه میدهد. Gutterman مزیت استراتژیک را توضیح میدهد: ‘Bedrock به طور مؤثر به شما امکان میدهد تقریباً از هر مدل هوش مصنوعی مولد و مجموعهای از ابزارها برای ایجاد این نوع تجربیات استفاده کنید.’ این رویکرد پلتفرمی، انعطافپذیری و آیندهنگری را فراهم کرد و از وابستگی به یک ارائهدهنده یا معماری مدل هوش مصنوعی واحد جلوگیری کرد.
برای وظیفه خاص تولید متن توصیفی، TOUR مدلهای توسعهیافته توسط Anthropic را که از طریق Bedrock قابل دسترسی هستند، انتخاب کرد. Gutterman مشخص میکند: ‘ما از مدلهای Claude شرکت Anthropic برای ایجاد این نوع تجربیات استفاده میکنیم. به طور خاص، ما از Anthropic Claude 3.5 Sonnet استفاده میکنیم.’ سال گذشته یک گذار حیاتی بود، حرکت فراتر از اثباتهای اولیه مفهوم (POCs) به سمت عملیاتیسازی کامل. این شامل ساخت زیرساختها و گردشهای کاری قوی مورد نیاز برای ادغام هوش مصنوعی در پوشش زنده مسابقات به طور قابل اعتماد و در مقیاس بود. تمرکز از نشان دادن امکانپذیری به پیادهسازی یک سیستم عملی و تکرارپذیر که قادر به مدیریت محیط پویا و پرحجم یک تورنمنت گلف حرفهای باشد، تغییر کرد. انتخاب Claude 3.5 Sonnet نشاندهنده انتخابی بر اساس نقاط قوت درک شده آن در تولید متن ظریف و آگاه از زمینه مناسب برای تفسیر ورزشی است.
ساخت روایت: نگاهی به پشت پرده هوش مصنوعی
تولید دهها هزار توصیف ضربه منحصر به فرد، دقیق و مرتبط با زمینه در زمان تقریباً واقعی، یک هماهنگی پیچیده است. این شامل چیزی بسیار بیشتر از تغذیه صرف دادههای خام به یک مدل هوش مصنوعی است. PGA TOUR، با همکاری AWS، یک خط لوله پیچیده برای تبدیل دادههای ShotLink به روایتهای جذاب مهندسی کرد.
۱. دریافت و زمینهسازی دادهها:
فرآیند با جریان داده از ShotLink آغاز میشود. این فقط نقطه پایانی یک ضربه نیست، بلکه شامل جزئیاتی مانند وضعیت توپ (lie)، فاصله، چوب استفاده شده و موارد دیگر است. با این حال، دادههای خام فاقد قدرت روایی هستند. گام حیاتی بعدی شامل مجموعهای از سرویسهای زمینه (context services) است. این سرویسها به عنوان یک لایه تفسیری عمل میکنند و دادههای ورودی را در برابر یک موتور قوانین (rules engine) تجزیه و تحلیل میکنند.
۲. موتور قوانین: افزودن هوشمندی:
این موتور برای اطمینان از معنادار بودن متن تولید شده و جلوگیری از مشکلات رایج حیاتی است. Gutterman مثالهایی ارائه میدهد: ‘بعد از اینکه بازیکنی اولین ضربه تی (tee shot) روز را از حفره اول میزند، نمینویسد که بازیکن طولانیترین درایو روز را زده است.’ قوانین اولویتها را تعیین میکنند و تنوع و ارتباط را تضمین میکنند. ‘به عنوان مثال، ما میتوانیم به آن بگوییم که در مورد رسیدن به گرین در ضربات نزدیکشونده (approach shots) هر سه روایت صحبت کند تا متن در بین همه بازیکنان تکراری نشود.’ همچنین به سیستم روشهای مختلفی برای بیان توصیفات برای اقدامات مشابه آموزش داده میشود - اطمینان از اینکه یک درایو هر بار به طور یکسان توصیف نمیشود، یا به همان روشی که یک پات (putt) توصیف میشود. این شامل کدگذاری دانش گلف و بهترین شیوههای روایی در منطق سیستم است.
۳. مهندسی پرامپت (Prompt Engineering):
با در دست داشتن دادهها و قوانین زمینهای، یک موتور پرامپت (prompt engine) دستورالعمل خاصی را که به مدل هوش مصنوعی داده میشود، فرموله میکند. این پرامپت به طور مؤثر از هوش مصنوعی میخواهد تا روایتی را با ترکیب نقاط داده ارائه شده و با رعایت دستورالعملهای زمینهای تولید کند. ساخت پرامپتهای مؤثر یک مهارت حیاتی در کار با هوش مصنوعی مولد است که سبک، لحن و محتوای خروجی را شکل میدهد.
۴. تولید روایت توسط هوش مصنوعی:
پرامپت با دقت ساخته شده سپس از طریق پلتفرم AWS Bedrock به مدل Anthropic Claude 3.5 Sonnet ارسال میشود. هوش مصنوعی درخواست را پردازش کرده و متن توصیفی - روایت ضربه - را با ترکیب حقایق و زمینه مورد نظر تولید میکند. به عنوان مثال، به جای بیان صرف مسافت، ممکن است اضافه کند، ‘او همین الان طولانیترین درایو روز خود را زد’ یا زمینه آماری مانند، ‘در فاصله ۱۲۵ یاردی، او در ۲۰٪ مواقع به فاصله ۱۰ فوتی از حفره میرسد.’ این لایهبندی اطلاعات چیزی است که خروجی را فراتر از گزارش دادههای ساده ارتقا میدهد.
۵. اعتبارسنجی دقیق:
قبل از اینکه هر متن تولید شده توسط هوش مصنوعی به دست عموم برسد، تحت یک فرآیند اعتبارسنجی چند مرحلهای قرار میگیرد تا از صحت و کیفیت اطمینان حاصل شود.
- تأیید دادهها (Data Verification): روایت خروجی با دادههای ورودی ShotLink بررسی میشود. Gutterman توضیح میدهد: ‘روایت خروجی از Claude 3.5 Sonnet از طریق یک سرویس اعتبارسنجی عبور میکند تا اطمینان حاصل شود که دادههای ShotLink که در خروجی به آنها اشاره شده است با آنچه به سیستم وارد شده مطابقت دارد (به عنوان مثال، مسافت درایو).’ این مرحله از ‘توهمات’ بالقوه هوش مصنوعی یا خطاهای واقعی جلوگیری میکند.
- شباهت کسینوسی (Cosine Similarity): یک بررسی ظریفتر با استفاده از تحلیل شباهت کسینوسی دنبال میشود. این تکنیک شباهت معنایی بین متن تولید شده و مجموعهای از توصیفات قابل قبول برای یک نوع ضربه معین را اندازهگیری میکند. Gutterman میافزاید: ‘سیستم اطمینان حاصل میکند که متن در محدودهای از نحوه صحبت در مورد یک درایو قرار میگیرد.’ این تضمین میکند که لحن و عبارتبندی مناسب و سازگار با نحوه توصیف معمول اقدامات گلف باشد.
- بررسیهای موتور انتشار (Publishing Engine Checks): اگر روایت این آزمایشها را پشت سر بگذارد، به موتور انتشار میرود، جایی که بررسیهای نهایی قبل از ادغام آن در پلتفرمهایی مانند برنامه TOURCAST انجام میشود.
این فرآیند دقیق بر تعهد به صحت و قابلیت اطمینان تأکید میکند که برای حفظ اعتبار در ارائه اطلاعات ورزشی ضروری است.
پیادهسازی در دنیای واقعی: موفقیت در THE PLAYERS Championship
پتانسیل نظری این سیستم مبتنی بر هوش مصنوعی در طول مسابقات قهرمانی THE PLAYERS Championship، یکی از رویدادهای شاخص در تقویم PGA TOUR، در معرض یک آزمون واقعی قابل توجه قرار گرفت. این یک آزمایش در مقیاس کوچک نبود؛ سیستم برای تولید روایت برای کل زمین در هر چهار دور مستقر شد.
نتایج چشمگیر بود. سیستم هوش مصنوعی مولد با موفقیت متن توصیفی برای بیش از ۳۰۰۰۰ ضربه فردی در طول هفته مسابقات تولید کرد. این نشاندهنده یک جهش عظیم در عمق پوشش است که به طور مؤثر بینش روایی را برای هر ضربه زده شده توسط هر رقیب فراهم میکند.
به همان اندازه مهم، قابلیت اطمینان سیستم بود. Gutterman گزارش میدهد: ‘در طول THE PLAYERS Championship، دقت در ۳۰۰۰۰ ضربه حدود ۹۶٪ بود، که همان جایی بود که فکر میکردیم خواهیم بود.’ دستیابی به این سطح از دقت در یک رویداد ورزشی زنده و پویا، جایی که دادهها به طور مداوم در جریان هستند و زمینه به سرعت تغییر میکند، گواهی بر استحکام فناوری زیربنایی و کامل بودن فرآیندهای اعتبارسنجی است. در حالی که ۹۶٪ به معنای درصد کمی است که نیاز به بررسی یا کنار گذاشتن دارد، نرخ موفقیت کلی، قابلیت حیات سیستم را برای استقرار در مقیاس بزرگ نشان داد. این دستاورد دو سال توسعه را تأیید کرد و نقطه عطف مهمی در استراتژی محتوای TOUR بود.
ترسیم آینده: فراتر از متن و به سوی شخصیسازی
پیادهسازی موفقیتآمیز روایتهای مبتنی بر متن تنها آغاز چشمانداز PGA TOUR برای استفاده از هوش مصنوعی است. سیستم فعلی عمدتاً متنمحور است زیرا مدلهای هوش مصنوعی قادر به پردازش و تفسیر جریانهای زنده ویدئو و صدا در زمان واقعی هنوز در حال بلوغ هستند. با این حال، نقشه راه به وضوح به سمت آیندهای فراگیرتر و چندحسی اشاره دارد.
ادغام هوش مصنوعی چندوجهی (Multimodal AI Integration):
Gutterman پیشبینی میکند: ‘ما در حال ساختن روزی هستیم که ترکیبی از دادههای زنده، صدای زنده، ویدیوی زنده خواهد بود و سپس از یک خروجی چندوجهی برای ایجاد یک ویدیو و تولید صدا استفاده خواهیم کرد.’ این نشاندهنده آیندهای است که در آن هوش مصنوعی به طور بالقوه میتواند فیدهای ویدیویی را برای اظهار نظر در مورد مکانیک چرخش (swing)، تفسیر واکنشهای بازیکنان، یا حتی سنجش صدای جمعیت تجزیه و تحلیل کند و این مشاهدات را با دادههای ShotLink ادغام کند تا تجربیات محتوایی غنیتری ایجاد کند، شاید حتی نکات برجسته ویدیویی خودکار با صداگذاری تولید شده توسط هوش مصنوعی.
تفسیر صوتی مصنوعی (Synthetic Voice Commentary):
یک هدف فوریتر، رسیدگی به کمبود تفسیر در جریانهای متعدد ‘Every Shot Live’ است که در دسترس طرفداران قرار دارد. سالهاست که این فیدها، که اغلب نزدیک به ۵۰ جریان همزمان هستند، فقط صدای طبیعی و پوششهای آماری را ارائه میدهند. Gutterman اذعان میکند: ‘هدف ما همیشه این است که یک انسان داستان را روایت کند، اما داشتن دو مفسر در ۴۸ جریان در تمام طول روز از نظر هزینه مقرون به صرفه نیست.’ هوش مصنوعی مولد یک راه حل مقیاسپذیر ارائه میدهد. ‘ما با AWS روی یک صدای مصنوعی کار میکنیم که میتواند پرامپتها [روایتها] را بخواند. با هوش مصنوعی، بیننده میتواند تفسیر را به همان روشی که زیرنویس بسته (closed captioning) را روشن میکند، روشن کند.’ این قابلیت همچنین میتواند به راحتی به چندین زبان گسترش یابد، به عنوان مثال، ارائه تفسیر به زبان اسپانیایی با فشار یک دکمه، که به طور چشمگیری دسترسی را افزایش میدهد.
عدم وابستگی استراتژیک به مدل (Strategic Model Agnosticism):
زیربنای این پیشرفتهای آینده، مزیت استراتژیک ارائه شده توسط AWS Bedrock است - عدم وابستگی به مدل. TOUR به یک ارائهدهنده مدل هوش مصنوعی واحد محدود نیست. Gutterman تأکید میکند: ‘Bedrock به PGA TOUR اجازه میدهد تا نسبت به مدل بیطرف باشد و بهترین مدل را برای کار پیدا کند.’ این انعطافپذیری در چشمانداز به سرعت در حال تحول هوش مصنوعی حیاتی است. ‘اگر مدلهای آینده بتوانند کاری را با هزینه کمتر انجام دهند، Tour میتواند بدون مشکل به آن روی آورد.’ او این تصور را که یک مدل واحد و قدرتمند وجود دارد رد میکند و مشاهده میکند: ‘آنچه ما میبینیم این است که اینطور نیست.’ استراتژی استفاده از بهترین ابزار برای کار است: Claude از Anthropic برای تولید متن ظریف، به طور بالقوه مدل جدید AWS Nova برای وظایف تشخیص تصویر، و شاید مدلهای تخصصی دیگر برای عملکردهایی مانند ترجمه. این رویکرد قابلیت را به حداکثر میرساند در حالی که هزینه و عملکرد را در بلندمدت بهینه میکند.
جایزه نهایی: تجربیات فوقالعاده شخصیسازی شده برای طرفداران
در حالی که پیشرفتهای فناورانه به خودی خود چشمگیر هستند، نیروی محرکه پشت ابتکارات هوش مصنوعی مولد PGA TOUR، پیگیری یک تجربه اساساً متحول شده برای طرفداران است: فوقالعاده شخصیسازی (hyper-personalization).
توانایی تولید زمینه روایی برای هر ضربه، پایه و اساس ارائه محتوای متناسب با ترجیحات فردی را ایجاد میکند. Gutterman توضیح میدهد: ‘این ما را در مسیر فوقالعاده شخصیسازی پیش میبرد، جایی که یک طرفدار میتواند در پایان روز داستانی با بهترین ویدیو از بازیکنان مورد علاقه خود دریافت کند.’ تصور کنید برنامهای که به طور خودکار یک حلقه برجسته شامل هر ضربه مهمی که توسط گلفباز مورد علاقه شما بازی شده است، همراه با توضیحات روایی زمینهای، کمی پس از پایان دور او ارائه میدهد.
این فراتر از مدیریت ساده محتوا است. TOUR سیستمهایی را پیشبینی میکند که قادر به تعامل پیشبینیکننده (predictive engagement) هستند. Gutterman پیشنهاد میکند: ‘برنامه از قبل میداند شما چه چیزی را دوست دارید و فقط آنچه را که میخواهید به شما ارائه میدهد.’ با یادگیری ترجیحات یک طرفدار - بازیکنان مورد علاقه، علاقه به آمار خاص (مانند مسافت درایو یا عملکرد پاتینگ)، یا حتی فرمتهای محتوای ترجیحی - پلتفرم میتواند به طور فعال مرتبطترین اطلاعات و داستانها را ارائه دهد، شاید حتی به طرفدار هشدار دهد زمانی که بازیکن مورد علاقه او با یک پات حیاتی روبرو است یا در حال تلاش برای ضربهای از یک موقعیت تاریخی چالشبرانگیز است.
این سطح از شخصیسازی با هدف تعمیق تعامل، مرتبطتر کردن، کارآمدتر کردن و در نهایت رضایتبخشتر کردن مصرف محتوای گلف برای هر طرفدار فردی است. PGA TOUR با استفاده از هوش مصنوعی مولد برای باز کردن پتانسیل روایی پنهان در ذخایر عظیم دادههای خود، نه تنها پوشش خود را مقیاسبندی میکند؛ بلکه پیشگام آیندهای است که در آن فناوری داستان بازی را متناسب با دیدگاه منحصر به فرد هر دنبالکننده تنظیم میکند. دوران دریافت منفعلانه یک فید پخش واحد در حال جایگزینی با تعاملی پویا، شخصیسازی شده و غنی از داده با این ورزش است.