هوش مصنوعی مولد در PGA TOUR: روایت ۳۰۰۰۰ ضربه

دنیای گلف حرفه‌ای، که اغلب از دریچه تنگ پخش تلویزیونی متمرکز بر پیشتازان مسابقات دیده می‌شود، درامی بسیار گسترده‌تر را در بر می‌گیرد. در زمین‌های وسیع، ده‌ها رقیب به طور همزمان با چالش‌ها دست و پنجه نرم می‌کنند، ضربات درخشانی را اجرا می‌کنند و با عوامل طبیعی مبارزه می‌کنند. پوشش کامل این رقابت‌ها مدت‌هاست که یک چالش لجستیکی و نیازمند منابع فراوان بوده است. اکنون، همگرایی جمع‌آوری داده‌های پیچیده و هوش مصنوعی پیشرفته در حال بازنویسی این سناریو است و به PGA TOUR اجازه می‌دهد تا سطح بی‌سابقه‌ای از جزئیات و زمینه روایی را به طرفداران ارائه دهد و بسیار فراتر از محدودیت‌های پوشش سنتی حرکت کند. در نمایشی چشمگیر در طول مسابقات قهرمانی THE PLAYERS Championship، هوش مصنوعی مولد برای ایجاد توضیحات نوشتاری منحصر به فرد برای بیش از ۳۰۰۰۰ ضربه گلف فردی به کار گرفته شد و به دنبال‌کنندگان درک غنی‌تر و جامع‌تری از اتفاقاتی که در کل زمین رخ می‌دهد، ارائه داد.

چالش همیشگی: مقیاس‌پذیری پوشش جامع گلف

برای دهه‌ها، روایت یک تورنمنت گلف حرفه‌ای عمدتاً توسط محدودیت‌های رسانه‌های سنتی دیکته شده است. مفسران انسانی و تیم‌های تولید به طور طبیعی به سمت بازیکنانی که در صدر جدول امتیازات قرار دارند یا آنهایی که قدرت ستاره‌ای تثبیت شده دارند، گرایش پیدا می‌کنند. در حالی که این رویکرد نکات برجسته جذابی را ارائه می‌دهد، به ناچار بخش‌های وسیعی از رقابت را بدون مستندسازی باقی می‌گذارد. با حضور بیش از ۱۴۰ بازیکن در زمین، که هر کدام بیش از ۷۰ ضربه در هر دور در طول چهار روز می‌زنند، حجم عظیم اتفاقات بسیار زیاد است.

Scott Gutterman، معاون ارشد فناوری‌های دیجیتال و پخش در PGA TOUR، مشکل اصلی را بیان می‌کند: ‘معمولاً، کارکنان ما می‌توانند ۲۵ یا ۳۰ گلف‌باز را پوشش دهند.’ این واقعیت عملیاتی به این معنی بود که داستان‌های ده‌ها بازیکن دیگر - پیروزی‌ها، تلاش‌ها و لحظات حساس آنها - عمدتاً ناگفته باقی می‌ماند و در صورت امکان، فقط از طریق آمار خام قابل دسترسی بود. طرفدارانی که بازیکنان خاصی را خارج از گروه پیشرو دنبال می‌کردند، اغلب دیدگاه پراکنده‌ای از عملکرد آنها داشتند.

جاه‌طلبی در PGA TOUR واضح بود: استفاده از جریان داده فوق‌العاده غنی ارائه شده توسط ShotLink، که توسط CDW پشتیبانی می‌شود و جزئیات دقیقی از هر ضربه زده شده را ثبت می‌کند، برای ایجاد یک چشم‌انداز روایی عادلانه‌تر و کامل‌تر. چالش کمبود داده نبود، بلکه ناتوانی در پردازش، تفسیر و ارائه آن داده‌ها در قالبی روایی و جذاب در مقیاس مورد نیاز برای پوشش هر بازیکن و هر ضربه بود. منابع انسانی به سادگی نمی‌توانستند این شکاف را به طور مؤثر یا اقتصادی پر کنند. تمایل این بود که فراتر از معیارهای اساسی حرکت کنیم - ‘JJ Spaun یک درایو ۳۰۰ یاردی زد و ۱۲۵ یارد تا حفره فاصله دارد’ - که Gutterman اشاره می‌کند، سال‌ها استاندارد بوده است. هدف این بود که به این نقاط داده معنا و زمینه تزریق شود و اعداد خام به عناصر داستان‌سرایی جذاب برای هر رقیب تبدیل شوند.

ورود هوش مصنوعی مولد: کاتالیزور فناورانه برای تغییر

PGA TOUR با تشخیص پتانسیل هوش مصنوعی برای غلبه بر چالش مقیاس‌پذیری، حدود دو سال پیش کاوش اختصاصی در قابلیت‌های هوش مصنوعی مولد را آغاز کرد. این صرفاً یک تمرین آکادمیک نبود؛ بلکه توسط یک سوال اساسی هدایت می‌شد: چگونه این فناوری به سرعت در حال تکامل می‌تواند تولید محتوا را بهبود بخشد و مهمتر از آن، به ذینفعان اصلی - طرفداران، بازیکنان و خود مسابقات - بهتر خدمت کند؟

این سفر شامل همکاری نزدیک با یک شریک کلیدی فناوری، Amazon Web Services (AWS) بود. TOUR به یک شریک بنیادی برای AWS Bedrock تبدیل شد، یک سرویس مدیریت شده که دسترسی به انواع مدل‌های پایه (FMs) پیشرو را از طریق یک API واحد ارائه می‌دهد. Gutterman مزیت استراتژیک را توضیح می‌دهد: ‘Bedrock به طور مؤثر به شما امکان می‌دهد تقریباً از هر مدل هوش مصنوعی مولد و مجموعه‌ای از ابزارها برای ایجاد این نوع تجربیات استفاده کنید.’ این رویکرد پلتفرمی، انعطاف‌پذیری و آینده‌نگری را فراهم کرد و از وابستگی به یک ارائه‌دهنده یا معماری مدل هوش مصنوعی واحد جلوگیری کرد.

برای وظیفه خاص تولید متن توصیفی، TOUR مدل‌های توسعه‌یافته توسط Anthropic را که از طریق Bedrock قابل دسترسی هستند، انتخاب کرد. Gutterman مشخص می‌کند: ‘ما از مدل‌های Claude شرکت Anthropic برای ایجاد این نوع تجربیات استفاده می‌کنیم. به طور خاص، ما از Anthropic Claude 3.5 Sonnet استفاده می‌کنیم.’ سال گذشته یک گذار حیاتی بود، حرکت فراتر از اثبات‌های اولیه مفهوم (POCs) به سمت عملیاتی‌سازی کامل. این شامل ساخت زیرساخت‌ها و گردش‌های کاری قوی مورد نیاز برای ادغام هوش مصنوعی در پوشش زنده مسابقات به طور قابل اعتماد و در مقیاس بود. تمرکز از نشان دادن امکان‌پذیری به پیاده‌سازی یک سیستم عملی و تکرارپذیر که قادر به مدیریت محیط پویا و پرحجم یک تورنمنت گلف حرفه‌ای باشد، تغییر کرد. انتخاب Claude 3.5 Sonnet نشان‌دهنده انتخابی بر اساس نقاط قوت درک شده آن در تولید متن ظریف و آگاه از زمینه مناسب برای تفسیر ورزشی است.

ساخت روایت: نگاهی به پشت پرده هوش مصنوعی

تولید ده‌ها هزار توصیف ضربه منحصر به فرد، دقیق و مرتبط با زمینه در زمان تقریباً واقعی، یک هماهنگی پیچیده است. این شامل چیزی بسیار بیشتر از تغذیه صرف داده‌های خام به یک مدل هوش مصنوعی است. PGA TOUR، با همکاری AWS، یک خط لوله پیچیده برای تبدیل داده‌های ShotLink به روایت‌های جذاب مهندسی کرد.

۱. دریافت و زمینه‌سازی داده‌ها:
فرآیند با جریان داده از ShotLink آغاز می‌شود. این فقط نقطه پایانی یک ضربه نیست، بلکه شامل جزئیاتی مانند وضعیت توپ (lie)، فاصله، چوب استفاده شده و موارد دیگر است. با این حال، داده‌های خام فاقد قدرت روایی هستند. گام حیاتی بعدی شامل مجموعه‌ای از سرویس‌های زمینه (context services) است. این سرویس‌ها به عنوان یک لایه تفسیری عمل می‌کنند و داده‌های ورودی را در برابر یک موتور قوانین (rules engine) تجزیه و تحلیل می‌کنند.

۲. موتور قوانین: افزودن هوشمندی:
این موتور برای اطمینان از معنادار بودن متن تولید شده و جلوگیری از مشکلات رایج حیاتی است. Gutterman مثال‌هایی ارائه می‌دهد: ‘بعد از اینکه بازیکنی اولین ضربه تی (tee shot) روز را از حفره اول می‌زند، نمی‌نویسد که بازیکن طولانی‌ترین درایو روز را زده است.’ قوانین اولویت‌ها را تعیین می‌کنند و تنوع و ارتباط را تضمین می‌کنند. ‘به عنوان مثال، ما می‌توانیم به آن بگوییم که در مورد رسیدن به گرین در ضربات نزدیک‌شونده (approach shots) هر سه روایت صحبت کند تا متن در بین همه بازیکنان تکراری نشود.’ همچنین به سیستم روش‌های مختلفی برای بیان توصیفات برای اقدامات مشابه آموزش داده می‌شود - اطمینان از اینکه یک درایو هر بار به طور یکسان توصیف نمی‌شود، یا به همان روشی که یک پات (putt) توصیف می‌شود. این شامل کدگذاری دانش گلف و بهترین شیوه‌های روایی در منطق سیستم است.

۳. مهندسی پرامپت (Prompt Engineering):
با در دست داشتن داده‌ها و قوانین زمینه‌ای، یک موتور پرامپت (prompt engine) دستورالعمل خاصی را که به مدل هوش مصنوعی داده می‌شود، فرموله می‌کند. این پرامپت به طور مؤثر از هوش مصنوعی می‌خواهد تا روایتی را با ترکیب نقاط داده ارائه شده و با رعایت دستورالعمل‌های زمینه‌ای تولید کند. ساخت پرامپت‌های مؤثر یک مهارت حیاتی در کار با هوش مصنوعی مولد است که سبک، لحن و محتوای خروجی را شکل می‌دهد.

۴. تولید روایت توسط هوش مصنوعی:
پرامپت با دقت ساخته شده سپس از طریق پلتفرم AWS Bedrock به مدل Anthropic Claude 3.5 Sonnet ارسال می‌شود. هوش مصنوعی درخواست را پردازش کرده و متن توصیفی - روایت ضربه - را با ترکیب حقایق و زمینه مورد نظر تولید می‌کند. به عنوان مثال، به جای بیان صرف مسافت، ممکن است اضافه کند، ‘او همین الان طولانی‌ترین درایو روز خود را زد’ یا زمینه آماری مانند، ‘در فاصله ۱۲۵ یاردی، او در ۲۰٪ مواقع به فاصله ۱۰ فوتی از حفره می‌رسد.’ این لایه‌بندی اطلاعات چیزی است که خروجی را فراتر از گزارش داده‌های ساده ارتقا می‌دهد.

۵. اعتبارسنجی دقیق:
قبل از اینکه هر متن تولید شده توسط هوش مصنوعی به دست عموم برسد، تحت یک فرآیند اعتبارسنجی چند مرحله‌ای قرار می‌گیرد تا از صحت و کیفیت اطمینان حاصل شود.

  • تأیید داده‌ها (Data Verification): روایت خروجی با داده‌های ورودی ShotLink بررسی می‌شود. Gutterman توضیح می‌دهد: ‘روایت خروجی از Claude 3.5 Sonnet از طریق یک سرویس اعتبارسنجی عبور می‌کند تا اطمینان حاصل شود که داده‌های ShotLink که در خروجی به آنها اشاره شده است با آنچه به سیستم وارد شده مطابقت دارد (به عنوان مثال، مسافت درایو).’ این مرحله از ‘توهمات’ بالقوه هوش مصنوعی یا خطاهای واقعی جلوگیری می‌کند.
  • شباهت کسینوسی (Cosine Similarity): یک بررسی ظریف‌تر با استفاده از تحلیل شباهت کسینوسی دنبال می‌شود. این تکنیک شباهت معنایی بین متن تولید شده و مجموعه‌ای از توصیفات قابل قبول برای یک نوع ضربه معین را اندازه‌گیری می‌کند. Gutterman می‌افزاید: ‘سیستم اطمینان حاصل می‌کند که متن در محدوده‌ای از نحوه صحبت در مورد یک درایو قرار می‌گیرد.’ این تضمین می‌کند که لحن و عبارت‌بندی مناسب و سازگار با نحوه توصیف معمول اقدامات گلف باشد.
  • بررسی‌های موتور انتشار (Publishing Engine Checks): اگر روایت این آزمایش‌ها را پشت سر بگذارد، به موتور انتشار می‌رود، جایی که بررسی‌های نهایی قبل از ادغام آن در پلتفرم‌هایی مانند برنامه TOURCAST انجام می‌شود.

این فرآیند دقیق بر تعهد به صحت و قابلیت اطمینان تأکید می‌کند که برای حفظ اعتبار در ارائه اطلاعات ورزشی ضروری است.

پیاده‌سازی در دنیای واقعی: موفقیت در THE PLAYERS Championship

پتانسیل نظری این سیستم مبتنی بر هوش مصنوعی در طول مسابقات قهرمانی THE PLAYERS Championship، یکی از رویدادهای شاخص در تقویم PGA TOUR، در معرض یک آزمون واقعی قابل توجه قرار گرفت. این یک آزمایش در مقیاس کوچک نبود؛ سیستم برای تولید روایت برای کل زمین در هر چهار دور مستقر شد.

نتایج چشمگیر بود. سیستم هوش مصنوعی مولد با موفقیت متن توصیفی برای بیش از ۳۰۰۰۰ ضربه فردی در طول هفته مسابقات تولید کرد. این نشان‌دهنده یک جهش عظیم در عمق پوشش است که به طور مؤثر بینش روایی را برای هر ضربه زده شده توسط هر رقیب فراهم می‌کند.

به همان اندازه مهم، قابلیت اطمینان سیستم بود. Gutterman گزارش می‌دهد: ‘در طول THE PLAYERS Championship، دقت در ۳۰۰۰۰ ضربه حدود ۹۶٪ بود، که همان جایی بود که فکر می‌کردیم خواهیم بود.’ دستیابی به این سطح از دقت در یک رویداد ورزشی زنده و پویا، جایی که داده‌ها به طور مداوم در جریان هستند و زمینه به سرعت تغییر می‌کند، گواهی بر استحکام فناوری زیربنایی و کامل بودن فرآیندهای اعتبارسنجی است. در حالی که ۹۶٪ به معنای درصد کمی است که نیاز به بررسی یا کنار گذاشتن دارد، نرخ موفقیت کلی، قابلیت حیات سیستم را برای استقرار در مقیاس بزرگ نشان داد. این دستاورد دو سال توسعه را تأیید کرد و نقطه عطف مهمی در استراتژی محتوای TOUR بود.

ترسیم آینده: فراتر از متن و به سوی شخصی‌سازی

پیاده‌سازی موفقیت‌آمیز روایت‌های مبتنی بر متن تنها آغاز چشم‌انداز PGA TOUR برای استفاده از هوش مصنوعی است. سیستم فعلی عمدتاً متن‌محور است زیرا مدل‌های هوش مصنوعی قادر به پردازش و تفسیر جریان‌های زنده ویدئو و صدا در زمان واقعی هنوز در حال بلوغ هستند. با این حال، نقشه راه به وضوح به سمت آینده‌ای فراگیرتر و چندحسی اشاره دارد.

ادغام هوش مصنوعی چندوجهی (Multimodal AI Integration):
Gutterman پیش‌بینی می‌کند: ‘ما در حال ساختن روزی هستیم که ترکیبی از داده‌های زنده، صدای زنده، ویدیوی زنده خواهد بود و سپس از یک خروجی چندوجهی برای ایجاد یک ویدیو و تولید صدا استفاده خواهیم کرد.’ این نشان‌دهنده آینده‌ای است که در آن هوش مصنوعی به طور بالقوه می‌تواند فیدهای ویدیویی را برای اظهار نظر در مورد مکانیک چرخش (swing)، تفسیر واکنش‌های بازیکنان، یا حتی سنجش صدای جمعیت تجزیه و تحلیل کند و این مشاهدات را با داده‌های ShotLink ادغام کند تا تجربیات محتوایی غنی‌تری ایجاد کند، شاید حتی نکات برجسته ویدیویی خودکار با صداگذاری تولید شده توسط هوش مصنوعی.

تفسیر صوتی مصنوعی (Synthetic Voice Commentary):
یک هدف فوری‌تر، رسیدگی به کمبود تفسیر در جریان‌های متعدد ‘Every Shot Live’ است که در دسترس طرفداران قرار دارد. سال‌هاست که این فیدها، که اغلب نزدیک به ۵۰ جریان همزمان هستند، فقط صدای طبیعی و پوشش‌های آماری را ارائه می‌دهند. Gutterman اذعان می‌کند: ‘هدف ما همیشه این است که یک انسان داستان را روایت کند، اما داشتن دو مفسر در ۴۸ جریان در تمام طول روز از نظر هزینه مقرون به صرفه نیست.’ هوش مصنوعی مولد یک راه حل مقیاس‌پذیر ارائه می‌دهد. ‘ما با AWS روی یک صدای مصنوعی کار می‌کنیم که می‌تواند پرامپت‌ها [روایت‌ها] را بخواند. با هوش مصنوعی، بیننده می‌تواند تفسیر را به همان روشی که زیرنویس بسته (closed captioning) را روشن می‌کند، روشن کند.’ این قابلیت همچنین می‌تواند به راحتی به چندین زبان گسترش یابد، به عنوان مثال، ارائه تفسیر به زبان اسپانیایی با فشار یک دکمه، که به طور چشمگیری دسترسی را افزایش می‌دهد.

عدم وابستگی استراتژیک به مدل (Strategic Model Agnosticism):
زیربنای این پیشرفت‌های آینده، مزیت استراتژیک ارائه شده توسط AWS Bedrock است - عدم وابستگی به مدل. TOUR به یک ارائه‌دهنده مدل هوش مصنوعی واحد محدود نیست. Gutterman تأکید می‌کند: ‘Bedrock به PGA TOUR اجازه می‌دهد تا نسبت به مدل بی‌طرف باشد و بهترین مدل را برای کار پیدا کند.’ این انعطاف‌پذیری در چشم‌انداز به سرعت در حال تحول هوش مصنوعی حیاتی است. ‘اگر مدل‌های آینده بتوانند کاری را با هزینه کمتر انجام دهند، Tour می‌تواند بدون مشکل به آن روی آورد.’ او این تصور را که یک مدل واحد و قدرتمند وجود دارد رد می‌کند و مشاهده می‌کند: ‘آنچه ما می‌بینیم این است که اینطور نیست.’ استراتژی استفاده از بهترین ابزار برای کار است: Claude از Anthropic برای تولید متن ظریف، به طور بالقوه مدل جدید AWS Nova برای وظایف تشخیص تصویر، و شاید مدل‌های تخصصی دیگر برای عملکردهایی مانند ترجمه. این رویکرد قابلیت را به حداکثر می‌رساند در حالی که هزینه و عملکرد را در بلندمدت بهینه می‌کند.

جایزه نهایی: تجربیات فوق‌العاده شخصی‌سازی شده برای طرفداران

در حالی که پیشرفت‌های فناورانه به خودی خود چشمگیر هستند، نیروی محرکه پشت ابتکارات هوش مصنوعی مولد PGA TOUR، پیگیری یک تجربه اساساً متحول شده برای طرفداران است: فوق‌العاده شخصی‌سازی (hyper-personalization).

توانایی تولید زمینه روایی برای هر ضربه، پایه و اساس ارائه محتوای متناسب با ترجیحات فردی را ایجاد می‌کند. Gutterman توضیح می‌دهد: ‘این ما را در مسیر فوق‌العاده شخصی‌سازی پیش می‌برد، جایی که یک طرفدار می‌تواند در پایان روز داستانی با بهترین ویدیو از بازیکنان مورد علاقه خود دریافت کند.’ تصور کنید برنامه‌ای که به طور خودکار یک حلقه برجسته شامل هر ضربه مهمی که توسط گلف‌باز مورد علاقه شما بازی شده است، همراه با توضیحات روایی زمینه‌ای، کمی پس از پایان دور او ارائه می‌دهد.

این فراتر از مدیریت ساده محتوا است. TOUR سیستم‌هایی را پیش‌بینی می‌کند که قادر به تعامل پیش‌بینی‌کننده (predictive engagement) هستند. Gutterman پیشنهاد می‌کند: ‘برنامه از قبل می‌داند شما چه چیزی را دوست دارید و فقط آنچه را که می‌خواهید به شما ارائه می‌دهد.’ با یادگیری ترجیحات یک طرفدار - بازیکنان مورد علاقه، علاقه به آمار خاص (مانند مسافت درایو یا عملکرد پاتینگ)، یا حتی فرمت‌های محتوای ترجیحی - پلتفرم می‌تواند به طور فعال مرتبط‌ترین اطلاعات و داستان‌ها را ارائه دهد، شاید حتی به طرفدار هشدار دهد زمانی که بازیکن مورد علاقه او با یک پات حیاتی روبرو است یا در حال تلاش برای ضربه‌ای از یک موقعیت تاریخی چالش‌برانگیز است.

این سطح از شخصی‌سازی با هدف تعمیق تعامل، مرتبط‌تر کردن، کارآمدتر کردن و در نهایت رضایت‌بخش‌تر کردن مصرف محتوای گلف برای هر طرفدار فردی است. PGA TOUR با استفاده از هوش مصنوعی مولد برای باز کردن پتانسیل روایی پنهان در ذخایر عظیم داده‌های خود، نه تنها پوشش خود را مقیاس‌بندی می‌کند؛ بلکه پیشگام آینده‌ای است که در آن فناوری داستان بازی را متناسب با دیدگاه منحصر به فرد هر دنبال‌کننده تنظیم می‌کند. دوران دریافت منفعلانه یک فید پخش واحد در حال جایگزینی با تعاملی پویا، شخصی‌سازی شده و غنی از داده با این ورزش است.