Qvest و NVIDIA: نوآوری رسانه‌ای با هوش مصنوعی در NAB Show

چشم‌انداز رسانه، سرگرمی و ورزش در حال تحولی شگرف است که ناشی از پیشرفت بی‌وقفه هوش مصنوعی است. تولیدکنندگان محتوا، پخش‌کنندگان و توزیع‌کنندگان با حجم بی‌سابقه‌ای از دارایی‌های دیجیتال دست و پنجه نرم می‌کنند و با فشار شدیدی برای بهینه‌سازی عملیات، جذب مخاطبان به روش‌های نوین و آزادسازی ارزش پنهان در آرشیوهای خود مواجه هستند. با درک این لحظه حیاتی، همکاری بین Qvest، یک شرکت مشاوره فناوری مشهور، و NVIDIA، پیشگام در محاسبات شتاب‌یافته، در حال تشدید است و هدف آن تجهیز این صنعت با ابزارهای هوش مصنوعی قدرتمند و کاربردی است. این مشارکت که از اوایل سال 2024 فعال است، تخصص عمیق Qvest در گردش کار رسانه‌ها را با پلتفرم‌های پیشرفته هوش مصنوعی NVIDIA ترکیب می‌کند و راه‌حل‌هایی را نوید می‌دهد که فراتر از نوآوری صرفاً فناورانه رفته و نتایج تجاری ملموسی را ارائه می‌دهند. نمایشگاه معتبر NAB Show صحنه‌ای برای آخرین نوآوری‌های آن‌هاست، جایی که Qvest قرار است از دو راهکار پیشگامانه هوش مصنوعی کاربردی (Applied AI) رونمایی کند که برای توانمندسازی سازمان‌ها در بهره‌برداری کامل از پتانسیل کتابخانه‌های محتوای دیجیتال و پخش زنده خود طراحی شده‌اند.

هم‌افزایی پیشران تحول رسانه‌ای

اتحاد بین Qvest و NVIDIA فقط ترکیب لوگوها نیست؛ بلکه نشان‌دهنده تلفیقی استراتژیک از قابلیت‌هایی است که برای پیمایش پیچیدگی‌های پیاده‌سازی هوش مصنوعی در محیط‌های رسانه‌محور ضروری است. Qvest دهه‌ها تجربه در درک گردش‌های کاری پیچیده، چالش‌های منحصربه‌فرد و نیازهای خاص پخش‌کنندگان، استودیوها، لیگ‌های ورزشی و سایر نهادهای رسانه‌ای را به ارمغان می‌آورد. آن‌ها مسیر از تولید محتوا تا پردازش، مدیریت، توزیع و کسب درآمد را درک می‌کنند. در مقابل، NVIDIA فناوری بنیادی را فراهم می‌کند – GPUهای قدرتمند، کیت‌های توسعه نرم‌افزار (SDKs) پیچیده و مدل‌های از پیش آموزش‌دیده که موتور هوش مصنوعی مدرن را تشکیل می‌دهند.

این همکاری بر ترجمه پتانسیل انتزاعی هوش مصنوعی به کاربردهای ملموسی متمرکز است که نقاط درد خاص صنعت را برطرف می‌کند. شرکت‌های رسانه‌ای اغلب در داده‌ها غرق شده‌اند – ساعت‌ها فیلم خام، آرشیوهای گسترده، ترک‌های صوتی متنوع و فراداده‌های پیچیده. چالش نه تنها در ذخیره این محتوا، بلکه در جستجو، تجزیه و تحلیل، استفاده مجدد و کسب درآمد کارآمد از آن نهفته است. روش‌های سنتی اغلب شامل کار دستی قابل توجهی هستند که منجر به گلوگاه‌ها، فرصت‌های از دست رفته و هزینه‌های عملیاتی بالا می‌شود. ابتکار Qvest-NVIDIA مستقیماً این ناکارآمدی‌ها را هدف قرار می‌دهد و با ارائه راه‌حل‌هایی که کارایی عملیاتی را افزایش می‌دهند، درها را به روی جریان‌های درآمدی جدید باز می‌کنند و به‌طور حیاتی، با آزاد کردن استعداد انسانی از کارهای تکراری، خلاقیت بیشتری را پرورش می‌دهند، به دنبال تسریع پذیرش هوش مصنوعی است. هدف، فراتر رفتن از پروژه‌های آزمایشی و اثبات مفاهیم به سمت استقرارهای هوش مصنوعی مقیاس‌پذیر و آماده برای سازمان است که بازگشت سرمایه قابل اندازه‌گیری را ارائه می‌دهند.

رونمایی از ابزارهای پیشرفته هوش مصنوعی در NAB Show

نمایشگاه NAB Show، یک مرکز جهانی برای متخصصان رسانه، سرگرمی و فناوری، پس‌زمینه ایده‌آلی را برای Qvest فراهم می‌کند تا آخرین پیشنهادات مبتنی بر هوش مصنوعی خود را که با بهره‌گیری از پشته فناوری قدرتمند NVIDIA توسعه یافته‌اند، معرفی کند. این‌ها ساختارهای نظرینیستند، بلکه ابزارهای عملی هستند که برای تأثیرگذاری فوری طراحی شده‌اند.

هوشمندی بلادرنگ: استخراج‌کننده رویداد ویدیویی چند دوربینه زنده عامل‌محور (Agentic Live Multi-Camera Video Event Extractor)

تصور کنید در حال پوشش یک رویداد ورزشی بزرگ زنده یا یک خبر فوری با چندین فید دوربین هستید که به طور همزمان پخش می‌شوند. حجم عظیم ویدیوی ورودی چالشی قابل توجه برای تیم‌های تولیدی است که هدفشان ثبت هر لحظه حیاتی، شناسایی بهترین زوایای دوربین و تولید سریع خلاصه‌ها یا نکات برجسته است. Agentic Live Multi-Camera Video Event Extractor مستقیماً با این چالش مقابله می‌کند.

این راهکار پیچیده به صورت بلادرنگ عمل می‌کند و چندین جریان ویدیویی ورودی را به طور همزمان تجزیه و تحلیل می‌کند. قابلیت‌های اصلی آن عبارتند از:

  • تشخیص خودکار رویداد: این سیستم از الگوریتم‌های پیشرفته بینایی کامپیوتر (computer vision) استفاده می‌کند که به طور بالقوه بر روی مجموعه داده‌های وسیعی از رویدادهای مشابه آموزش دیده‌اند تا به طور خودکار رخدادهای مهم را در فیدهای زنده شناسایی کند. در یک مسابقه فوتبال، این می‌تواند به معنای تشخیص گل‌ها، خطاها، سیوهای کلیدی یا اقدامات خاص بازیکنان باشد. در یک کنفرانس خبری، ممکن است لحظات هیجان بالا، حرکات خاص یا ظاهر شدن افراد کلیدی را شناسایی کند.
  • خلاصه‌سازی هوشمند: فراتر از تشخیص ساده، این ابزار می‌تواند خلاصه‌های موجزی از رویدادهایی که در فیدهای مختلف در حال وقوع هستند، تولید کند. این به تهیه‌کنندگان اجازه می‌دهد تا به سرعت جریان روایت را درک کرده و بدون نیاز به جستجوی دستی ساعت‌ها فیلم از زوایای مختلف، تصمیمات آگاهانه بگیرند.
  • شناسایی بهترین نما: یک عملکرد حیاتی برای تولید زنده، انتخاب جذاب‌ترین زاویه دوربین در هر لحظه معین است. این راهکار هوش مصنوعی عواملی مانند ترکیب‌بندی نما، پایداری دوربین، فوکوس سوژه و ارتباط کنش را در تمام فیدهای موجود تجزیه و تحلیل می‌کند تا نمای بهینه را توصیه کند یا حتی به طور خودکار به آن سوئیچ کند، که به طور قابل توجهی به کارگردان کمک کرده و تجربه بیننده را بهبود می‌بخشد.
  • استخراج داده‌های ساختاریافته: شاید قدرتمندترین ویژگی این سیستم، تبدیل داده‌های ویدیویی بدون ساختار به اطلاعات ساختاریافته و قابل جستجو باشد. رویدادها، برچسب‌های زمانی، زوایای دوربین و به طور بالقوه حتی افراد یا اشیاء شناسایی شده به عنوان فراداده (metadata) ثبت می‌شوند. این داده‌های ساختاریافته برای تجزیه و تحلیل پس از رویداد، ایجاد سریع بسته‌های نکات برجسته، ارائه محتوای شخصی‌سازی شده (به عنوان مثال، نمایش نکات برجسته یک بازیکن خاص) و غنی‌سازی دسترسی به آرشیو بسیار ارزشمند است.

پیامدهای آن عمیق است. پخش‌کنندگان می‌توانند گردش کار تولید زنده خود را ساده کنند و نیاز به تیم‌های بزرگ برای ثبت دستی رویدادها را کاهش دهند. لیگ‌های ورزشی می‌توانند نکات برجسته تقریباً آنی را برای تعامل در رسانه‌های اجتماعی تولید کنند یا تجربیات تماشای سفارشی را به طرفداران ارائه دهند. شرکت‌های رسانه‌ای که رویدادهای زنده را پوشش می‌دهند می‌توانند منابع خود را به طور کارآمدتری مدیریت کرده و ارزش بیشتری از محتوای خود، هم در طول و هم پس از رویداد، استخراج کنند. این فراتر از اتوماسیون ساده به سمت تقویت هوشمند فرآیند تولید حرکت می‌کند.

دموکراتیزه کردن بینش‌ها: سازنده عامل هوش مصنوعی رسانه‌محور بدون کد (No-Code Media-Centric AI Agent Builder)

در حالی که پتانسیل هوش مصنوعی در تجزیه و تحلیل رسانه‌ها بسیار زیاد است، پذیرش آن اغلب به دلیل نیاز به مهارت‌های فنی تخصصی با مانع مواجه شده است. دانشمندان داده و مهندسان هوش مصنوعی تقاضای بالایی دارند و توسعه مدل‌های هوش مصنوعی سفارشی می‌تواند زمان‌بر و پرهزینه باشد. Qvest با No-Code Media-Centric AI Agent Builder به این گلوگاه رسیدگی می‌کند.

این ابزار گامی مهم به سوی دموکراتیزه کردن هوش مصنوعی برای متخصصان رسانه است. همانطور که از نامش پیداست، به کاربرانی که تخصص کدنویسی ندارند اجازه می‌دهد تا عامل‌های هوش مصنوعی (AI agents) را بسازند و مستقر کنند که قادر به استخراج بینش‌های معنادار از فرمت‌های مختلف رسانه‌ای هستند. جنبه‌های کلیدی عبارتند از:

  • رابط کاربری ساده: کاربران از طریق یک رابط گرافیکی بصری با سازنده تعامل دارند و به جای نوشتن کدهای پیچیده، انواع رسانه‌هایی را که می‌خواهند تجزیه و تحلیل کنند و بینش‌های خاصی را که به دنبال آن هستند، تعریف می‌کنند.
  • مدیریت رسانه‌های متنوع: این پلتفرم برای دریافت و تجزیه و تحلیل طیف گسترده‌ای از رسانه‌های بدون ساختار رایج در صنعت طراحی شده است، از جمله:
    • ویدیو: تجزیه و تحلیل صحنه‌ها، شناسایی اشیاء یا افراد، تشخیص اقدامات خاص، رونویسی گفتار.
    • صوت: رونویسی گفتار، شناسایی گویندگان، تجزیه و تحلیل احساسات، تشخیص صداها یا موسیقی خاص.
    • تصاویر: تشخیص اشیاء، چهره‌ها، متن (OCR)، ارزیابی کیفیت یا زیبایی‌شناسی تصویر.
    • اسناد پیچیده: استخراج اطلاعات کلیدی، خلاصه‌سازی متن، شناسایی بندها یا موجودیت‌ها در قراردادها یا فیلمنامه‌ها.
  • تولید خودکار بینش: با بهره‌گیری از مدل‌های از پیش آموزش‌دیده (که به طور بالقوه شامل مدل‌های پایه NVIDIA است که از طریق رابط‌هایی مانند میکروسرویس‌های NVIDIA NIM قابل دسترسی هستند) و امکان پیکربندی هدایت‌شده توسط کاربر، سازنده فرآیند تجزیه و تحلیل را خودکار می‌کند. این می‌تواند شامل وظایفی مانند برچسب‌گذاری خودکار دارایی‌ها با کلمات کلیدی مرتبط بر اساس محتوای بصری یا شنیداری، تولید خلاصه فیلم‌ها یا اسناد طولانی، شناسایی مسائل مربوط به انطباق (compliance) در تبلیغات خلاقانه، یا تجزیه و تحلیل احساسات مخاطبان از ترک‌های تفسیر باشد.
  • کاهش کار دستی: فوری‌ترین مزیت، کاهش شدید تلاش دستی مورد نیاز برای کارهایی مانند ثبت محتوا، بررسی انطباق و تجزیه و تحلیل اولیه است. این منابع انسانی ارزشمند را برای کارهای خلاقانه و استراتژیک سطح بالاتر آزاد می‌کند.
  • جمع‌آوری متمرکز اطلاعات: با پردازش دارایی‌های رسانه‌ای متنوع از طریق یک پلتفرم یکپارچه، سازمان‌ها می‌توانند یک مخزن متمرکز از بینش‌های استخراج‌شده ایجاد کنند، سیلوهای اطلاعاتی را از بین ببرند و دید جامع‌تری از چشم‌انداز محتوای خود ارائه دهند.
  • تسریع زمان رسیدن به بینش: خودکارسازی تجزیه و تحلیل به طور قابل توجهی فرآیند استخراج هوش عملیاتی از دارایی‌های رسانه‌ای را سرعت می‌بخشد. این امکان تصمیم‌گیری سریع‌تر در مورد استراتژی محتوا، برنامه‌های زمان‌بندی برنامه‌ها، کمپین‌های بازاریابی و مدیریت حقوق را فراهم می‌کند.

این رویکرد بدون کد (no-code) به متخصصان موضوعی – آرشیویست‌ها، بازاریابان، تیم‌های حقوقی، استراتژیست‌های محتوا – قدرت می‌دهد تا مستقیماً از هوش مصنوعی برای نیازهای خاص خود استفاده کنند و پذیرش گسترده‌تر و نوآوری را در سراسر سازمان بدون اتکای همگانی به تیم‌های برنامه‌نویسی هوش مصنوعی اختصاصی تقویت کنند.

الزامات استراتژیک و بنیادهای فناورانه

راه‌اندازی این راهکارها بر چشم‌انداز استراتژیکی تأکید دارد که توسط رهبری Qvest بیان شده است. Christophe Ponsart، یکی از رهبران مشترک هوش مصنوعی کاربردی Qvest، بر ماهیت مشارکتی این تلاش تأکید می‌کند: ‘همکاری مداوم ما با NVIDIA به ما امکان می‌دهد راه‌حل‌های رسانه‌محور متناسب را برای آزادسازی ارزش محتوای دیجیتال شرکت‌ها ارائه دهیم. ما با هم به مشتریان خود کمک می‌کنیم تا کاربردی‌ترین موارد استفاده از هوش مصنوعی را شناسایی کرده و راه‌حل‌هایی را پیاده‌سازی کنند که مورد پذیرش قرار گرفته و بازگشت سرمایه را به همراه داشته باشند.’ این امر نه تنها بر فناوری، بلکه بر پیاده‌سازی عملی، پذیرش کاربر و مزایای مالی ملموس تمرکز دارد – عواملی حیاتی برای هر سرمایه‌گذاری سازمانی.

Qvest و NVIDIA این ابزارها را به عنوان ‘آماده برای سازمان’ (enterprise-ready) معرفی می‌کنند، به این معنی که برای مقیاس‌پذیری (scalability)، قابلیت اطمینان (reliability) و یکپارچه‌سازی (integration) در اکوسیستم‌های رسانه‌ای پیچیده موجود ساخته شده‌اند. هدف این راه‌حل‌ها مقابله مستقیم با خواسته‌های اصلی چشم‌انداز رسانه‌ای مدرن است: پردازش کارآمد حجم عظیمی از محتوای بلادرنگ و آرشیو شده، تبدیل فرمت‌های بدون ساختار به اطلاعات ساختاریافته قابل استفاده، و در نهایت ساده‌سازی تصمیم‌گیری در کل زنجیره ارزش رسانه (media value chain)، از تولید اولیه تا غنی‌سازی محتوا و توزیع نهایی. تأکید کاملاً بر به حداکثر رساندن اتوماسیون، کاهش پیچیدگی عملیاتی و تسریع در تحقق ارزش از دارایی‌های دیجیتال است.

دیدگاه NVIDIA، که توسط Richard Kerris، معاون رسانه و سرگرمی به اشتراک گذاشته شده است، این دیدگاه را تکمیل می‌کند. Kerris اظهار داشت: ‘وارد کردن هوش مصنوعی به فضای رسانه مستلزم آن است که شرکت‌ها تکنیک‌ها و ابزارهای تولید جدیدی را برای اطمینان از عملکرد و تعامل کاربر اتخاذ کنند.’ ادغام موفقیت‌آمیز هوش مصنوعی فقط به معنای وصل کردن یک ماژول نرم‌افزاری جدید نیست؛ بلکه اغلب مستلزم بازنگری در گردش‌های کاری تثبیت‌شده و پذیرش پارادایم‌های عملیاتی متفاوت است. Kerris به طور خاص به نقش میکروسرویس‌های NVIDIA NIM – مدل‌های هوش مصنوعی بهینه‌سازی‌شده و بومی ابری که در پلتفرم‌های مختلف قابل استقرار هستند – و NVIDIA Holoscan for Media، پلتفرمی که برای ساخت و استقرار برنامه‌های هوش مصنوعی برای رسانه‌های زنده و پخش طراحی شده است، اشاره کرد. این فناوری‌ها زیرساخت اساسی را فراهم می‌کنند که شرکایی مانند Qvest را قادر می‌سازد تا برنامه‌های هوش مصنوعی پیچیده و بلادرنگ را سریع‌تر و مؤثرتر بسازند و مستقر کنند و به صنعت در تسریع پذیرش هوش مصنوعی و دستیابی به ‘نتایج واقعی’ کمک کنند.

تعامل مستمر و زمینه گسترده‌تر

رونمایی در غرفه W2055 نمایشگاه NAB Show تنها یک جنبه از تعامل Qvest است. این شرکت همچنین در یک گفتگوی صمیمانه (Fireside Chat) در کنار NVIDIA و AWS شرکت می‌کند و عمیق‌تر به موضوع آزادسازی ارزش محتوا با هوش مصنوعی می‌پردازد – گواهی بر تمرکز کل صنعت بر این چالش.

فراتر از NAB، Qvest و NVIDIA در حال برنامه‌ریزی یک وبینار (webinar) در ماه می هستند که به اولویت‌بندی موارد استفاده از هوش مصنوعی که درآمد و کارایی عملیاتی را به حداکثر می‌رسانند، اختصاص دارد. این اطلاع‌رسانی آموزشی بر تعهد آن‌ها نه تنها به ارائه ابزار، بلکه به راهنمایی صنعت در پیاده‌سازی استراتژیک هوش مصنوعی برای بهترین نتایج ممکن تأکید می‌کند. این شتاب‌دهنده‌های هوش مصنوعی که به تازگی معرفی شده‌اند، در مجموعه گسترده‌تر خدمات رسانه‌محور Qvest قرار می‌گیرند که شامل مشاوره هوش مصنوعی کاربردی (Applied AI consulting)، توسعه پلتفرم Over-The-Top (OTT)، بهینه‌سازی زنجیره تأمین رسانه دیجیتال (Digital Media Supply Chain)، استراتژی‌های تحول پخش (Broadcast Transformation) و یکپارچه‌سازی سیستم‌ها (Systems Integration) می‌شود. این زمینه نشان می‌دهد که راه‌حل‌های هوش مصنوعی بخشی از یک رویکرد جامع برای کمک به سازمان‌های رسانه‌ای در پیمایش تحولات فناورانه و تجاری است که آینده آن‌ها را شکل می‌دهد. سفر به سمت عملیات رسانه‌ای کاملاً یکپارچه با هوش مصنوعی پیچیده است، اما از طریق مشارکت‌های استراتژیک و توسعه ابزارهای هدفمند و کاربرپسند، شرکت‌هایی مانند Qvest و NVIDIA راه را برای یک چشم‌انداز رسانه‌ای کارآمدتر، بینش‌مندتر و جذاب‌تر هموار می‌کنند.