چشمانداز رسانه، سرگرمی و ورزش در حال تحولی شگرف است که ناشی از پیشرفت بیوقفه هوش مصنوعی است. تولیدکنندگان محتوا، پخشکنندگان و توزیعکنندگان با حجم بیسابقهای از داراییهای دیجیتال دست و پنجه نرم میکنند و با فشار شدیدی برای بهینهسازی عملیات، جذب مخاطبان به روشهای نوین و آزادسازی ارزش پنهان در آرشیوهای خود مواجه هستند. با درک این لحظه حیاتی، همکاری بین Qvest، یک شرکت مشاوره فناوری مشهور، و NVIDIA، پیشگام در محاسبات شتابیافته، در حال تشدید است و هدف آن تجهیز این صنعت با ابزارهای هوش مصنوعی قدرتمند و کاربردی است. این مشارکت که از اوایل سال 2024 فعال است، تخصص عمیق Qvest در گردش کار رسانهها را با پلتفرمهای پیشرفته هوش مصنوعی NVIDIA ترکیب میکند و راهحلهایی را نوید میدهد که فراتر از نوآوری صرفاً فناورانه رفته و نتایج تجاری ملموسی را ارائه میدهند. نمایشگاه معتبر NAB Show صحنهای برای آخرین نوآوریهای آنهاست، جایی که Qvest قرار است از دو راهکار پیشگامانه هوش مصنوعی کاربردی (Applied AI) رونمایی کند که برای توانمندسازی سازمانها در بهرهبرداری کامل از پتانسیل کتابخانههای محتوای دیجیتال و پخش زنده خود طراحی شدهاند.
همافزایی پیشران تحول رسانهای
اتحاد بین Qvest و NVIDIA فقط ترکیب لوگوها نیست؛ بلکه نشاندهنده تلفیقی استراتژیک از قابلیتهایی است که برای پیمایش پیچیدگیهای پیادهسازی هوش مصنوعی در محیطهای رسانهمحور ضروری است. Qvest دههها تجربه در درک گردشهای کاری پیچیده، چالشهای منحصربهفرد و نیازهای خاص پخشکنندگان، استودیوها، لیگهای ورزشی و سایر نهادهای رسانهای را به ارمغان میآورد. آنها مسیر از تولید محتوا تا پردازش، مدیریت، توزیع و کسب درآمد را درک میکنند. در مقابل، NVIDIA فناوری بنیادی را فراهم میکند – GPUهای قدرتمند، کیتهای توسعه نرمافزار (SDKs) پیچیده و مدلهای از پیش آموزشدیده که موتور هوش مصنوعی مدرن را تشکیل میدهند.
این همکاری بر ترجمه پتانسیل انتزاعی هوش مصنوعی به کاربردهای ملموسی متمرکز است که نقاط درد خاص صنعت را برطرف میکند. شرکتهای رسانهای اغلب در دادهها غرق شدهاند – ساعتها فیلم خام، آرشیوهای گسترده، ترکهای صوتی متنوع و فرادادههای پیچیده. چالش نه تنها در ذخیره این محتوا، بلکه در جستجو، تجزیه و تحلیل، استفاده مجدد و کسب درآمد کارآمد از آن نهفته است. روشهای سنتی اغلب شامل کار دستی قابل توجهی هستند که منجر به گلوگاهها، فرصتهای از دست رفته و هزینههای عملیاتی بالا میشود. ابتکار Qvest-NVIDIA مستقیماً این ناکارآمدیها را هدف قرار میدهد و با ارائه راهحلهایی که کارایی عملیاتی را افزایش میدهند، درها را به روی جریانهای درآمدی جدید باز میکنند و بهطور حیاتی، با آزاد کردن استعداد انسانی از کارهای تکراری، خلاقیت بیشتری را پرورش میدهند، به دنبال تسریع پذیرش هوش مصنوعی است. هدف، فراتر رفتن از پروژههای آزمایشی و اثبات مفاهیم به سمت استقرارهای هوش مصنوعی مقیاسپذیر و آماده برای سازمان است که بازگشت سرمایه قابل اندازهگیری را ارائه میدهند.
رونمایی از ابزارهای پیشرفته هوش مصنوعی در NAB Show
نمایشگاه NAB Show، یک مرکز جهانی برای متخصصان رسانه، سرگرمی و فناوری، پسزمینه ایدهآلی را برای Qvest فراهم میکند تا آخرین پیشنهادات مبتنی بر هوش مصنوعی خود را که با بهرهگیری از پشته فناوری قدرتمند NVIDIA توسعه یافتهاند، معرفی کند. اینها ساختارهای نظرینیستند، بلکه ابزارهای عملی هستند که برای تأثیرگذاری فوری طراحی شدهاند.
هوشمندی بلادرنگ: استخراجکننده رویداد ویدیویی چند دوربینه زنده عاملمحور (Agentic Live Multi-Camera Video Event Extractor)
تصور کنید در حال پوشش یک رویداد ورزشی بزرگ زنده یا یک خبر فوری با چندین فید دوربین هستید که به طور همزمان پخش میشوند. حجم عظیم ویدیوی ورودی چالشی قابل توجه برای تیمهای تولیدی است که هدفشان ثبت هر لحظه حیاتی، شناسایی بهترین زوایای دوربین و تولید سریع خلاصهها یا نکات برجسته است. Agentic Live Multi-Camera Video Event Extractor مستقیماً با این چالش مقابله میکند.
این راهکار پیچیده به صورت بلادرنگ عمل میکند و چندین جریان ویدیویی ورودی را به طور همزمان تجزیه و تحلیل میکند. قابلیتهای اصلی آن عبارتند از:
- تشخیص خودکار رویداد: این سیستم از الگوریتمهای پیشرفته بینایی کامپیوتر (computer vision) استفاده میکند که به طور بالقوه بر روی مجموعه دادههای وسیعی از رویدادهای مشابه آموزش دیدهاند تا به طور خودکار رخدادهای مهم را در فیدهای زنده شناسایی کند. در یک مسابقه فوتبال، این میتواند به معنای تشخیص گلها، خطاها، سیوهای کلیدی یا اقدامات خاص بازیکنان باشد. در یک کنفرانس خبری، ممکن است لحظات هیجان بالا، حرکات خاص یا ظاهر شدن افراد کلیدی را شناسایی کند.
- خلاصهسازی هوشمند: فراتر از تشخیص ساده، این ابزار میتواند خلاصههای موجزی از رویدادهایی که در فیدهای مختلف در حال وقوع هستند، تولید کند. این به تهیهکنندگان اجازه میدهد تا به سرعت جریان روایت را درک کرده و بدون نیاز به جستجوی دستی ساعتها فیلم از زوایای مختلف، تصمیمات آگاهانه بگیرند.
- شناسایی بهترین نما: یک عملکرد حیاتی برای تولید زنده، انتخاب جذابترین زاویه دوربین در هر لحظه معین است. این راهکار هوش مصنوعی عواملی مانند ترکیببندی نما، پایداری دوربین، فوکوس سوژه و ارتباط کنش را در تمام فیدهای موجود تجزیه و تحلیل میکند تا نمای بهینه را توصیه کند یا حتی به طور خودکار به آن سوئیچ کند، که به طور قابل توجهی به کارگردان کمک کرده و تجربه بیننده را بهبود میبخشد.
- استخراج دادههای ساختاریافته: شاید قدرتمندترین ویژگی این سیستم، تبدیل دادههای ویدیویی بدون ساختار به اطلاعات ساختاریافته و قابل جستجو باشد. رویدادها، برچسبهای زمانی، زوایای دوربین و به طور بالقوه حتی افراد یا اشیاء شناسایی شده به عنوان فراداده (metadata) ثبت میشوند. این دادههای ساختاریافته برای تجزیه و تحلیل پس از رویداد، ایجاد سریع بستههای نکات برجسته، ارائه محتوای شخصیسازی شده (به عنوان مثال، نمایش نکات برجسته یک بازیکن خاص) و غنیسازی دسترسی به آرشیو بسیار ارزشمند است.
پیامدهای آن عمیق است. پخشکنندگان میتوانند گردش کار تولید زنده خود را ساده کنند و نیاز به تیمهای بزرگ برای ثبت دستی رویدادها را کاهش دهند. لیگهای ورزشی میتوانند نکات برجسته تقریباً آنی را برای تعامل در رسانههای اجتماعی تولید کنند یا تجربیات تماشای سفارشی را به طرفداران ارائه دهند. شرکتهای رسانهای که رویدادهای زنده را پوشش میدهند میتوانند منابع خود را به طور کارآمدتری مدیریت کرده و ارزش بیشتری از محتوای خود، هم در طول و هم پس از رویداد، استخراج کنند. این فراتر از اتوماسیون ساده به سمت تقویت هوشمند فرآیند تولید حرکت میکند.
دموکراتیزه کردن بینشها: سازنده عامل هوش مصنوعی رسانهمحور بدون کد (No-Code Media-Centric AI Agent Builder)
در حالی که پتانسیل هوش مصنوعی در تجزیه و تحلیل رسانهها بسیار زیاد است، پذیرش آن اغلب به دلیل نیاز به مهارتهای فنی تخصصی با مانع مواجه شده است. دانشمندان داده و مهندسان هوش مصنوعی تقاضای بالایی دارند و توسعه مدلهای هوش مصنوعی سفارشی میتواند زمانبر و پرهزینه باشد. Qvest با No-Code Media-Centric AI Agent Builder به این گلوگاه رسیدگی میکند.
این ابزار گامی مهم به سوی دموکراتیزه کردن هوش مصنوعی برای متخصصان رسانه است. همانطور که از نامش پیداست، به کاربرانی که تخصص کدنویسی ندارند اجازه میدهد تا عاملهای هوش مصنوعی (AI agents) را بسازند و مستقر کنند که قادر به استخراج بینشهای معنادار از فرمتهای مختلف رسانهای هستند. جنبههای کلیدی عبارتند از:
- رابط کاربری ساده: کاربران از طریق یک رابط گرافیکی بصری با سازنده تعامل دارند و به جای نوشتن کدهای پیچیده، انواع رسانههایی را که میخواهند تجزیه و تحلیل کنند و بینشهای خاصی را که به دنبال آن هستند، تعریف میکنند.
- مدیریت رسانههای متنوع: این پلتفرم برای دریافت و تجزیه و تحلیل طیف گستردهای از رسانههای بدون ساختار رایج در صنعت طراحی شده است، از جمله:
- ویدیو: تجزیه و تحلیل صحنهها، شناسایی اشیاء یا افراد، تشخیص اقدامات خاص، رونویسی گفتار.
- صوت: رونویسی گفتار، شناسایی گویندگان، تجزیه و تحلیل احساسات، تشخیص صداها یا موسیقی خاص.
- تصاویر: تشخیص اشیاء، چهرهها، متن (OCR)، ارزیابی کیفیت یا زیباییشناسی تصویر.
- اسناد پیچیده: استخراج اطلاعات کلیدی، خلاصهسازی متن، شناسایی بندها یا موجودیتها در قراردادها یا فیلمنامهها.
- تولید خودکار بینش: با بهرهگیری از مدلهای از پیش آموزشدیده (که به طور بالقوه شامل مدلهای پایه NVIDIA است که از طریق رابطهایی مانند میکروسرویسهای NVIDIA NIM قابل دسترسی هستند) و امکان پیکربندی هدایتشده توسط کاربر، سازنده فرآیند تجزیه و تحلیل را خودکار میکند. این میتواند شامل وظایفی مانند برچسبگذاری خودکار داراییها با کلمات کلیدی مرتبط بر اساس محتوای بصری یا شنیداری، تولید خلاصه فیلمها یا اسناد طولانی، شناسایی مسائل مربوط به انطباق (compliance) در تبلیغات خلاقانه، یا تجزیه و تحلیل احساسات مخاطبان از ترکهای تفسیر باشد.
- کاهش کار دستی: فوریترین مزیت، کاهش شدید تلاش دستی مورد نیاز برای کارهایی مانند ثبت محتوا، بررسی انطباق و تجزیه و تحلیل اولیه است. این منابع انسانی ارزشمند را برای کارهای خلاقانه و استراتژیک سطح بالاتر آزاد میکند.
- جمعآوری متمرکز اطلاعات: با پردازش داراییهای رسانهای متنوع از طریق یک پلتفرم یکپارچه، سازمانها میتوانند یک مخزن متمرکز از بینشهای استخراجشده ایجاد کنند، سیلوهای اطلاعاتی را از بین ببرند و دید جامعتری از چشمانداز محتوای خود ارائه دهند.
- تسریع زمان رسیدن به بینش: خودکارسازی تجزیه و تحلیل به طور قابل توجهی فرآیند استخراج هوش عملیاتی از داراییهای رسانهای را سرعت میبخشد. این امکان تصمیمگیری سریعتر در مورد استراتژی محتوا، برنامههای زمانبندی برنامهها، کمپینهای بازاریابی و مدیریت حقوق را فراهم میکند.
این رویکرد بدون کد (no-code) به متخصصان موضوعی – آرشیویستها، بازاریابان، تیمهای حقوقی، استراتژیستهای محتوا – قدرت میدهد تا مستقیماً از هوش مصنوعی برای نیازهای خاص خود استفاده کنند و پذیرش گستردهتر و نوآوری را در سراسر سازمان بدون اتکای همگانی به تیمهای برنامهنویسی هوش مصنوعی اختصاصی تقویت کنند.
الزامات استراتژیک و بنیادهای فناورانه
راهاندازی این راهکارها بر چشمانداز استراتژیکی تأکید دارد که توسط رهبری Qvest بیان شده است. Christophe Ponsart، یکی از رهبران مشترک هوش مصنوعی کاربردی Qvest، بر ماهیت مشارکتی این تلاش تأکید میکند: ‘همکاری مداوم ما با NVIDIA به ما امکان میدهد راهحلهای رسانهمحور متناسب را برای آزادسازی ارزش محتوای دیجیتال شرکتها ارائه دهیم. ما با هم به مشتریان خود کمک میکنیم تا کاربردیترین موارد استفاده از هوش مصنوعی را شناسایی کرده و راهحلهایی را پیادهسازی کنند که مورد پذیرش قرار گرفته و بازگشت سرمایه را به همراه داشته باشند.’ این امر نه تنها بر فناوری، بلکه بر پیادهسازی عملی، پذیرش کاربر و مزایای مالی ملموس تمرکز دارد – عواملی حیاتی برای هر سرمایهگذاری سازمانی.
Qvest و NVIDIA این ابزارها را به عنوان ‘آماده برای سازمان’ (enterprise-ready) معرفی میکنند، به این معنی که برای مقیاسپذیری (scalability)، قابلیت اطمینان (reliability) و یکپارچهسازی (integration) در اکوسیستمهای رسانهای پیچیده موجود ساخته شدهاند. هدف این راهحلها مقابله مستقیم با خواستههای اصلی چشمانداز رسانهای مدرن است: پردازش کارآمد حجم عظیمی از محتوای بلادرنگ و آرشیو شده، تبدیل فرمتهای بدون ساختار به اطلاعات ساختاریافته قابل استفاده، و در نهایت سادهسازی تصمیمگیری در کل زنجیره ارزش رسانه (media value chain)، از تولید اولیه تا غنیسازی محتوا و توزیع نهایی. تأکید کاملاً بر به حداکثر رساندن اتوماسیون، کاهش پیچیدگی عملیاتی و تسریع در تحقق ارزش از داراییهای دیجیتال است.
دیدگاه NVIDIA، که توسط Richard Kerris، معاون رسانه و سرگرمی به اشتراک گذاشته شده است، این دیدگاه را تکمیل میکند. Kerris اظهار داشت: ‘وارد کردن هوش مصنوعی به فضای رسانه مستلزم آن است که شرکتها تکنیکها و ابزارهای تولید جدیدی را برای اطمینان از عملکرد و تعامل کاربر اتخاذ کنند.’ ادغام موفقیتآمیز هوش مصنوعی فقط به معنای وصل کردن یک ماژول نرمافزاری جدید نیست؛ بلکه اغلب مستلزم بازنگری در گردشهای کاری تثبیتشده و پذیرش پارادایمهای عملیاتی متفاوت است. Kerris به طور خاص به نقش میکروسرویسهای NVIDIA NIM – مدلهای هوش مصنوعی بهینهسازیشده و بومی ابری که در پلتفرمهای مختلف قابل استقرار هستند – و NVIDIA Holoscan for Media، پلتفرمی که برای ساخت و استقرار برنامههای هوش مصنوعی برای رسانههای زنده و پخش طراحی شده است، اشاره کرد. این فناوریها زیرساخت اساسی را فراهم میکنند که شرکایی مانند Qvest را قادر میسازد تا برنامههای هوش مصنوعی پیچیده و بلادرنگ را سریعتر و مؤثرتر بسازند و مستقر کنند و به صنعت در تسریع پذیرش هوش مصنوعی و دستیابی به ‘نتایج واقعی’ کمک کنند.
تعامل مستمر و زمینه گستردهتر
رونمایی در غرفه W2055 نمایشگاه NAB Show تنها یک جنبه از تعامل Qvest است. این شرکت همچنین در یک گفتگوی صمیمانه (Fireside Chat) در کنار NVIDIA و AWS شرکت میکند و عمیقتر به موضوع آزادسازی ارزش محتوا با هوش مصنوعی میپردازد – گواهی بر تمرکز کل صنعت بر این چالش.
فراتر از NAB، Qvest و NVIDIA در حال برنامهریزی یک وبینار (webinar) در ماه می هستند که به اولویتبندی موارد استفاده از هوش مصنوعی که درآمد و کارایی عملیاتی را به حداکثر میرسانند، اختصاص دارد. این اطلاعرسانی آموزشی بر تعهد آنها نه تنها به ارائه ابزار، بلکه به راهنمایی صنعت در پیادهسازی استراتژیک هوش مصنوعی برای بهترین نتایج ممکن تأکید میکند. این شتابدهندههای هوش مصنوعی که به تازگی معرفی شدهاند، در مجموعه گستردهتر خدمات رسانهمحور Qvest قرار میگیرند که شامل مشاوره هوش مصنوعی کاربردی (Applied AI consulting)، توسعه پلتفرم Over-The-Top (OTT)، بهینهسازی زنجیره تأمین رسانه دیجیتال (Digital Media Supply Chain)، استراتژیهای تحول پخش (Broadcast Transformation) و یکپارچهسازی سیستمها (Systems Integration) میشود. این زمینه نشان میدهد که راهحلهای هوش مصنوعی بخشی از یک رویکرد جامع برای کمک به سازمانهای رسانهای در پیمایش تحولات فناورانه و تجاری است که آینده آنها را شکل میدهد. سفر به سمت عملیات رسانهای کاملاً یکپارچه با هوش مصنوعی پیچیده است، اما از طریق مشارکتهای استراتژیک و توسعه ابزارهای هدفمند و کاربرپسند، شرکتهایی مانند Qvest و NVIDIA راه را برای یک چشمانداز رسانهای کارآمدتر، بینشمندتر و جذابتر هموار میکنند.