Qvest i NVIDIA: Innowacje AI dla mediów na NAB Show

Krajobraz mediów, rozrywki i sportu przechodzi sejsmiczną zmianę, napędzaną przez nieustanny postęp sztucznej inteligencji. Twórcy treści, nadawcy i dystrybutorzy zmagają się z bezprecedensową ilością zasobów cyfrowych, stając w obliczu intensywnej presji na usprawnienie operacji, angażowanie odbiorców w nowatorski sposób i odblokowanie ukrytej wartości w swoich archiwach. Dostrzegając ten kluczowy moment, współpraca między Qvest, renomowaną firmą konsultingową w dziedzinie technologii, a NVIDIA, pionierem w dziedzinie przyspieszonych obliczeń, intensyfikuje się, mając na celu wyposażenie branży w potężne, praktyczne narzędzia AI. To partnerstwo, aktywne od początku 2024 roku, łączy głęboką wiedzę domenową Qvest w zakresie przepływów pracy w mediach z najnowocześniejszymi platformami AI firmy NVIDIA, obiecując rozwiązania, które wykraczają poza zwykłą nowość technologiczną, aby dostarczyć wymierne wyniki biznesowe. Prestiżowe targi NAB Show służą jako scena dla ich najnowszych innowacji, gdzie Qvest ma zaprezentować dwa przełomowe rozwiązania Applied AI, zaprojektowane w celu umożliwienia organizacjom wykorzystania pełnego potencjału ich bibliotek treści cyfrowych i transmisji na żywo.

Synergia napędzająca transformację mediów

Sojusz między Qvest a NVIDIA to nie tylko połączenie logo; reprezentuje strategiczne połączenie możliwości niezbędnych do poruszania się po złożonościach wdrażania AI w środowiskach skoncentrowanych na mediach. Qvest wnosi dziesięciolecia doświadczenia w rozumieniu skomplikowanych przepływów pracy, unikalnych wyzwań i specyficznych potrzeb nadawców, studiów, lig sportowych i innych podmiotów medialnych. Rozumieją podróż od tworzenia treści przez przetwarzanie, zarządzanie, dystrybucję i monetyzację. NVIDIA z kolei dostarcza technologię fundamentalną – potężne procesory graficzne (GPU), zaawansowane zestawy do tworzenia oprogramowania (SDK) i wstępnie wytrenowane modele, które stanowią silnik nowoczesnej AI.

Ta współpraca koncentruje się na przełożeniu abstrakcyjnego potencjału sztucznej inteligencji na konkretne aplikacje, które rozwiązują specyficzne problemy branżowe. Firmy medialne często toną w danych – godzinach surowego materiału filmowego, obszernych archiwach, różnorodnych ścieżkach audio i złożonych metadanych. Wyzwanie polega nie tylko na przechowywaniu tych treści, ale na ich efektywnym wyszukiwaniu, analizowaniu, ponownym wykorzystywaniu i monetyzacji. Tradycyjne metody często wiążą się ze znacznym nakładem pracy ręcznej, co prowadzi do wąskich gardeł, utraconych możliwości i wysokich kosztów operacyjnych. Inicjatywa Qvest-NVIDIA bezpośrednio celuje w te nieefektywności, dążąc do przyspieszenia adopcji AI poprzez dostarczanie rozwiązań, które zwiększają wydajność operacyjną, otwierają drzwi do nowych strumieni przychodów i, co kluczowe, wspierają większą kreatywność, uwalniając ludzki talent od powtarzalnych zadań. Celem jest wyjście poza projekty pilotażowe i dowody koncepcji (proof-of-concepts) do skalowalnych, gotowych do wdrożenia w przedsiębiorstwie rozwiązań AI, które zapewniają mierzalny zwrot z inwestycji.

Odsłonięcie zaawansowanych narzędzi AI na NAB Show

NAB Show, globalne epicentrum dla profesjonalistów z branży mediów, rozrywki i technologii, stanowi idealne tło dla Qvest do zaprezentowania swoich najnowszych ofert opartych na AI, opracowanych z wykorzystaniem potężnego stosu technologicznego NVIDIA. Nie są to teoretyczne konstrukcje, ale praktyczne narzędzia zaprojektowane z myślą o natychmiastowym wpływie.

Inteligencja w czasie rzeczywistym: Agentic Live Multi-Camera Video Event Extractor

Wyobraź sobie relacjonowanie ważnego wydarzenia sportowego na żywo lub szybko rozwijającej się wiadomości z wieloma strumieniami wideo przesyłanymi jednocześnie. Sama objętość napływającego wideo stanowi znaczące wyzwanie dla zespołów produkcyjnych, które dążą do uchwycenia każdego kluczowego momentu, zidentyfikowania najlepszych kątów kamery i szybkiego generowania podsumowań lub skrótów. Agentic Live Multi-Camera Video Event Extractor stawia czoła temu wyzwaniu.

To zaawansowane rozwiązanie działa w czasie rzeczywistym, analizując jednocześnie wiele napływających strumieni wideo. Jego podstawowe możliwości obejmują:

  • Automatyczne wykrywanie zdarzeń: System wykorzystuje zaawansowane algorytmy widzenia komputerowego, potencjalnie wytrenowane na ogromnych zbiorach danych podobnych wydarzeń, do automatycznego identyfikowania znaczących zdarzeń w transmisjach na żywo. W meczu piłki nożnej może to oznaczać wykrywanie bramek, fauli, kluczowych interwencji bramkarza lub określonych akcji zawodników. Na konferencji prasowej może identyfikować momenty wzmożonych emocji, specyficzne gesty lub pojawienie się kluczowych osób.
  • Inteligentne podsumowywanie: Poza prostym wykrywaniem, narzędzie może generować zwięzłe podsumowania wydarzeń rozgrywających się na różnych kanałach. Pozwala to producentom szybko zrozumieć przebieg narracji i podejmować świadome decyzje bez ręcznego przeglądania godzin materiału filmowego z różnych kątów.
  • Identyfikacja najlepszego ujęcia: Krytyczną funkcją dla produkcji na żywo jest wybór najbardziej atrakcyjnego kąta kamery w danym momencie. To rozwiązanie AI analizuje czynniki takie jak kompozycja ujęcia, stabilność kamery, ostrość obiektu i znaczenie akcji we wszystkich dostępnych kanałach, aby zarekomendować lub nawet automatycznie przełączyć na optymalne ujęcie, znacznie wspomagając reżysera i poprawiając wrażenia widza.
  • Ekstrakcja danych strukturalnych: Być może najpotężniejszą funkcją jest przekształcanie przez system nieustrukturyzowanych danych wideo w ustrukturyzowane, przeszukiwalne informacje. Zdarzenia, znaczniki czasu, kąty kamery, a potencjalnie nawet rozpoznane osoby lub obiekty są rejestrowane jako metadane. Te ustrukturyzowane dane są nieocenione do analizy po wydarzeniu, szybkiego tworzenia pakietów skrótów, dostarczania spersonalizowanych treści (np. pokazywania skrótów konkretnego zawodnika) i wzbogacania dostępności archiwum.

Implikacje są głębokie. Nadawcy mogą usprawnić swoje przepływy pracy w produkcji na żywo, zmniejszając potrzebę zatrudniania dużych zespołów do ręcznego rejestrowania zdarzeń. Ligi sportowe mogą generować niemal natychmiastowe skróty do zaangażowania w mediach społecznościowych lub oferować fanom spersonalizowane wrażenia z oglądania. Firmy medialne relacjonujące wydarzenia na żywo mogą efektywniej zarządzać swoimi zasobami i wydobywać większą wartość ze swoich treści, zarówno podczas, jak i po wydarzeniu. To wykracza poza prostą automatyzację w kierunku inteligentnego wzmocnienia procesu produkcyjnego.

Demokratyzacja wglądów: No-Code Media-Centric AI Agent Builder

Chociaż potencjał AI w analizie mediów jest ogromny, jej adopcja często była hamowana przez potrzebę posiadania specjalistycznych umiejętności technicznych. Naukowcy danych i inżynierowie AI są bardzo poszukiwani, a tworzenie niestandardowych modeli AI może być czasochłonne i kosztowne. Qvest rozwiązuje ten problem za pomocą No-Code Media-Centric AI Agent Builder.

Narzędzie to stanowi znaczący krok w kierunku demokratyzacji AI dla profesjonalistów z branży medialnej. Jak sama nazwa wskazuje, pozwala użytkownikom bez doświadczenia w kodowaniu budować i wdrażać agentów AI zdolnych do wydobywania znaczących wglądów z różnych formatów medialnych. Kluczowe aspekty obejmują:

  • Uproszczony interfejs: Użytkownicy wchodzą w interakcję z narzędziem za pomocą intuicyjnego interfejsu graficznego, definiując rodzaje mediów, które chcą analizować, oraz konkretne wglądy, których szukają, zamiast pisać złożony kod.
  • Wszechstronna obsługa mediów: Platforma jest zaprojektowana do przyjmowania i analizowania szerokiej gamy nieustrukturyzowanych mediów powszechnych w branży, w tym:
    • Wideo: Analiza scen, identyfikacja obiektów lub osób, wykrywanie określonych działań, transkrypcja mowy.
    • Audio: Transkrypcja mowy, identyfikacja mówców, analiza sentymentu, wykrywanie określonych dźwięków lub muzyki.
    • Obrazy: Rozpoznawanie obiektów, twarzy, tekstu (OCR), ocena jakości lub estetyki obrazu.
    • Złożone dokumenty: Ekstrakcja kluczowych informacji, podsumowywanie tekstu, identyfikacja klauzul lub podmiotów w umowach lub scenariuszach.
  • Automatyczne generowanie wglądów: Wykorzystując wstępnie wytrenowane modele (potencjalnie w tym modele podstawowe NVIDIA dostępne za pośrednictwem interfejsów takich jak mikrousługi NVIDIA NIM) i umożliwiając konfigurację kierowaną przez użytkownika, narzędzie automatyzuje proces analizy. Może to obejmować zadania takie jak automatyczne tagowanie zasobów odpowiednimi słowami kluczowymi na podstawie treści wizualnych lub dźwiękowych, generowanie podsumowań długich filmów lub dokumentów, identyfikowanie problemów ze zgodnością w kreacjach reklamowych lub analizowanie nastrojów odbiorców na podstawie ścieżek komentarzy.
  • Redukcja pracy ręcznej: Najbardziej natychmiastową korzyścią jest drastyczne zmniejszenie wysiłku ręcznego wymaganego do zadań takich jak logowanie treści, sprawdzanie zgodności i podstawowa analiza. Uwalnia to cenne zasoby ludzkie na rzecz zadań kreatywnych i strategicznych wyższego poziomu.
  • Scentralizowane gromadzenie informacji: Przetwarzając różnorodne zasoby medialne za pośrednictwem ujednoliconej platformy, organizacje mogą stworzyć scentralizowane repozytorium wyekstrahowanych wglądów, przełamując silosy informacyjne i zapewniając bardziej holistyczny obraz ich krajobrazu treści.
  • Przyspieszony czas do uzyskania wglądu: Automatyzacja analizy znacznie przyspiesza proces uzyskiwania praktycznych informacji z zasobów medialnych. Pozwala to na szybsze podejmowanie decyzji dotyczących strategii treści, harmonogramów programowych, kampanii marketingowych i zarządzania prawami.

To podejście no-code umożliwia ekspertom merytorycznym – archiwistom, marketerom, zespołom prawnym, strategom treści – bezpośrednie wykorzystanie AI do ich specyficznych potrzeb, wspierając szerszą adopcję i innowacje w całej organizacji bez powszechnej zależności od dedykowanych zespołów programistów AI.

Imperatywy strategiczne i podstawy technologiczne

Wprowadzenie tych rozwiązań podkreśla strategiczną wizję sformułowaną przez kierownictwo Qvest. Christophe Ponsart, współkierownik działu Applied AI w Qvest, podkreśla współpracę: „Nasza ciągła współpraca z NVIDIA pozwala nam dostarczać dostosowane do potrzeb mediów rozwiązania, aby odblokować wartość cyfrowych treści firm. Razem pomagamy naszym klientom identyfikować najbardziej praktyczne zastosowania AI i wdrażać rozwiązania, które zyskują akceptację i przynoszą zwrot z inwestycji.” Podkreśla to skupienie nie tylko na technologii, ale na praktycznym wdrożeniu, adopcji przez użytkowników i wymiernych korzyściach finansowych – kluczowych czynnikach dla każdej inwestycji przedsiębiorstwa.

Qvest i NVIDIA pozycjonują te narzędzia jako „gotowe dla przedsiębiorstw” (enterprise-ready), co oznacza, że są zbudowane pod kątem skalowalności, niezawodności i integracji w istniejących złożonych ekosystemach medialnych. Rozwiązania mają na celu bezpośrednie sprostanie podstawowym wymaganiom współczesnego krajobrazu medialnego: efektywne przetwarzanie ogromnych ilości treści zarówno w czasie rzeczywistym, jak i archiwalnych, konwersja nieustrukturyzowanych formatów na użyteczne informacje strukturalne i ostatecznie usprawnienie podejmowania decyzji w całym łańcuchu wartości mediów, od początkowej produkcji przez wzbogacanie treści po ostateczną dystrybucję. Nacisk kładziony jest jednoznacznie na maksymalizację automatyzacji, redukcję złożoności operacyjnej i przyspieszenie realizacji wartości z zasobów cyfrowych.

Perspektywa NVIDIA, podzielana przez Richarda Kerrisa, wiceprezesa ds. mediów i rozrywki, uzupełnia ten pogląd. „Wprowadzenie AI do przestrzeni medialnej wymaga od firm przyjęcia nowych technik i narzędzi produkcyjnych, aby zapewnić funkcjonalność i zaangażowanie użytkowników” – stwierdził Kerris. Udana integracja AI to nie tylko podłączenie nowego modułu oprogramowania; często wymaga przemyślenia ustalonych przepływów pracy i przyjęcia innych paradygmatów operacyjnych. Kerris wspomniał w szczególności o roli mikrousług NVIDIA NIM – zoptymalizowanych, natywnych dla chmury modeli AI, które można wdrażać na różnych platformach – oraz NVIDIA Holoscan for Media, platformy zaprojektowanej do budowania i wdrażania aplikacji AI dla mediów na żywo i transmisji. Technologie te zapewniają podstawową infrastrukturę, która umożliwia partnerom takim jak Qvest szybsze i skuteczniejsze budowanie i wdrażanie zaawansowanych aplikacji AI w czasie rzeczywistym, pomagając branży przyspieszyć adopcję AI i osiągnąć „rzeczywiste rezultaty”.

Ciągłe zaangażowanie i szerszy kontekst

Prezentacja na stoisku W2055 podczas NAB Show to tylko jeden z aspektów zaangażowania Qvest. Firma bierze również udział w Fireside Chat wraz z NVIDIA i AWS, zagłębiając się w temat odblokowywania wartości treści za pomocą AI – co świadczy o ogólnobranżowym skupieniu na tym wyzwaniu.

Patrząc poza NAB, Qvest i NVIDIA planują w maju webinarium poświęcone priorytetyzacji przypadków użycia AI, które maksymalizują przychody i wydajność operacyjną. Ta działalność edukacyjna podkreśla ich zaangażowanie nie tylko w dostarczanie narzędzi, ale także w prowadzenie branży w strategicznym wdrażaniu AI w celu uzyskania najlepszych możliwych wyników. Te nowo wprowadzone akceleratory AI mieszczą się w szerszym portfolio usług Qvest skoncentrowanych na mediach, które obejmują doradztwo w zakresie Applied AI, rozwój platform Over-The-Top (OTT), optymalizację Digital Media Supply Chain, strategie Broadcast Transformation oraz Systems Integration. Ten kontekst pokazuje, że rozwiązania AI są częścią kompleksowego podejścia do pomagania organizacjom medialnym w nawigowaniu przez transformacje technologiczne i biznesowe kształtujące ich przyszłość. Podróż w kierunku w pełni zintegrowanych z AI operacji medialnych jest złożona, ale dzięki strategicznym partnerstwom i rozwojowi ukierunkowanych, przyjaznych dla użytkownika narzędzi, firmy takie jak Qvest i NVIDIA torują drogę do bardziej wydajnego, wnikliwego i angażującego krajobrazu medialnego.