Video AI Gemini Google Tiba, Sambutan Hambar

Google secara rasmi telah memasuki arena video kecerdasan buatan (AI), menjadikan model video AI Veo 2 boleh diakses oleh pelanggan Gemini Advanced.

Ini menandakan penampilan sulung teknologi video AI Google kepada umum, walaupun bermula dengan langganan berbayar.

Mereka yang berminat untuk bereksperimen dengan Veo 2 boleh memanfaatkan percubaan percuma selama sebulan langganan premium Google One AI, yang termasuk akses kepada Gemini Advanced. Selepas percubaan, langganan berharga $20 sebulan. Veo 2 juga disepadukan ke dalam projek animasi AI baharu Google Labs. Google bercadang untuk memperluaskan ketersediaan Veo 2 kepada pengguna percuma pada masa hadapan.

Kemunculan video AI mewakili evolusi terkini dalam AI generatif. Keluaran Veo 2 secara meluas oleh Google mengikuti inisiatif serupa oleh OpenAI (Sora) dan Adobe (Firefly). Sektor perkhidmatan kreatif AI menjadi semakin kompetitif, dengan firma teknologi utama memperkenalkan model video AI mereka. Penyertaan Google menandakan momentum yang semakin meningkat dalam penawaran perkhidmatan video AI.

Dasar privasi Gemini Google menetapkan bahawa ia boleh mengumpul data daripada interaksi pengguna, termasuk sembang dan fail, menasihati pengguna agar tidak berkongsi maklumat sulit. Dengan bersetuju dengan dasar AI generatif Google, pengguna bersetuju untuk mematuhi garis panduan penggunaan yang boleh diterima syarikat, yang bertujuan untuk mencegah penciptaan kandungan yang berbahaya atau menyalahi undang-undang.

Pengguna boleh menghasilkan klip AI pendek melalui web Gemini atau aplikasi mudah alih dengan memilih Veo 2 daripada pilihan model dalam antara muka Gemini Advanced. Video biasanya dijana dalam masa satu atau dua minit.

Klip yang dijana AI ini dihadkan kepada tempoh lapan saat dan resolusi 720p, tanpa audio. Gemini secara automatik menghasilkan video dalam format mendatar 16:9, tanpa pilihan yang jelas untuk saiz alternatif, walaupun dinyatakan dalam gesaan. Tambahan pula, pengguna tidak boleh memuat naik imej atau rujukan gaya, memerlukan kemahiran dalam kejuruteraan gesaan AI untuk mencapai hasil video yang diinginkan.

Terdapat sekatan ke atas bilangan video yang boleh dijana oleh pengguna setiap bulan, walaupun ukuran tepat kredit ini masih belum ditentukan. Google menunjukkan bahawa pengguna akan menerima amaran dalam Gemini apabila mereka menghampiri had mereka.

Tanda air SynthID Google secara automatik dibenamkan dalam video Veo 2. Tanda air yang tidak dapat dilihat ini berfungsi untuk mengenal pasti kandungan yang dijana sepenuhnya oleh AI. Google juga menggunakan teknologi ini untuk imej yang dihasilkan menggunakan model teks-ke-imej Imagen 3.

Penilaian awal Veo 2 mencadangkan bahawa video adalah memuaskan tetapi tidak luar biasa. Gemini menunjukkan kepatuhan yang terpuji kepada gesaan, menjana kandungan dengan tepat dengan ralat atau ketidakkonsistenan yang minimum. Walau bagaimanapun, platform seperti Sora dan Firefly membenarkan penciptaan video AI pada resolusi yang lebih tinggi, seperti 1080p, dan menawarkan pilihan penyesuaian yang lebih luas, yang penting untuk meminimumkan penyuntingan pasca-produksi. Walaupun Google pasti mempunyai rancangan untuk peningkatan Veo, Veo 2 pada masa ini berfungsi sebagai alat yang menarik untuk eksperimen tetapi tidak mungkin menjadi penting untuk aliran kerja harian pencipta.

Menyelami Lebih Dalam Veo 2 Gemini: Gambaran Keseluruhan yang Komprehensif

Walaupun keluaran awal Veo 2 Google mungkin kelihatan kurang memberangsangkan berbanding pesaing seperti Sora OpenAI dan Firefly Adobe, adalah penting untuk menyelidiki lebih dalam butiran khusus keupayaan, batasan dan potensinya. Memahami nuansa ini adalah penting bagi sesiapa yang mempertimbangkan untuk menyepadukan Veo 2 ke dalam aliran kerja kreatif mereka.

Resolusi dan Kualiti Output

Salah satu batasan paling ketara Veo 2 ialah resolusi output maksimumnya iaitu 720p. Dalam era di mana video 4K semakin menjadi standard, dan malah peranti mudah alih mampu merakam dalam definisi tinggi, kekangan ini memberi kesan ketara kepada kualiti kandungan yang dijana. Walaupun 720p mungkin mencukupi untuk siaran media sosial pantas atau komunikasi dalaman, ia tidak mencukupi untuk aplikasi profesional atau projek yang memerlukan kesetiaan visual yang tinggi. Pesaing seperti Sora, yang menawarkan output 1080p, serta-merta mempunyai kelebihan dalam bidang ini.

Ketiadaan Audio

Ketiadaan audio dalam video yang dijana Veo 2 ialah satu lagi kelemahan yang ketara. Bunyi ialah elemen penting dalam penceritaan video, dan ketiadaannya memerlukan kerja pasca-produksi tambahan untuk menambahkan muzik, kesan bunyi atau dialog. Ini bukan sahaja meningkatkan masa dan usaha yang diperlukan untuk mencipta produk siap tetapi juga mengehadkan kemungkinan kreatif dalam proses penjanaan AI itu sendiri. Pengguna yang berharap untuk mencipta video menarik dengan audio bersepadu akan mendapati Veo 2 kurang dalam hal ini.

Pilihan Penyesuaian Terhad

Pilihan penyesuaian terhad Veo 2 selanjutnya menyekat kebolehgunaannya. Ketidakupayaan untuk menentukan nisbah aspek di luar format 16:9 standard, ditambah pula dengan kekurangan sokongan untuk imej atau rujukan gaya, menyukarkan untuk menyesuaikan output kepada visi kreatif tertentu. Ini memaksa pengguna untuk bergantung sepenuhnya pada gesaan teks sahaja, yang mungkin sukar untuk ditala halus untuk mencapai hasil yang tepat. Sebaliknya, platform yang membenarkan input visual dan kawalan yang lebih terperinci ke atas gaya dan komposisi menawarkan kelebihan yang ketara.

Cabaran Kejuruteraan Gesaan

Memandangkan batasan dalam penyesuaian, kejuruteraan gesaan yang berkesan menjadi amat penting apabila menggunakan Veo 2. Pengguna mesti belajar untuk membuat gesaan yang terperinci dan tepat untuk membimbing AI ke arah hasil yang diinginkan. Ini memerlukan pemahaman yang mendalam tentang cara AI mentafsir bahasa dan menterjemahkannya ke dalam kandungan visual. Walaupun eksperimen boleh membantu pengguna mengembangkan kemahiran ini, keluk pembelajaran boleh menjadi curam, dan malah jurutera gesaan yang berpengalaman mungkin bergelut untuk mencapai hasil yang konsisten. Ketiadaan maklum balas visual semasa proses penciptaan gesaan selanjutnya merumitkan lagi perkara.

Had Penjanaan Bulanan

Had penjanaan bulanan yang tidak didedahkan menambah lapisan ketidakpastian lain kepada kebolehgunaan Veo 2. Tanpa maklumat yang jelas tentang cara had ini dikira, pengguna mungkin teragak-agak untuk menyepadukan sepenuhnya Veo 2 ke dalam aliran kerja mereka, bimbang mereka akan kehabisan kredit pada saat yang kritikal. Kekurangan ketelusan ini amat membimbangkan bagi pengguna profesional yang bergantung pada akses yang boleh diramal kepada alatan AI.

Janji Tanda Air SynthID

Walaupun terdapat batasan, Veo 2 menawarkan satu kelebihan ketara: kemasukan tanda air SynthID. Tanda air yang tidak kelihatan ini membantu membezakan kandungan yang dijana AI daripada kandungan yang dicipta manusia, yang menjadi semakin penting dalam memerangi maklumat salah dan deepfake. Walaupun keberkesanan SynthID dalam mengesan video yang dijana AI merentas platform dan proses penyuntingan yang berbeza masih belum dapat dilihat, kemasukannya menandakan komitmen Google terhadap pembangunan AI yang bertanggungjawab.

Potensi Pertumbuhan Masa Depan

Adalah penting untuk diingat bahawa Veo 2 masih berada dalam peringkat awal pembangunannya. Google mempunyai sejarah meningkatkan produk AInya secara berulang kali, dan berkemungkinan Veo 2 akan menerima kemas kini dan peningkatan yang ketara pada masa hadapan. Potensi penambahbaikan boleh termasuk:

  • Peningkatan resolusi output (1080p, 4K)
  • Penyepaduan audio
  • Pilihan penyesuaian yang lebih luas (nisbah aspek, rujukan gaya)
  • Alatan kejuruteraan gesaan yang dipertingkatkan
  • Maklumat yang lebih jelas tentang had penjanaan
  • Teknologi tanda air SynthID yang dipertingkatkan

Veo 2 dalam Konteks Lebih Luas Penjanaan Video AI

Untuk benar-benar memahami kedudukan Veo 2 di pasaran, adalah penting untuk membandingkannya dengan platform penjanaan video AI yang terkemuka lain. Walaupun setiap platform mempunyai kekuatan dan kelemahannya yang tersendiri, memahami perbezaan ini boleh membantu pengguna membuat keputusan termaklum tentang alat yang paling sesuai dengan keperluan mereka.

Sora OpenAI

Sora OpenAI boleh dikatakan platform penjanaan video AI yang paling diperkatakan yang tersedia pada masa ini. Kekuatan utamanya termasuk:

  • Output berkualiti tinggi: Sora mampu menjana video pada resolusi 1080p dengan kesetiaan visual yang mengagumkan.
  • Pergerakan realistik: Sora cemerlang dalam mencipta pergerakan yang realistik dan kelihatan semula jadi, yang penting untuk mencipta adegan yang boleh dipercayai.
  • Penjanaan adegan kompleks: Sora boleh menjana video dengan butiran yang rumit dan interaksi kompleks antara objek dan watak.
  • Teks-ke-video dan imej-ke-video: Sora menyokong kedua-dua gesaan teks dan imej, memberikan pengguna tahap fleksibiliti yang tinggi.

Walau bagaimanapun, Sora juga mempunyai batasannya:

  • Ketersediaan terhad: Sora pada masa ini hanya tersedia kepada kumpulan terpilih penyelidik dan artis.
  • Kos pengkomputeran yang tinggi: Menjana video dengan Sora memerlukan sumber pengkomputeran yang ketara, yang boleh membawa kepada kos penggunaan yang tinggi pada masa hadapan.
  • Potensi penyalahgunaan: Keupayaan untuk mencipta video yang dijana AI yang sangat realistik menimbulkan kebimbangan tentang potensi penyalahgunaan, seperti penciptaan deepfake.

Firefly Adobe

Firefly Adobe ialah satu lagi pemain utama dalam ruang penjanaan video AI. Kekuatan utamanya termasuk:

  • Penyepaduan dengan Adobe Creative Suite: Firefly disepadukan dengan lancar dengan alat kreatif popular Adobe, seperti Photoshop dan Premiere Pro, menjadikannya mudah untuk pengguna menggabungkan kandungan yang dijana AI ke dalam aliran kerja sedia ada mereka.
  • Fokus pada penggunaan komersial: Adobe secara khusus menyasarkan Firefly kepada pengguna komersial, menawarkan ciri seperti pelesenan kandungan dan perlindungan hak cipta.
  • Dataset latihan yang besar: Firefly dilatih pada dataset besar imej Adobe Stock, yang memastikan output berkualiti tinggi dan mengurangkan risiko menjana bahan berhak cipta.

Walau bagaimanapun, Firefly juga mempunyai batasannya:

  • Keupayaan penjanaan video terhad: Walaupun Firefly sangat baik untuk menjana imej dan tekstur, keupayaan penjanaan videonya pada masa ini kurang maju daripada Sora.
  • Harga berasaskan langganan: Akses kepada Firefly memerlukan langganan kepada Adobe Creative Cloud, yang boleh menjadi mahal bagi sesetengah pengguna.
  • Kebergantungan pada ekosistem Adobe: Pengguna yang belum biasa dengan alatan kreatif Adobe mungkin mendapati sukar untuk menyepadukan Firefly ke dalam aliran kerja mereka.

Platform Baru Muncul Lain

Selain Sora dan Firefly, beberapa platform penjanaan video AI lain muncul, masing-masing dengan ciri dan keupayaan uniknya yang tersendiri. Platform ini termasuk:

  • RunwayML: RunwayML menawarkan suite alatan AI untuk profesional kreatif, termasuk penjanaan video, penyuntingan imej dan pemindahan gaya.
  • Synthesia: Synthesia memfokuskan pada penciptaan avatar yang dijana AI dan penyampai maya untuk latihan korporat dan video pemasaran.
  • Pictory: Pictory pakar dalam mengubah siaran dan artikel blog menjadi video menarik untuk media sosial.

Masa Depan Penjanaan Video AI

Bidang penjanaan video AI berkembang pesat, dan berkemungkinan kita akan melihat kemajuan ketara pada tahun-tahun akan datang. Beberapa potensi trend masa depan termasuk:

  • Resolusi dan kualiti yang lebih tinggi: Platform penjanaan video AI akan terus meningkatkan resolusi dan kesetiaan visual output mereka, akhirnya mencapai titik di mana sukar untuk membezakan video yang dijana AI daripada video yang dicipta manusia.
  • Pergerakan dan fizik yang lebih realistik: AI akan menjadi lebih baik dalam mensimulasikan pergerakan dan fizik yang realistik, menjadikan video yang dijana AI lebih boleh dipercayai dan mengasyikkan.
  • Kawalan dan penyesuaian yang dipertingkatkan: Pengguna akan mempunyai lebih banyak kawalan ke atas proses kreatif, dengan keupayaan untuk menentukan butiran seperti sudut kamera, pencahayaan dan emosi watak.
  • Penyepaduan dengan teknologi AI lain: Penjanaan video AI akan disepadukan dengan teknologi AI lain, seperti pemprosesan bahasa semula jadi dan penglihatan komputer, membolehkan aplikasi baharu dan inovatif.
  • Demokratisasi penciptaan video: Penjanaan video AI akan menjadikannya lebih mudah dan lebih berpatutan bagi sesiapa sahaja untuk mencipta video berkualiti tinggi, tanpa mengira kemahiran teknikal atau bajet mereka.

Walaupun Veo 2 Google mungkin bukan platform penjanaan video AI yang paling mengagumkan di pasaran hari ini, ia mewakili langkah penting ke hadapan dalam pendemokrasian teknologi AI. Memandangkan bidang ini terus berkembang, berkemungkinan kita akan melihat alatan yang lebih berkuasa dan mudah diakses muncul, memperkasakan pencipta dari semua jenis untuk menghidupkan visi mereka.