谷歌Gemini AI视频登场,初期反响平平

谷歌正式进军人工智能视频领域,Gemini Advanced订阅用户现在可以使用其 Veo 2 AI 视频模型。

这标志着谷歌 AI 视频技术的首次公开亮相,尽管最初是付费的。

渴望体验 Veo 2 的用户可以享受 Google One AI 高级订阅的免费试用期一个月,其中包括访问 Gemini Advanced。试用期结束后,订阅价格为每月 20 美元。 Veo 2 也已集成到 Google Labs 的新型 AI 动画项目中。谷歌计划未来将 Veo 2 的可用性扩展到免费用户。

AI 视频的出现代表了生成式 AI 的最新发展。谷歌广泛发布 Veo 2 之前,OpenAI(Sora)和 Adobe(Firefly)也采取了类似的举措。 AI 创意服务领域正变得越来越具有竞争力,各大科技公司纷纷推出自己的 AI 视频模型。谷歌的加入标志着 AI 视频服务产品日益增长的势头。

谷歌的 Gemini 隐私政策规定,它可能会收集用户互动中的数据,包括聊天和文件,建议用户不要共享机密信息。通过同意谷歌的生成式 AI 政策,用户同意遵守该公司可接受的使用指南,旨在防止创建有害或非法内容。

用户可以通过 Gemini Web 版或移动应用生成短小的 AI 剪辑,方法是从 Gemini Advanced 界面中的模型选项中选择 Veo 2。视频通常在一两分钟内生成。

这些 AI 生成的剪辑时长限制为 8 秒,分辨率为 720p,没有音频。 Gemini 会自动以 16:9 的水平格式渲染视频,即使在提示中指定了其他尺寸,也没有明显的选项可供选择。此外,用户无法上传图像或样式参考,因此需要精通 AI 提示工程才能获得所需的视频效果。

用户每月可以生成的视频数量存在限制,尽管这些积分的确切衡量标准仍未定义。谷歌表示,当用户接近其限制时,他们将在 Gemini 中收到警告。

谷歌的 SynthID 水印会自动嵌入到 Veo 2 视频中。这些难以察觉的水印用于识别完全由 AI 生成的内容。谷歌还将其用于使用 Imagen 3 文本到图像模型生成的图像。

对 Veo 2 的初步评估表明,这些视频令人满意,但并不出色。 Gemini 展示了对提示的值得称赞的遵守,准确地生成内容,几乎没有错误或不一致之处。然而,像 Sora 和 Firefly 这样的平台允许创建分辨率更高的 AI 视频,例如 1080p,并提供更广泛的自定义选项,这对于最大限度地减少后期制作编辑至关重要。虽然谷歌无疑有 Veo 升级计划,但 Veo 2 目前是一种有趣的实验工具,但不太可能成为创作者日常工作流程的必需品。

深入了解 Gemini 的 Veo 2:全面概述

虽然与 OpenAI 的 Sora 和 Adobe 的 Firefly 等竞争对手相比,谷歌 Veo 2 的最初发布可能显得平淡无奇,但深入研究其功能、局限性和潜力的细节至关重要。对于考虑将 Veo 2 集成到其创意工作流程中的任何人来说,理解这些细微差别至关重要。

分辨率和输出质量

Veo 2 最直接的限制之一是其最大输出分辨率为 720p。在这个 4K 视频越来越普及,甚至移动设备都能够以高清录制视频的时代,这种限制大大影响了生成内容的感知质量。虽然 720p 可能足以满足快速社交媒体帖子或内部通信的需求,但它对于需要高视觉保真度的专业应用程序或项目来说还远远不够。提供 1080p 输出的 Sora 等竞争对手立即在这方面占据优势。

音频缺失

Veo 2 生成的视频中缺少音频是另一个值得注意的缺点。声音是视频叙事的重要元素,它的缺失需要额外的后期制作工作来添加音乐、音效或对话。这不仅增加了创建成品所需的时间和精力,还限制了 AI 生成过程本身的创造性可能性。希望快速创建具有集成音频的引人入胜视频的用户会发现 Veo 2 在这方面有所欠缺。

有限的自定义选项

Veo 2 有限的自定义选项进一步限制了其可用性。无法指定标准 16:9 格式之外的宽高比,再加上不支持图像或样式参考,使得根据特定创意愿景定制输出变得具有挑战性。这迫使用户严重依赖文本提示,而文本提示很难进行微调以获得精确的结果。相比之下,允许视觉输入和对样式和构图进行更精细控制的平台提供了显着的优势。

提示工程挑战

鉴于自定义的限制,有效的提示工程在使用 Veo 2 时变得至关重要。用户必须学习制定详细而精确的提示,以引导 AI 朝着期望的结果前进。这需要深入了解 AI 如何解释语言并将其转化为视觉内容。虽然实验可以帮助用户培养这种技能,但学习曲线可能很陡峭,即使是经验丰富的提示工程师也可能难以获得一致的结果。提示创建过程中缺少视觉反馈进一步使事情复杂化。

每月生成限制

未公开的每月生成限制给 Veo 2 的可用性增加了另一层不确定性。由于没有关于如何计算这些限制的明确信息,用户可能会犹豫是否将 Veo 2 完全集成到他们的工作流程中,担心他们在关键时刻会耗尽积分。这种缺乏透明度对于依赖可预测地访问 AI 工具的专业用户来说尤其令人担忧。

SynthID 水印的承诺

尽管存在局限性,Veo 2 确实提供了一个显着的优势:包含 SynthID 水印。这些隐形水印有助于区分 AI 生成的内容与人类创建的内容,这在打击虚假信息和深度伪造方面变得越来越重要。虽然 SynthID 在跨不同平台和编辑过程中检测 AI 生成视频的有效性还有待观察,但它包含在内表明了谷歌对负责任的 AI 开发的承诺。

未来的增长潜力

重要的是要记住,Veo 2 仍处于开发的早期阶段。谷歌拥有迭代改进其 AI 产品的历史,Veo 2 可能会在未来收到重大更新和增强。潜在的改进可能包括:

  • 提高输出分辨率(1080p,4K)
  • 音频集成
  • 更广泛的自定义选项(宽高比、样式参考)
  • 改进的提示工程工具
  • 更清晰的生成限制信息
  • 增强的 SynthID 水印技术

Veo 2 在更广泛的 AI 视频生成背景下

要真正了解 Veo 2 在市场中的地位,将其与其他领先的 AI 视频生成平台进行比较至关重要。虽然每个平台都有自己的优点和缺点,但了解这些差异可以帮助用户就哪种工具最适合他们的需求做出明智的决定。

OpenAI 的 Sora

OpenAI 的 Sora 可以说是目前可用的最受炒作的 AI 视频生成平台。其主要优势包括:

  • 高质量输出:Sora 能够生成分辨率为 1080p 的视频,具有令人印象深刻的视觉保真度。
  • 逼真的运动:Sora 擅长创建逼真且自然的运动,这对于创建可信的场景至关重要。
  • 复杂的场景生成:Sora 可以生成具有复杂细节以及对象和角色之间复杂交互的视频。
  • 文本到视频和图像到视频:Sora 支持文本和图像提示,为用户提供高度的灵活性。

然而,Sora 也有其局限性:

  • 可用性有限:Sora 目前仅适用于少数研究人员和艺术家。
  • 高计算成本:使用 Sora 生成视频需要大量的计算资源,这可能会导致未来较高的使用成本。
  • 潜在的滥用:创建高度逼真的 AI 生成视频的能力引发了人们对潜在滥用的担忧,例如创建深度伪造。

Adobe 的 Firefly

Adobe 的 Firefly 是 AI 视频生成领域的另一大参与者。其主要优势包括:

  • 与 Adobe Creative Suite 集成:Firefly 与 Adobe 流行的创意工具(如 Photoshop 和 Premiere Pro)无缝集成,使用户可以轻松地将 AI 生成的内容集成到他们现有的工作流程中。
  • 专注于商业用途:Adobe 专门针对商业用户推出 Firefly,提供内容许可和版权保护等功能。
  • 大型训练数据集:Firefly 在 Adobe Stock 图像的大型数据集上进行训练,这确保了高质量的输出并降低了生成受版权保护材料的风险。

然而,Firefly 也有其局限性:

  • 有限的视频生成功能:虽然 Firefly 非常适合生成图像和纹理,但其视频生成功能目前不如 Sora 等平台先进。
  • 基于订阅的定价:访问 Firefly 需要订阅 Adobe Creative Cloud,这对某些用户来说可能很昂贵。
  • 依赖 Adobe 生态系统:不熟悉 Adobe 创意工具的用户可能会发现很难将 Firefly 集成到他们的工作流程中。

其他新兴平台

除了 Sora 和 Firefly 之外,还有许多其他 AI 视频生成平台正在涌现,每个平台都有其独特的功能和功能。这些平台包括:

  • RunwayML:RunwayML 为创意专业人士提供一套 AI 工具,包括视频生成、图像编辑和风格迁移。
  • Synthesia:Synthesia 专注于为企业培训和营销视频创建 AI 生成的化身和虚拟演示者。
  • Pictory:Pictory 专门将博客文章和文章转化为引人入胜的社交媒体视频。

AI 视频生成的未来

AI 视频生成领域正在迅速发展,我们可能会在未来几年看到重大进展。一些潜在的未来趋势包括:

  • 更高的分辨率和质量:AI 视频生成平台将继续提高其输出的分辨率和视觉保真度,最终达到难以区分 AI 生成视频与人类创建视频的程度。
  • 更逼真的运动和物理:AI 将变得更擅长模拟逼真的运动和物理,使 AI 生成的视频更可信和身临其境。
  • 改进的控制和自定义:用户将对创作过程拥有更多的控制权,能够指定诸如摄像机角度、光照和角色情感之类的细节。
  • 与其他 AI 技术集成:AI 视频生成将与其他 AI 技术(如自然语言处理和计算机视觉)集成,从而实现新的和创新的应用。
  • 视频创作的民主化:AI 视频生成将使任何人都可以更轻松、更经济地创建高质量的视频,无论他们的技术技能或预算如何。

虽然谷歌的 Veo 2 可能不是当今市场上最令人印象深刻的 AI 视频生成平台,但它代表着 AI 技术民主化的重要一步。随着该领域的不断发展,我们可能会看到更强大、更易于访问的工具出现,从而使各种创作者都能将他们的愿景变为现实。