Google探索AI革新游戏互动潜力

Google 近期公布了其关于大型语言模型 (LLMs) 如何显著改变游戏内互动前景的愿景,在年度 Game Developers Conference (GDC) 上推出了专为游戏工作室设计的新 AI 模型和开发工具。 这一举措标志着游戏发展史上的一个关键时刻,预示着将前所未有的真实感、个性化和参与度注入到虚拟世界中。

揭秘 Gemma Journey:一窥游戏未来

在一篇详细的博客文章中,Google 全面概述了其开创性的公告,重点介绍了 “Gemma Journey”,这是一个精心制作的交互式演示,旨在展示 LLM 可以无缝集成到游戏中的多种方式。 该演示有力地证明了 AI 的变革潜力,让人切实地看到了游戏的未来。

Gemma 3 是 Google 开放语言模型系列中的最新成员,专为在各种设备(包括智能手机、笔记本电脑和工作站)上实现最佳性能而设计。 这种多功能性确保开发人员可以利用 AI 的力量,而无需考虑平台限制。 Gemma 3 的独特之处在于它能够处理多模态输入,包括文本、图像和视频,从而实现更具沉浸感和动态性的游戏体验。 此外,其扩展的上下文窗口允许处理更长的对话和复杂的游戏序列,为故事讲述和角色发展开辟了新的可能性。

利用函数调用赋能开发者

函数调用是一项改变游戏规则的功能,它使开发人员能够利用 Gemma 3 创建能够直接与游戏机制交互的 AI 系统。 这种能力开启了一个充满可能性的世界,从触发游戏内动作到动态适应玩家行为。 Gemma 3 模型的大小范围从 10 亿到 270 亿个参数,支持 140 多种语言,使全球开发人员和玩家社区都可以访问它们。

为了促进 Gemma 无缝集成到游戏中,Google 推出了一个基于 Gemma.cpp 的 Unity 插件,Gemma.cpp 是一个为 CPU 性能精心优化的 C++ 推理引擎。 这种战略方法确保 GPU 资源仍然可用于渲染精美的视觉效果,从而保持游戏的视觉逼真度。 该插件的开源性质旨在简化将 Gemma 3 融入 Unity 项目的过程,从而降低了渴望探索 AI 潜力的开发人员的入门门槛。

通过 “Gemma Journey” 实现沉浸式互动

在 “Gemma Journey” 演示游戏中,玩家有机会与 Android NPC 互动,这些 NPC 的个性和行为完全由提示控制。 这种创新方法消除了手动脚本编写的需要,从而可以实时创建动态、多语言的对话。 一个突出的例子是 “Chef Gus”,他是一位冲动的烹饪艺术家,对批评反应强烈,并用令人费解的谜语挑战玩家。

Gus 的背景故事、语气和词汇都经过精心定义在提示中,该模型会自动实时生成动态的多语言对话。 Google 认为,这展示了有针对性的提示创建复杂角色行为的潜力。 无需手动脚本编写即可创建如此复杂的角色的能力代表了游戏开发中的一种范式转变,使开发人员可以专注于游戏设计的其他方面。

协作增强现有游戏

Google 正在与印度游戏开发商 Nazara Technologies 积极合作,将 Gemma.cpp 集成到 “AnimalJam” 等现有游戏中。 主要目标是使游戏中的角色能够以更动态和与上下文相关的方式响应玩家。 这一举措旨在探索如何将生成式 AI 无缝集成到已建立的游戏中,从而在不中断现有游戏机制的情况下增强整体玩家体验。

Gemini 2.0:适用于大型游戏的基于云的解决方案

对于需要强大云基础设施的更广泛的游戏,Google 正在利用 Gemini 2.0 的强大功能。 在 “Home Run: Gemini Coach Edition” 演示应用程序中,由 Gemini 2.0 Flash 提供支持的 AI 代理承担了移动棒球游戏中的虚拟教练的角色,提供对游戏玩法的实时分析并提供量身定制的建议。 此应用程序在 Google Cloud 上运行,并展示了生成式 AI 提供交互式指导和辅助的潜力。

Google 采用 Vertex AI 进行模型执行,Agones 用于基于 Kubernetes 的游戏服务器托管,而 Google Kubernetes Engine (GKE) 用于并行编排游戏环境和 AI 系统。 这种强大的基础设施旨在扩展和支持实时服务和多人游戏,从而确保为玩家提供无缝且身临其境的体验。 这些先进技术的利用凸显了 Google 致力于为开发人员提供创建尖端游戏体验所需的工具。

Google AI 举措的主要收获

  • Google 正在展示 AI 模型和工具如何显著增强游戏开发,为动态游戏世界和 AI 驱动的角色提供本地推理、多模态输入和基于云的部署解决方案。
  • 新型 Gemma 3 模型可直接在设备上无缝处理文本、图像和视频,支持 140 多种语言,并且可以通过 Unity 插件轻松集成到游戏中,以培养更具交互性的角色。
  • 演示游戏 “Gemma Journey” 生动地说明了如何使用提示来制作复杂的 NPC 行为,从而最大限度地减少了对大量手动脚本编写的需求。

深入研究 Gemma 及其功能

Gemma 的架构旨在高效且适应性强,使其能够部署在各种设备和平台上。 这对于需要支持各种硬件配置上玩家的游戏开发人员至关重要。 该模型理解和响应多种语言的能力也为创建全球受众都可以访问的游戏开辟了可能性。

Gemma 中函数调用的使用尤其值得注意。 此功能使 AI 模型不仅可以理解玩家的输入,还可以在游戏世界中采取行动。 例如,玩家可能会向 NPC 询问方向,然后 AI 可以触发游戏显示地图或引导玩家到所需位置。 这种交互级别可以显着增强玩家的沉浸感和代理感。

Unity 插件的意义

Unity 插件是 Google 使游戏开发人员可以访问 AI 的战略的关键组成部分。 Unity 是世界上最流行的游戏引擎之一,简化 Gemma 集成的插件可以显着降低对 AI 新手的开发人员的入门门槛。 该插件是开源的这一事实也是一个主要的优势,因为它允许开发人员自定义该插件以满足他们的特定需求。

探索生成式 AI 在游戏开发中的潜力

“Gemma Journey” 演示让人初步看到了生成式 AI 在游戏开发中的潜力。 仅使用提示创建复杂的 NPC 行为可以节省开发人员无数的脚本编写时间,并让他们专注于游戏设计的其他方面。 这种技术还为创建更具动态性和不可预测性的游戏世界开辟了可能性,在这些游戏中,NPC 可以以意想不到的和引人入胜的方式对玩家的行为做出反应。

AI 驱动游戏的未来

Google 的举措代表了 AI 驱动游戏发展史上的一个重要进步。 通过为开发人员提供强大的工具和资源,Google 正在帮助为游戏比以往任何时候都更具沉浸感、吸引力和个性化的未来铺平道路。 随着 AI 技术的不断发展,我们可以期待看到 AI 在游戏行业中出现更多创新应用。

超越 NPC:扩展 AI 在游戏设计中的作用

AI 的影响远不止于创建更逼真和引人入胜的 NPC。 AI 还可以用于增强游戏设计的其他方面,例如:

  • 程序化内容生成: AI 可用于生成庞大而多样的游戏世界,从而节省开发人员的时间和精力。 例如,AI 可用于创建景观、建筑物甚至整个城市。
  • 游戏平衡: AI 可用于分析游戏数据并确定游戏过于困难或过于容易的区域。 然后,此信息可用于调整游戏的难度,以创建更平衡和愉快的体验。
  • 自适应难度: AI 可用于根据玩家的技能水平动态调整游戏的难度。 这确保了游戏始终具有挑战性,但永远不会令人沮丧。
  • AI 驱动的对手: AI 可用于创建更智能和更具挑战性的对手。 这些对手可以从玩家的行为中学习并相应地调整他们的策略。

解决 AI 在游戏中的挑战

虽然 AI 在游戏中的潜力巨大,但也需要解决一些挑战。 这些挑战包括:

  • 计算成本: AI 模型的运行成本可能很高,这对于需要在低功耗设备上运行的游戏来说可能是一个问题。
  • 可解释性: 很难理解为什么 AI 模型会做出特定的决定。 这对于需要调试和完善其 AI 系统的游戏开发人员来说可能是一个问题。
  • 道德考量: AI 可用于创建具有操纵性或剥削性的游戏。 游戏开发人员必须考虑其 AI 系统的道德影响。
  • 偏差: 如果 AI 模型是在有偏差的数据上训练的,它将产生有偏差的结果。

合作的重要性

AI 成功集成到游戏中需要 AI 研究人员、游戏开发人员和其他利益相关者之间的合作。 通过共同努力,我们可以克服挑战并充分发挥 AI 的潜力,从而改变游戏行业。

AI 在游戏中的民主化

Google 举措最令人兴奋的方面之一是 AI 在游戏中实现民主化的潜力。 通过提供开源工具和资源,Google 使独立开发人员和小型工作室更容易将 AI 融入到他们的游戏中。 这可能会引发一波创新和实验浪潮,因为开发人员会探索使用 AI 的新颖和创造性方式。

这些工具提供的可访问性还具有将新一代开发人员引入 AI 的能力。 通过看到 AI 在游戏开发中的切实影响,越来越多的人将受到启发,去学习和为这个快速发展的领域做出贡献。

游戏内互动不断变化的格局

在 Gemma 和 Gemini 等高级 AI 模型的推动下,游戏内互动正准备迎来一场戏剧性的变革。 这些模型不仅仅是为了创建更逼真的角色; 它们是为了打造动态、响应式和个性化的游戏体验,以实时适应玩家。 随着 AI 不断成熟,它无疑将在塑造游戏的未来中发挥越来越重要的作用,为创造力、沉浸感和玩家参与度开辟新的可能性。