微软研究院和 Xbox 游戏工作室 Ninja Theory 合作开发了一个能够生成游戏视觉、控制器动作的视频游戏生成式 AI 模型 Muse ,号称是第一个世界与人类行动模型(WHAM),旨在革新游戏开发方式并探索经典游戏的保存与优化潜力。这一突破性技术标志着游戏行业迈向更智能、更高效的创作工具的重要一步。

Muse:生成式 AI 在游戏领域的应用
Muse 是一种首创的生成式 AI 模型,能够根据视觉效果或玩家的控制器操作生成一致且多样化的游戏环境。它不仅理解 3D 游戏世界的物理规则,还能对玩家与游戏的互动做出实时反应。
- 训练数据:Muse 基于大量来自 Xbox 游戏《嗜血边缘》(Bleeding Edge)的人类游戏数据进行训练,相当于七年的人类连续游戏时长,总计超过 10 亿张图像动作对。
- 分辨率与性能:当前版本的 Muse 能够以 300×180 像素的分辨率生成游戏视觉效果,虽然仍远低于现代 PC 游戏常见的 1080p 分辨率,但相比微软早期模型的 128×128 分辨率已有显著提升。
- 交互能力:开发者可以通过提供一张游戏截图或使用 Xbox 手柄控制角色,让 Muse 自动生成相应的后续内容。
微软游戏 AI 公司副总裁 Fatima Kardar 表示:“Muse 展示了生成式 AI 模型如何增强游戏创作者的能力,为他们提供更多可能性。”
Muse 的实际应用
1. 游戏开发辅助
Muse 并非旨在完全取代游戏创作者,而是作为一种工具来加速开发过程。例如:
- 在游戏的早期迭代阶段,开发者可以利用 Muse 快速生成视觉元素和玩法原型。
- 它可以帮助团队专注于游戏的核心创意部分,而将重复性任务交给 AI 处理。
Ninja Theory 工作室负责人 Dom Matthews 强调:“我们不打算用这项技术替代人类创造力,而是让它成为我们的工具,帮助团队更快、更容易地制作游戏。”
2. 经典游戏的保存与移植
Muse 还展示了其在经典游戏保存方面的潜力。通过学习旧游戏的数据和视频,AI 可以重新构建这些游戏,并使其适应现代硬件平台,而无需依赖原始引擎或硬件。
微软游戏 CEO Phil Spencer 表示:“这开启了巨大的机会,使经典游戏能够在任何支持运行这些模型的平台上再现。”
Muse 的技术细节
Muse 的核心技术基于 WHAM(World and Human Action Model),这是一种能够同时生成游戏视觉效果和控制器动作的模型。以下是其关键特点:
- 视觉生成:Muse 可以根据输入的游戏截图生成多个潜在的后续画面。
- 实时交互:通过 Xbox 手柄输入,Muse 能实时生成相应的游戏内容。
- 模块化设计:Muse 的架构允许开发者灵活调整其功能,以适应不同项目的需求。

Muse 的局限性与未来发展
尽管 Muse 展现了巨大的潜力,但它目前仍处于早期阶段,存在一些局限性:
- 分辨率限制:当前版本的分辨率较低,无法满足现代游戏玩家的需求。
- 实时性能:实时生成游戏画面的速度仅为 10fps,远低于商业游戏的标准。
微软计划在未来进一步优化 Muse 的性能,提高分辨率和帧率,以实现更高质量的游戏体验。
Xbox 创作者的自主权
微软明确表示,Xbox 各个工作室有权决定如何在其游戏中使用 AI 技术。Fatima Kardar 解释道:“每个游戏或项目都会有不同的解决方案,方法将基于每个团队的创意愿景和目标。”
这种灵活性确保了 AI 技术不会一刀切地应用于所有项目,而是作为增强创造力的工具,而非替代品。
对行业的意义
随着生成式 AI 技术的发展,游戏行业正面临重大变革。然而,这也引发了关于 AI 对就业市场影响的担忧。微软强调,Muse 的目标是协助而非取代人类创作者。
Phil Spencer 表示:“优秀游戏的开发始终以创作者的愿景和艺术性为基础。我们相信生成式 AI 将增强这种创造力,而不是削弱它。”