Runway 发布新一代视频生成模型 Gen-4，聚焦图像生成视频与世界一致性

383 0

AI 初创公司 Runway 于周一正式发布其新一代生成式 AI 模型 Gen-4，声称这是有史以来最高保真度的视频生成模型之一。Gen-4 已经向 Runway 的个人付费和企业客户推出，其强大的功能为视频创作带来了前所未有的便利和高效。

Gen-4 的核心优势

Gen-4 的核心能力在于其能够生成跨场景一致的角色、地点和物体，同时维持一个“连贯的世界环境”。这意味着用户可以轻松地从不同视角和位置重新生成元素，而无需担心风格或氛围的不一致。Runway 在其博客文章中提到，Gen-4 可以利用视觉参考结合指令，创建具有统一风格、主题和地点的新图像和视频，所有这些操作都不需要微调或额外训练。（来源）

如何使用 Gen-4

借助 Gen-4，用户可以精确地生成跨场景一致的角色、地点和物体。只需设定外观和感觉，模型将自动维持连贯的世界环境，同时保留每个画面的独特风格、氛围和电影元素。用户可以从场景中的多个视角和位置重新生成这些元素，从而实现更加丰富的创意表达。

例如，要制作一个场景，用户可以提供主题的图像并描述他们想要生成的镜头构图。Gen-4 能够利用这些视觉参考和指令，生成具有逼真动态的高动态视频，并确保主题、物体和风格的一致性。

技术亮点与应用场景

Runway 表示，Gen-4 在生成具有逼真动态的高动态视频方面表现出色，具有卓越的提示遵循性和一流的世界理解能力。此外，Gen-4 还代表了视觉生成模型模拟现实世界物理能力的一个重要里程碑。这意味着用户可以通过角色的参考图像生成跨光照条件一致的角色，从而实现更加真实和自然的视频效果。

Runway 为 Gen-4 提供了广泛的应用场景，包括但不限于广告、电影制作、游戏开发和教育领域。该公司已经与一家主要好莱坞制片厂签订了协议，并拨出数百万美元用于资助使用 AI 生成视频的电影项目，这表明 Gen-4 在影视行业的巨大潜力。

市场竞争与技术背景

Runway 在视频生成领域面临着来自 OpenAI 和 Google 的激烈竞争。然而，Gen-4 的推出显示了 Runway 在技术创新和功能差异化方面的努力。该公司得到了包括 Salesforce、Google 和 Nvidia 在内的投资者的支持，这为其技术研发和市场推广提供了坚实的基础。

训练数据与知识产权

与所有视频生成模型一样，Gen-4 在大量视频示例上进行了训练，以“学习”这些视频中的模式并生成合成镜头。Runway 拒绝透露训练数据的来源，部分原因是担心会牺牲竞争优势。然而，训练细节也可能是与知识产权相关的诉讼的潜在来源。Runway 正在努力确保其技术的合法性和合规性，以避免潜在的法律问题。