Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

早报6天前发布 小马良
21 0

AI 初创公司 Runway 于周一正式发布其新一代生成式 AI 模型 Gen-4,声称这是有史以来最高保真度的视频生成模型之一。Gen-4 已经向 Runway 的个人付费和企业客户推出,其强大的功能为视频创作带来了前所未有的便利和高效。

Gen-4 的核心优势

Gen-4 的核心能力在于其能够生成跨场景一致的角色、地点和物体,同时维持一个“连贯的世界环境”。这意味着用户可以轻松地从不同视角和位置重新生成元素,而无需担心风格或氛围的不一致。Runway 在其博客文章中提到,Gen-4 可以利用视觉参考结合指令,创建具有统一风格、主题和地点的新图像和视频,所有这些操作都不需要微调或额外训练。(来源

Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

如何使用 Gen-4

借助 Gen-4,用户可以精确地生成跨场景一致的角色、地点和物体。只需设定外观和感觉,模型将自动维持连贯的世界环境,同时保留每个画面的独特风格、氛围和电影元素。用户可以从场景中的多个视角和位置重新生成这些元素,从而实现更加丰富的创意表达。

Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

例如,要制作一个场景,用户可以提供主题的图像并描述他们想要生成的镜头构图。Gen-4 能够利用这些视觉参考和指令,生成具有逼真动态的高动态视频,并确保主题、物体和风格的一致性。

技术亮点与应用场景

Runway 表示,Gen-4 在生成具有逼真动态的高动态视频方面表现出色,具有卓越的提示遵循性和一流的世界理解能力。此外,Gen-4 还代表了视觉生成模型模拟现实世界物理能力的一个重要里程碑。这意味着用户可以通过角色的参考图像生成跨光照条件一致的角色,从而实现更加真实和自然的视频效果。

Runway 为 Gen-4 提供了广泛的应用场景,包括但不限于广告、电影制作、游戏开发和教育领域。该公司已经与一家主要好莱坞制片厂签订了协议,并拨出数百万美元用于资助使用 AI 生成视频的电影项目,这表明 Gen-4 在影视行业的巨大潜力。

市场竞争与技术背景

Runway 在视频生成领域面临着来自 OpenAI 和 Google 的激烈竞争。然而,Gen-4 的推出显示了 Runway 在技术创新和功能差异化方面的努力。该公司得到了包括 Salesforce、Google 和 Nvidia 在内的投资者的支持,这为其技术研发和市场推广提供了坚实的基础。

训练数据与知识产权

与所有视频生成模型一样,Gen-4 在大量视频示例上进行了训练,以“学习”这些视频中的模式并生成合成镜头。Runway 拒绝透露训练数据的来源,部分原因是担心会牺牲竞争优势。然而,训练细节也可能是与知识产权相关的诉讼的潜在来源。Runway 正在努力确保其技术的合法性和合规性,以避免潜在的法律问题。

© 版权声明

相关文章

暂无评论

none
暂无评论...