Runway推出全新视频生成模型Gen-4.5：1247 Elo分刷新视频生成纪录，物理级运动保真+复杂指令精准执行

201 0

Runway 推出的全新视频生成模型 Gen-4.5（曾用代号 Whisper Thunder/David），凭借在预训练数据效率、后训练技术上的重大突破，以 1247 Elo 分登顶 Artificial Analysis Text to Video 全球排行榜，超越所有同类 AI 视频模型，为视频生成的运动质量、提示词遵守度和视觉保真度树立了全新行业标准。

作为 Runway 两年技术积累的巅峰之作，Gen-4.5 不仅实现了物理级的视觉精准度，更支持复杂序列化指令执行，搭配英伟达 GPU 全流程优化，彻底重构了 AI 视频创作的能力边界。

Runway推出全新视频生成模型Gen-4.5：1247 Elo分刷新视频生成纪录，物理级运动保真+复杂指令精准执行

核心定位：世界建模驱动的视频生成基础模型

Gen-4.5 并非简单迭代，而是 Runway 打造的“世界建模新基础模型”——通过对现实世界物理规律、场景逻辑的深度学习，实现从“生成视频”到“还原/创造可信世界”的跨越。其核心定位可概括为：

行业性能标杆：以 1247 Elo 分刷新全球榜单，成为当前综合能力最强的 AI 视频模型；
高可控创作工具：支持复杂指令精细化执行，满足专业创作者对“精准还原创意”的需求；
硬件协同优化典范：与英伟达深度合作，从研发到推理全流程基于英伟达 GPU 打造，实现性能与质量的双重突破。

核心技术亮点：四大突破重构视频生成能力

1. 预训练与后训练技术革新，效率与效果双提升

Gen-4.5 在模型训练层面实现关键突破：

预训练数据效率优化：通过创新的数据筛选与处理机制，在更少数据量下实现更优的世界建模能力，大幅降低训练成本；
后训练技术升级：针对视频生成的核心痛点（如运动连贯性、视觉保真度）进行专项优化，让模型在实际应用中表现更稳定、更可靠。
这些技术革新直接推动 Gen-4.5 以 1247 Elo 分登顶全球榜单，成为行业性能新标杆。

2. 复杂序列化指令理解，创作可控性拉满

区别于传统视频模型仅能处理简单文本提示，Gen-4.5 擅长解析和执行复杂、多维度的创作指令，真正实现“所想即所得”：

核心能力：在单个提示中同时支持详细相机编舞（如“缓慢推近+环绕拍摄”）、复杂场景构图（如“三分法构图，主体居左，背景虚化”）、事件精确时机（如“第3秒物体开始移动，第5秒达到峰值”）、微妙氛围变化（如“从暖色调渐变到冷色调，营造静谧感”）；
适用场景：专业影视前期创意可视化、广告片分镜生成、短视频精细化创作等，无需后期调整即可实现复杂创意表达。

3. 物理级视觉保真度，还原真实世界质感

Gen-4.5 实现了前所未有的物理准确性和视觉精确度，让生成的视频更贴近现实：

物体运动真实：物体移动时带有符合物理规律的重量感和动量，避免“漂浮感”“僵硬感”；
表面材质逼真：金属的反光、布料的褶皱、液体的流动等表面表现与现实世界高度一致；
物理规律可控：支持“遵守/忽略物理定律”双向调节，既可以生成符合现实逻辑的视频，也能创造超现实的创意效果（如“物体反重力漂浮”）。

4. 英伟达GPU全流程赋能，性能与质量双保障

Gen-4.5 是行业首个从初始研发、预训练、后训练到推理全流程基于英伟达 GPU 开发的视频模型：

硬件适配：深度优化英伟达 Hopper 和 Blackwell 系列 GPU，充分发挥硬件算力优势；
性能表现：在保证超高视觉质量的前提下，大幅提升推理速度，降低创作等待成本；
技术协同：借助英伟达 GPU 的算力支撑，实现大规模模型训练与复杂场景实时生成，为模型能力突破提供核心动力。

核心功能：全场景覆盖，兼容现有控制模式

Gen-4.5 不仅强化了 Text to Video 核心功能，还全面兼容 Runway 现有所有控制模式，形成完整的创作工具链：

功能模式	核心能力	适用场景
Text to Video	文本提示生成视频，支持复杂序列化指令	创意构思可视化、短视频脚本生成
Image to Video	以图像为基础扩展生成视频，保留原图风格/主体	静态图片动态化、产品展示视频制作
Keyframes	关键帧控制视频运动轨迹，精准调节细节	专业动画制作、运动路径精细化设计
Video to Video	视频风格迁移/内容修改，保留原始结构	视频二次创作、风格化处理