Runway 推出的全新视频生成模型 Gen-4.5(曾用代号 Whisper Thunder/David),凭借在预训练数据效率、后训练技术上的重大突破,以 1247 Elo 分登顶 Artificial Analysis Text to Video 全球排行榜,超越所有同类 AI 视频模型,为视频生成的运动质量、提示词遵守度和视觉保真度树立了全新行业标准。
作为 Runway 两年技术积累的巅峰之作,Gen-4.5 不仅实现了物理级的视觉精准度,更支持复杂序列化指令执行,搭配英伟达 GPU 全流程优化,彻底重构了 AI 视频创作的能力边界。

核心定位:世界建模驱动的视频生成基础模型
Gen-4.5 并非简单迭代,而是 Runway 打造的“世界建模新基础模型”——通过对现实世界物理规律、场景逻辑的深度学习,实现从“生成视频”到“还原/创造可信世界”的跨越。其核心定位可概括为:
- 行业性能标杆:以 1247 Elo 分刷新全球榜单,成为当前综合能力最强的 AI 视频模型;
- 高可控创作工具:支持复杂指令精细化执行,满足专业创作者对“精准还原创意”的需求;
- 硬件协同优化典范:与英伟达深度合作,从研发到推理全流程基于英伟达 GPU 打造,实现性能与质量的双重突破。

核心技术亮点:四大突破重构视频生成能力
1. 预训练与后训练技术革新,效率与效果双提升
Gen-4.5 在模型训练层面实现关键突破:
- 预训练数据效率优化:通过创新的数据筛选与处理机制,在更少数据量下实现更优的世界建模能力,大幅降低训练成本;
- 后训练技术升级:针对视频生成的核心痛点(如运动连贯性、视觉保真度)进行专项优化,让模型在实际应用中表现更稳定、更可靠。
这些技术革新直接推动 Gen-4.5 以 1247 Elo 分登顶全球榜单,成为行业性能新标杆。
2. 复杂序列化指令理解,创作可控性拉满
区别于传统视频模型仅能处理简单文本提示,Gen-4.5 擅长解析和执行复杂、多维度的创作指令,真正实现“所想即所得”:
- 核心能力:在单个提示中同时支持详细相机编舞(如“缓慢推近+环绕拍摄”)、复杂场景构图(如“三分法构图,主体居左,背景虚化”)、事件精确时机(如“第3秒物体开始移动,第5秒达到峰值”)、微妙氛围变化(如“从暖色调渐变到冷色调,营造静谧感”);
- 适用场景:专业影视前期创意可视化、广告片分镜生成、短视频精细化创作等,无需后期调整即可实现复杂创意表达。
3. 物理级视觉保真度,还原真实世界质感
Gen-4.5 实现了前所未有的物理准确性和视觉精确度,让生成的视频更贴近现实:
- 物体运动真实:物体移动时带有符合物理规律的重量感和动量,避免“漂浮感”“僵硬感”;
- 表面材质逼真:金属的反光、布料的褶皱、液体的流动等表面表现与现实世界高度一致;
- 物理规律可控:支持“遵守/忽略物理定律”双向调节,既可以生成符合现实逻辑的视频,也能创造超现实的创意效果(如“物体反重力漂浮”)。
4. 英伟达GPU全流程赋能,性能与质量双保障
Gen-4.5 是行业首个从初始研发、预训练、后训练到推理全流程基于英伟达 GPU 开发的视频模型:
- 硬件适配:深度优化英伟达 Hopper 和 Blackwell 系列 GPU,充分发挥硬件算力优势;
- 性能表现:在保证超高视觉质量的前提下,大幅提升推理速度,降低创作等待成本;
- 技术协同:借助英伟达 GPU 的算力支撑,实现大规模模型训练与复杂场景实时生成,为模型能力突破提供核心动力。

核心功能:全场景覆盖,兼容现有控制模式
Gen-4.5 不仅强化了 Text to Video 核心功能,还全面兼容 Runway 现有所有控制模式,形成完整的创作工具链:
| 功能模式 | 核心能力 | 适用场景 |
|---|---|---|
| Text to Video | 文本提示生成视频,支持复杂序列化指令 | 创意构思可视化、短视频脚本生成 |
| Image to Video | 以图像为基础扩展生成视频,保留原图风格/主体 | 静态图片动态化、产品展示视频制作 |
| Keyframes | 关键帧控制视频运动轨迹,精准调节细节 | 专业动画制作、运动路径精细化设计 |
| Video to Video | 视频风格迁移/内容修改,保留原始结构 | 视频二次创作、风格化处理 |
此外,Gen-4.5 还延续了 Runway 对“高灵活性”的追求,支持创作者根据需求自定义物理规律、氛围色调等参数,实现从创意到成品的全流程可控。
产品迭代与行业影响:两年引领行业进化
Runway 自两年前推出全球首个公开可用的视频生成模型 Gen-1 以来,始终引领 AI 视频生成的技术方向:
- Gen-1:开创公开可用的 AI 视频生成品类,开启创意表达新形式;
- 迭代历程:从基础模型优化到控制模式拓展,逐步提升模型的可控性、保真度;
- Gen-4.5:凝聚两年技术积累,实现从“能用”到“好用、专业”的跨越,成为世界建模的新基础模型。
此次 Gen-4.5 的发布,不仅刷新了行业性能纪录,更推动 AI 视频生成从“创意辅助工具”向“专业创作主力”转变,有望在影视制作、广告营销、短视频创作、游戏开发等多个领域引发效率革命。
局限性与未来方向
尽管 Gen-4.5 实现了巨大突破,但仍存在行业共性问题:
- 现有局限:因果推理失败(如事件逻辑前后矛盾)、物体持久性问题(如物体莫名消失/出现);
- 未来规划:Runway 明确表示,将针对这些失败模式持续优化,进一步推进世界建模能力,让生成的视频更具逻辑连贯性和场景可信度。















