阿里巴巴通义实验室推出Wan2.1-FLF2V-14B:140亿参数的首尾帧到视频生成大模型

视频模型4周前发布 小马良
149 0

阿里巴巴通义实验室近日开源了Wan2.1系列的首款大模型——Wan2.1-FLF2V-14B。这是一款专为首尾帧到视频生成设计的140亿参数大模型,旨在为数字艺术家提供前所未有的效率和创作灵活性。

阿里巴巴通义实验室推出Wan2.1-FLF2V-14B:140亿参数的首尾帧到视频生成大模型

核心优势

  • 数据驱动训练:依托海量数据训练,模型能够精准理解和生成高质量的视频内容。
  • 带首尾帧条件控制的DiT架构

    • 完美复现参考视觉效果:根据输入的首尾帧,生成与参考视觉效果高度一致的视频内容。
    • 精确遵循指令:支持灵活的指令输入,确保生成的视频完全符合用户需求。
    • 平滑过渡+遵循现实世界物理规律:生成的视频不仅过渡自然,还严格遵循现实世界的物理规律,避免出现不自然的跳跃或违和感。
    • 电影品质的720P输出:支持720P高清视频输出,满足电影级制作需求。

相关:

阿里巴巴通义实验室开源视频生成模型 Wan2.1

ComfyUI 宣布已原生支持阿里开源视频生成模型Wan2.1

阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列

© 版权声明

相关文章

暂无评论

none
暂无评论...