阿里巴巴通义实验室推出Wan2.1-FLF2V-14B：140亿参数的首尾帧到视频生成大模型

视频模型12个月前发布小马良

405 0

阿里巴巴通义实验室近日开源了Wan2.1系列的首款大模型——Wan2.1-FLF2V-14B。这是一款专为首尾帧到视频生成设计的140亿参数大模型，旨在为数字艺术家提供前所未有的效率和创作灵活性。

模型：https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P

核心优势

数据驱动训练：依托海量数据训练，模型能够精准理解和生成高质量的视频内容。
带首尾帧条件控制的DiT架构：
- 完美复现参考视觉效果：根据输入的首尾帧，生成与参考视觉效果高度一致的视频内容。
- 精确遵循指令：支持灵活的指令输入，确保生成的视频完全符合用户需求。
- 平滑过渡+遵循现实世界物理规律：生成的视频不仅过渡自然，还严格遵循现实世界的物理规律，避免出现不自然的跳跃或违和感。
- 电影品质的720P输出：支持720P高清视频输出，满足电影级制作需求。

相关：

阿里巴巴通义实验室开源视频生成模型 Wan2.1
ComfyUI 宣布已原生支持阿里开源视频生成模型Wan2.1
阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列

视频模型 # Wan2.1-FLF2V-14B # 视频生成大模型 # 阿里巴巴

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

昆仑万维推出SkyReels-V2：首个基于扩散强制框架的无限长度电影生成模型

昆仑万维推出SkyReels-V2：首个基于扩散强制框架的无限长度电影生成模型

视频模型 # SkyReels-V2 # 昆仑万维 # 视频生成模型

11个月前

04480

通义灵码全新升级：支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

通义灵码全新升级：支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

早报 # AI编程 # 通义灵码 # 阿里巴巴

1年前

02410

Rhymes AI开源图生视频模型Allegro-TI2V：根据用户提供的提示和图像生成视频

Rhymes AI开源图生视频模型Allegro-TI2V：根据用户提供的提示和图像生成视频

视频模型 # Allegro-TI2V # Rhymes AI

1年前

03040

UniVideo：滑铁卢大学与快手推出统一视频生成与编辑模型，支持理解、生成、编辑一体化

UniVideo：滑铁卢大学与快手推出统一视频生成与编辑模型，支持理解、生成、编辑一体化

视频模型 # UniVideo # 视频生成 # 视频编辑

3个月前

0240

暂无评论

none

暂无评论...