Pusa Wan2.2 V1.0 将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构,该架构采用 MoE DiT 设计,包含独立的噪声和高噪声模型。这种架构提供了增强的质量控制和生成能力,同时保持了革命性的矢量化时间步适应 (VTA) 方法。
一个模型支持各种任务,所有任务均支持 4 步推理,使用 LightX2V:图像到视频、起始-结束帧、视频补全、视频扩展、文本到视频、视频过渡等...
示例 1:4 步图像到视频

示例 2:4 步视频扩展

示例 3:4 步起始-结束帧

示例 4:4 步文本到视频

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















