Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

视频模型3个月前发布 小马良
157 0

Pusa Wan2.2 V1.0 将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构,该架构采用 MoE DiT 设计,包含独立的噪声和高噪声模型。这种架构提供了增强的质量控制和生成能力,同时保持了革命性的矢量化时间步适应 (VTA) 方法。

一个模型支持各种任务,所有任务均支持 4 步推理,使用 LightX2V:图像到视频、起始-结束帧、视频补全、视频扩展、文本到视频、视频过渡等...

基于 Mochi 微调的开源视频模型Pusa:低成本、高性能的开源视频生成模型

PUSA V1.0:以500 美元成本超越 WAN-I2V-14B 的高效视频生成模型

示例 1:4 步图像到视频

Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

示例 2:4 步视频扩展

Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

示例 3:4 步起始-结束帧

Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

示例 4:4 步文本到视频

Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构
© 版权声明

相关文章

暂无评论

none
暂无评论...