ComfyUI 原生支持 Wan2.2 Fun:首尾帧控制与多模态视频生成全面集成

工作流4个月前发布 小马良
1,670 0

ComfyUI 社区迎来重要更新!现已原生支持阿里巴巴 PAI 团队推出的 Wan2.2 Fun 系列视频生成模型,包括 Wan2.2 Fun InP 与 Wan2.2 Fun Control,并集成 LightX2V 4步 LoRA 加速模块,显著提升生成效率。

此次更新意味着用户可通过 ComfyUI 工作流模板,快速实现高精度视频生成与控制,无需手动配置复杂节点,大幅降低使用门槛。

阿里云 PAI发布 Wan2.2-Fun:扩展Wan2.2文生视频与可控视频生成的能力边界

阿里云 PAI发布 Wan2.2-Fun:扩展Wan2.2文生视频与可控视频生成的能力边界

✅ 支持首尾帧过渡生成
✅ 支持姿态、深度、边缘等多模态控制
✅ 集成 Lightning LoRA,最快提速达 4倍
✅ 所有模型基于 Apache 2.0 协议,支持商业用途

Wan2.2 Fun 是什么?

Wan2.2 Fun 是由阿里巴巴 PAI 团队开发的高性能视频生成模型系列,基于 Wan2.2 架构构建,专为创意视频生成优化。其核心优势在于:

  • 输出质量达到影视级;
  • 支持多种控制方式,实现精准创作;
  • 开源可商用,适合企业与个人开发者。

目前 ComfyUI 已集成两大核心变体:

1. Wan2.2 Fun InP:首尾帧控制生成

通过输入起始帧结束帧图像,模型自动生成中间平滑过渡的视频序列。

适用场景

  • 动画转场设计
  • 视觉叙事衔接
  • 静态图到动态视频转换

核心特性

  • 首尾帧语义连贯,避免跳跃
  • 支持 512×512、768×768、1024×1024 多分辨率输出
  • 可结合文本提示进一步引导内容演变

2. Wan2.2 Fun Control:多模态条件控制

支持多种控制信号输入,实现对视频运动路径的精细调控。

支持的控制类型

  • 🖌️ Canny:线稿轮廓控制
  • 📏 Depth:深度图引导
  • 🧍 OpenPose:人体姿态控制
  • 🔲 MLSD:直线结构检测
  • 🔄 轨迹控制:自定义运动路径

适用场景

  • 角色动画驱动
  • 产品演示视频生成
  • 虚拟场景构建

模型支持中英文提示词输入,降低语言门槛。

LightX2V 4步 LoRA:速度飞跃,低显存友好

为提升推理效率,本次集成还引入了 Wan2.2-Lightning 4步 LoRA 模块,基于 lightx2v 技术实现极简步数生成。

在 RTX 4090D(24GB)上的实测数据如下(640×640 分辨率,81帧):

模型配置显存占用首次生成时间第二次生成时间
fp8_scaled(原版)83%≈524 秒≈520 秒
+ 4步 LoRA 加速89%≈138 秒≈79 秒

⚡ 提速近 4倍,尤其适合低显存设备或需要快速迭代的创作流程。

尽管部分动态细节可能略有损失,但其速度优势使其成为原型设计、预览生成的理想选择。

💡 提示:ComfyUI 默认启用 LoRA 加速版本。如需切换回原版,可框选节点后按 Ctrl+B 禁用加速模块。

如何使用?三步上手

第一步:更新 ComfyUI

确保使用最新 开发版(nightly),以获得完整功能支持。

第二步:加载工作流模板

  1. 启动 ComfyUI
  2. 进入菜单:工作流 → 浏览模板 → 视频
  3. 选择以下任一模板:
    • Wan2.2 14B Fun InP
    • Wan2.2 Fun Control

⚠️ 若无法找到模板,请确认 ComfyUI 已更新至最新版本。

ComfyUI 原生支持 Wan2.2 Fun:首尾帧控制与多模态视频生成全面集成

第三步:下载并加载模型

所有模型均可在 Hugging Face或魔塔 获取:

必需组件:

类型文件名
Diffusion Model (High Noise)wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
Diffusion Model (Low Noise)wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
LoRA(可选加速)wan2.2_i2v_lightx2v_4steps_lora_v1_*.safetensors
VAEwan_2.1_vae.safetensors
Text Encoderumt5_xxl_fp8_e4m3fn_scaled.safetensors

注意:High/Low Noise 模型需与对应 LoRA 匹配使用。

运行工作流

Wan2.2 Fun Inp 首尾帧视频生成工作流示例

引用文本这个工作流是使用了 LoRA 的工作流,请确保对应的 Diffusion model 和 LoRA 是一致的

1.High noise 模型及 LoRA 加载

  • 确保 Load Diffusion Model 节点加载了wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors 模型
  • 确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors

2.Low noise 模型及 LoRA 加载

  • 确保 Load Diffusion Model 节点加载了 wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors 模型
  • 确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors

3.确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors 模型

4.确保 Load VAE 节点加载了 wan_2.1_vae.safetensors 模型

5.首尾帧图片上传,分别上传首尾帧图片素材

6.在 Prompt 组中输入提示词

7.WanFunInpaintToVideo 节点尺寸和视频长度调整

  • 调整 width 和 height 的尺寸,默认为 640, 我们设置了较小的尺寸你可以按需进行修改
  • 调整 length, 这里为视频总帧数,当前工作流 fps 为 16, 假设你需要生成一个 5 秒的视频,那么你应该设置 5*16 = 80

8.点击 Run 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行视频生成

ComfyUI 原生支持 Wan2.2 Fun:首尾帧控制与多模态视频生成全面集成

Wan2.2 Fun Control 视频控制生成工作流示例

引用文本这个工作流是使用了 LoRA 的工作流,请确保对应的 Diffusion model 和 LoRA 是一致的, high noise 和 low noise 的模型和 LoRA 需要对应使用

1.High noise 模型及 LoRA 加载

  • 确保 Load Diffusion Model 节点加载了 wan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors 模型
  • 确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors

2.Low noise 模型及 LoRA 加载

  • 确保 Load Diffusion Model 节点加载了 wan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors 模型
  • 确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors

3.确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors 模型
4.确保 Load VAE 节点加载了 wan_2.1_vae.safetensors 模型
5.在 Load Image 节点上传起始帧
6.在第二个 Load video 节点控制视频的 pose 视频, 提供的视频已经经过预处理可以直接使用
7.由于我们提供的视频是预处理过的 pose 视频,所以对应的视频图像预处理节点需要禁用,你可以选中后使用 Ctrl + B` 来禁用
8.修改 Prompt 使用中英文都可以
9.在 Wan22FunControlToVideo 修改对应视频的尺寸, 默认设置了 640*640 的分辨率来避免低显存用户使用这个工作流时过于耗时
10.点击 Run 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行视频生成

ComfyUI 原生支持 Wan2.2 Fun:首尾帧控制与多模态视频生成全面集成

补充说明

  • ComfyUI 内置仅含 Canny 预处理器,若需使用 Depth、OpenPose 等功能,建议安装扩展:
  • 对于预处理好的控制视频(如 pose 视频),可直接上传,并禁用相应预处理节点(选中节点 → Ctrl+B
© 版权声明

相关文章

暂无评论

none
暂无评论...