ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

1,998 0

ComfyUI 社区迎来重要更新！现已原生支持阿里巴巴 PAI 团队推出的 Wan2.2 Fun 系列视频生成模型，包括 Wan2.2 Fun InP 与 Wan2.2 Fun Control，并集成 LightX2V 4步 LoRA 加速模块，显著提升生成效率。

模型：https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged
魔塔：https://www.modelscope.cn/models/Comfy-Org/Wan_2.2_ComfyUI_Repackaged

此次更新意味着用户可通过 ComfyUI 工作流模板，快速实现高精度视频生成与控制，无需手动配置复杂节点，大幅降低使用门槛。

阿里云 PAI发布 Wan2.2-Fun：扩展Wan2.2文生视频与可控视频生成的能力边界

阿里云 PAI发布 Wan2.2-Fun：扩展Wan2.2文生视频与可控视频生成的能力边界

✅ 支持首尾帧过渡生成
✅ 支持姿态、深度、边缘等多模态控制
✅ 集成 Lightning LoRA，最快提速达 4倍
✅ 所有模型基于 Apache 2.0 协议，支持商业用途

Wan2.2 Fun 是什么？

Wan2.2 Fun 是由阿里巴巴 PAI 团队开发的高性能视频生成模型系列，基于 Wan2.2 架构构建，专为创意视频生成优化。其核心优势在于：

输出质量达到影视级；
支持多种控制方式，实现精准创作；
开源可商用，适合企业与个人开发者。

目前 ComfyUI 已集成两大核心变体：

1. Wan2.2 Fun InP：首尾帧控制生成

通过输入起始帧和结束帧图像，模型自动生成中间平滑过渡的视频序列。

适用场景：

动画转场设计
视觉叙事衔接
静态图到动态视频转换

核心特性：

首尾帧语义连贯，避免跳跃
支持 512×512、768×768、1024×1024 多分辨率输出
可结合文本提示进一步引导内容演变

2. Wan2.2 Fun Control：多模态条件控制

支持多种控制信号输入，实现对视频运动路径的精细调控。

支持的控制类型：

🖌️ Canny：线稿轮廓控制
📏 Depth：深度图引导
🧍 OpenPose：人体姿态控制
🔲 MLSD：直线结构检测
🔄 轨迹控制：自定义运动路径

适用场景：

角色动画驱动
产品演示视频生成
虚拟场景构建

模型支持中英文提示词输入，降低语言门槛。

LightX2V 4步 LoRA：速度飞跃，低显存友好

为提升推理效率，本次集成还引入了 Wan2.2-Lightning 4步 LoRA 模块，基于 lightx2v 技术实现极简步数生成。

在 RTX 4090D（24GB）上的实测数据如下（640×640 分辨率，81帧）：

模型配置	显存占用	首次生成时间	第二次生成时间
fp8_scaled（原版）	83%	≈524 秒	≈520 秒
+ 4步 LoRA 加速	89%	≈138 秒	≈79 秒

⚡ 提速近 4倍，尤其适合低显存设备或需要快速迭代的创作流程。

尽管部分动态细节可能略有损失，但其速度优势使其成为原型设计、预览生成的理想选择。

💡 提示：ComfyUI 默认启用 LoRA 加速版本。如需切换回原版，可框选节点后按 Ctrl+B 禁用加速模块。

如何使用？三步上手

第一步：更新 ComfyUI

确保使用最新 开发版（nightly），以获得完整功能支持。

下载地址：https://www.comfy.org/download
推荐使用开发版，稳定版或桌面版可能不包含最新更新

第二步：加载工作流模板

启动 ComfyUI
进入菜单：工作流 → 浏览模板 → 视频
选择以下任一模板：
- Wan2.2 14B Fun InP
- Wan2.2 Fun Control

⚠️ 若无法找到模板，请确认 ComfyUI 已更新至最新版本。

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

第三步：下载并加载模型

所有模型均可在 Hugging Face或魔塔获取：

模型：https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged
魔塔：https://www.modelscope.cn/models/Comfy-Org/Wan_2.2_ComfyUI_Repackaged
GGUF版：Hugging Face | 魔塔

必需组件：

类型	文件名
Diffusion Model (High Noise)	`wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors`
Diffusion Model (Low Noise)	`wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors`
LoRA（可选加速）	`wan2.2_i2v_lightx2v_4steps_lora_v1_*.safetensors`
VAE	`wan_2.1_vae.safetensors`
Text Encoder	`umt5_xxl_fp8_e4m3fn_scaled.safetensors`

注意：High/Low Noise 模型需与对应 LoRA 匹配使用。

运行工作流

Wan2.2 Fun Inp 首尾帧视频生成工作流示例

引用文本这个工作流是使用了 LoRA 的工作流，请确保对应的 Diffusion model 和 LoRA 是一致的

1.High noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors

2.Low noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了 wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors

3.确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors 模型

4.确保 Load VAE 节点加载了 wan_2.1_vae.safetensors 模型

5.首尾帧图片上传，分别上传首尾帧图片素材

6.在 Prompt 组中输入提示词

7.WanFunInpaintToVideo 节点尺寸和视频长度调整

调整 width 和 height 的尺寸，默认为 640, 我们设置了较小的尺寸你可以按需进行修改
调整 length, 这里为视频总帧数，当前工作流 fps 为 16, 假设你需要生成一个 5 秒的视频，那么你应该设置 5*16 = 80

8.点击 Run 按钮，或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行视频生成

Wan2.2 Fun Control 视频控制生成工作流示例

引用文本这个工作流是使用了 LoRA 的工作流，请确保对应的 Diffusion model 和 LoRA 是一致的, high noise 和 low noise 的模型和 LoRA 需要对应使用

1.High noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了 wan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors

2.Low noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了 wan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors

3.确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors 模型
4.确保 Load VAE 节点加载了 wan_2.1_vae.safetensors 模型
5.在 Load Image 节点上传起始帧
6.在第二个 Load video 节点控制视频的 pose 视频, 提供的视频已经经过预处理可以直接使用
7.由于我们提供的视频是预处理过的 pose 视频，所以对应的视频图像预处理节点需要禁用，你可以选中后使用 Ctrl + B` 来禁用
8.修改 Prompt 使用中英文都可以
9.在 Wan22FunControlToVideo 修改对应视频的尺寸, 默认设置了 640*640 的分辨率来避免低显存用户使用这个工作流时过于耗时
10.点击 Run 按钮，或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行视频生成

补充说明

ComfyUI 内置仅含 Canny 预处理器，若需使用 Depth、OpenPose 等功能，建议安装扩展：
- ComfyUI-comfyui_controlnet_aux
对于预处理好的控制视频（如 pose 视频），可直接上传，并禁用相应预处理节点（选中节点 → Ctrl+B）