EasyWanVideo 是一款由 Zuntan 开发的工具,简化在 Windows 上使用开源视频生成模型 Wan 2.1。它其实就是将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具。(PS:开发者是日本人,说明也是全日语)
- GitHub:https://github.com/Zuntan03/EasyWanVideo
- 备份:https://pan.baidu.com/s/1kNYEzNcZBxGSQEE8jf_1tw?pwd=5i69

系统要求
- 操作系统:Windows 10 或 Windows 11
- 显卡:英伟达GeForce RTX 3060 12GB 或更高
- 内存:32GB 或更多(Kijai 版本推荐 48GB 以上)
安装步骤
- 下载 EasyWanVideo
- 从 GitHub 获取安装程序(EasyWanVideoInstaller.bat)。
- 运行安装程序
- 将批处理文件放置在合适的文件夹(例如,
C:\EasyWan\
)并执行。
- 将批处理文件放置在合适的文件夹(例如,
- 下载 SageAttention 要求
- 执行
SetupSageAttention.bat
。
- 执行
- 安装 SageAttention
- 执行
vs_buildtools.exe
,选择“使用 C++ 的桌面开发”,安装 Visual Studio Build。
- 执行
- 安装英伟达 CUDA Toolkit
- 使用位于
EasyWanVideo/SageAttention/
中的cuda_12.8.1_windows_network.exe
安装英伟达 CUDA Toolkit。
- 使用位于
- 删除 Triton 缓存(如果需要)
- 如果你在其他环境中使用过 SageAttention,请使用
EasyWanVideo/SageAttention/DeleteTritonCache.bat
删除 Triton 缓存。
- 如果你在其他环境中使用过 SageAttention,请使用

启动工具
- 启动 ComfyUI
- 运行
ComfyUi.bat
启动 ComfyUI。
- 运行
- 打开工作流
- 点击左侧的文件夹图标,从浏览列表中打开以下 JSON 文件:
00_Kijai_I2v
:用于 I2V(图像到视频)生成的主工作流。55_ConcatInterpolate
:平滑拼接两个视频。60_Upscale
:使用基于 ESRGAN 的放大器对视频进行放大。70_Interpolate
:插值视频帧并转换为.mp4
。
- 点击左侧的文件夹图标,从浏览列表中打开以下 JSON 文件:
如何使用主工作流(I2V)
以下是一个详细的使用教程,以图像到视频(I2V)生成为例:
- 加载图像
- 选择你的输入图像。
- 设置
- 重要:
- “保存最终帧图像”:对于创建超过 5 秒的视频是必要的。
- “从图像生成提示”:根据输出视频是否符合你的期望结果进行调整。
- 重要:
- 设置更快生成或高质量生成
- 注意:
- 如果你没有 RTX 40x0 或更高版本的显卡,建议禁用“sageattention”。如果你有 RTX 40x0 或更高版本的显卡,建议尝试启用。
- 注意:
- 加载 Wan2.1 模型设置
- 如果你创建 480 像素高度的视频,选择:
Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
- 如果你创建 720 像素高度的视频,选择:
Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors
- 注意:不要使用
Wan2_1-T2V-1_3B_fp8_e4m3fn.safetensors
,该模型用于 Text2Video。
- 如果你创建 480 像素高度的视频,选择:
- 设置高度和长度
- 选择 480 或 720。
- 注意:704 是错误的,应修正为 720。
- 加载 Wan2.1 LoRA
- LoRA 使复现特定动作变得非常简单。
- 在此工作流中,你可以同时应用最多三个 LoRA。通过切换激活状态来启用或禁用它们。
- 重要:要启用 LoRA,你需要在提示输入字段中输入触发词。你可以通过以下步骤查看触发词:
- 在工作流中找到 LoRA 节点,查看其描述或文档。
- 输入提示
- 输入生成视频所需的提示。
- 输入所需的动作。
- 示例提示可在 WAN 2.1 官方网站上找到。
- 如果启用了自动提示生成,你在此处输入的提示后将添加自动生成的提示。
- 确保输入步骤 6 中的触发词以启用 LoRA。
- 技巧
- 如果输入图像小于生成视频,使用 lanczos。
- 如果输入图像大于生成视频,使用 area。
- 放大时:
- nearest-exact:简单复制原始图像中最接近的像素。原始像素保持不变,可能导致图像出现锯齿。
- bilinear:从原始图像中选择 4 个附近像素,并根据距离取平均值。这会生成模糊图像,并可能出现各向异性伪影。
- bicubic:与 bilinear 类似,但使用三次样条插值而非线性插值。这也会生成模糊图像。
- area:与 nearest-exact 相同。
- 缩小时:
- nearest-exact:简单复制原始图像中最接近的像素。这可能导致摩尔纹或图像中保留不自然的点。
- bilinear:尽管是缩小,仍与放大时类似,可能导致摩尔纹或不自然的点。
- bicubic:尽管是缩小,仍与放大时类似,可能导致摩尔纹或不自然的点。
- area:使用自适应平均池化进行缩小。它对原始图像的像素取平均值以匹配缩小图像中的对应像素,调整原始图像像素的重叠小于或等于 1。这有助于避免不必要的模糊并减少摩尔纹等问题。
- 运行
- 点击“运行”按钮,开始生成视频。
- 输出结果
- 输出结果将保存在
\Output\yyyy-mm-dd
文件夹中。
- 输出结果将保存在
- 创建视频的延续
- 如果你想创建视频的延续,加载与普通
.webp
文件同时输出的LastImage.webp
,从步骤 1 的“加载图像”开始,然后再次运行工作流。
- 如果你想创建视频的延续,加载与普通
如何使用 ConcatInterpolate 工作流
- 功能:平滑拼接两个视频。
- 输出结果:
- 输出结果将保存在
\Output\yyyy-dd\MMdd_HHmmss_ConcatInterpolate_00001_.webp
文件夹中。
- 输出结果将保存在
如何使用 Upscale 工作流
- 功能:使用基于 ESRGAN 的放大器对视频进行放大。
- 默认设置:
- ESRGAN 放大器将图像放大 4 倍,然后 Upscaler 将图像尺寸缩小 0.5 倍,最终图像尺寸加倍。
- 输出结果:
- 输出结果将保存在
\Output\yyyy-MM-dd\MMdd_HHmmss_Upscale_00001_.webp
文件夹中。
- 输出结果将保存在
如何使用 Interpolate 工作流
- 功能:插值视频帧并转换为
.mp4
。 - 输出结果:
- 输出结果将保存在
\Output\yyyy-MM-dd\MMdd_HHmmss_Interpolate_00001.mp4
文件夹中。
- 输出结果将保存在
- 帧数插值选项:
- 3:帧数插值增加 3 倍,视频速度设置为 125%。
- 3p:帧数插值增加 3 倍,视频速度设置为 125%,视频播放一次后将继续反向播放。
- 4:帧数插值增加 4 倍,视频速度设置为 94%。
- 4p:帧数插值增加 4 倍,视频速度设置为 94%,视频播放一次后将继续反向播放。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...