EasyWanVideo：将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具

26 0

EasyWanVideo 是一款由 Zuntan 开发的工具，简化在 Windows 上使用开源视频生成模型 Wan 2.1。它其实就是将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具。（PS：开发者是日本人，说明也是全日语）

GitHub：https://github.com/Zuntan03/EasyWanVideo
备份：https://pan.baidu.com/s/1kNYEzNcZBxGSQEE8jf_1tw?pwd=5i69

EasyWanVideo：将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具

系统要求

操作系统：Windows 10 或 Windows 11
显卡：英伟达GeForce RTX 3060 12GB 或更高
内存：32GB 或更多（Kijai 版本推荐 48GB 以上）

安装步骤

下载 EasyWanVideo
- 从 GitHub 获取安装程序（EasyWanVideoInstaller.bat）。
运行安装程序
- 将批处理文件放置在合适的文件夹（例如，C:\EasyWan\）并执行。
下载 SageAttention 要求
- 执行 SetupSageAttention.bat。
安装 SageAttention
- 执行 vs_buildtools.exe，选择“使用 C++ 的桌面开发”，安装 Visual Studio Build。
安装英伟达 CUDA Toolkit
- 使用位于 EasyWanVideo/SageAttention/ 中的 cuda_12.8.1_windows_network.exe 安装英伟达 CUDA Toolkit。
删除 Triton 缓存（如果需要）
- 如果你在其他环境中使用过 SageAttention，请使用 EasyWanVideo/SageAttention/DeleteTritonCache.bat 删除 Triton 缓存。

启动工具

启动 ComfyUI
- 运行 ComfyUi.bat 启动 ComfyUI。
打开工作流
- 点击左侧的文件夹图标，从浏览列表中打开以下 JSON 文件：
  - 00_Kijai_I2v：用于 I2V（图像到视频）生成的主工作流。
  - 55_ConcatInterpolate：平滑拼接两个视频。
  - 60_Upscale：使用基于 ESRGAN 的放大器对视频进行放大。
  - 70_Interpolate：插值视频帧并转换为 .mp4。

如何使用主工作流（I2V）

以下是一个详细的使用教程，以图像到视频（I2V）生成为例：

加载图像
- 选择你的输入图像。
设置
- 重要：
  - “保存最终帧图像”：对于创建超过 5 秒的视频是必要的。
  - “从图像生成提示”：根据输出视频是否符合你的期望结果进行调整。
设置更快生成或高质量生成
- 注意：
  - 如果你没有 RTX 40x0 或更高版本的显卡，建议禁用“sageattention”。如果你有 RTX 40x0 或更高版本的显卡，建议尝试启用。
加载 Wan2.1 模型设置
- 如果你创建 480 像素高度的视频，选择：
  - Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
- 如果你创建 720 像素高度的视频，选择：
  - Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors
- 注意：不要使用 Wan2_1-T2V-1_3B_fp8_e4m3fn.safetensors，该模型用于 Text2Video。
设置高度和长度
- 选择 480 或 720。
- 注意：704 是错误的，应修正为 720。
加载 Wan2.1 LoRA
- LoRA 使复现特定动作变得非常简单。
- 在此工作流中，你可以同时应用最多三个 LoRA。通过切换激活状态来启用或禁用它们。
- 重要：要启用 LoRA，你需要在提示输入字段中输入触发词。你可以通过以下步骤查看触发词：
  - 在工作流中找到 LoRA 节点，查看其描述或文档。
输入提示
- 输入生成视频所需的提示。
- 输入所需的动作。
- 示例提示可在 WAN 2.1 官方网站上找到。
- 如果启用了自动提示生成，你在此处输入的提示后将添加自动生成的提示。
- 确保输入步骤 6 中的触发词以启用 LoRA。
技巧
- 如果输入图像小于生成视频，使用 lanczos。
- 如果输入图像大于生成视频，使用 area。
- 放大时：
  - nearest-exact：简单复制原始图像中最接近的像素。原始像素保持不变，可能导致图像出现锯齿。
  - bilinear：从原始图像中选择 4 个附近像素，并根据距离取平均值。这会生成模糊图像，并可能出现各向异性伪影。
  - bicubic：与 bilinear 类似，但使用三次样条插值而非线性插值。这也会生成模糊图像。
  - area：与 nearest-exact 相同。
- 缩小时：
  - nearest-exact：简单复制原始图像中最接近的像素。这可能导致摩尔纹或图像中保留不自然的点。
  - bilinear：尽管是缩小，仍与放大时类似，可能导致摩尔纹或不自然的点。
  - bicubic：尽管是缩小，仍与放大时类似，可能导致摩尔纹或不自然的点。
  - area：使用自适应平均池化进行缩小。它对原始图像的像素取平均值以匹配缩小图像中的对应像素，调整原始图像像素的重叠小于或等于 1。这有助于避免不必要的模糊并减少摩尔纹等问题。
运行
- 点击“运行”按钮，开始生成视频。
输出结果
- 输出结果将保存在 \Output\yyyy-mm-dd 文件夹中。
创建视频的延续
- 如果你想创建视频的延续，加载与普通 .webp 文件同时输出的 LastImage.webp，从步骤 1 的“加载图像”开始，然后再次运行工作流。

如何使用 ConcatInterpolate 工作流

功能：平滑拼接两个视频。
输出结果：
- 输出结果将保存在 \Output\yyyy-dd\MMdd_HHmmss_ConcatInterpolate_00001_.webp 文件夹中。

如何使用 Upscale 工作流

功能：使用基于 ESRGAN 的放大器对视频进行放大。
默认设置：
- ESRGAN 放大器将图像放大 4 倍，然后 Upscaler 将图像尺寸缩小 0.5 倍，最终图像尺寸加倍。
输出结果：
- 输出结果将保存在 \Output\yyyy-MM-dd\MMdd_HHmmss_Upscale_00001_.webp 文件夹中。

如何使用 Interpolate 工作流

功能：插值视频帧并转换为 .mp4。
输出结果：
- 输出结果将保存在 \Output\yyyy-MM-dd\MMdd_HHmmss_Interpolate_00001.mp4 文件夹中。
帧数插值选项：
- 3：帧数插值增加 3 倍，视频速度设置为 125%。
- 3p：帧数插值增加 3 倍，视频速度设置为 125%，视频播放一次后将继续反向播放。
- 4：帧数插值增加 4 倍，视频速度设置为 94%。
- 4p：帧数插值增加 4 倍，视频速度设置为 94%，视频播放一次后将继续反向播放。