EasyWanVideo:将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具

教程2天前更新 小马良
26 0

EasyWanVideo 是一款由 Zuntan 开发的工具,简化在 Windows 上使用开源视频生成模型 Wan 2.1。它其实就是将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具。(PS:开发者是日本人,说明也是全日语)

EasyWanVideo:将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具

系统要求

  • 操作系统:Windows 10 或 Windows 11
  • 显卡:英伟达GeForce RTX 3060 12GB 或更高
  • 内存:32GB 或更多(Kijai 版本推荐 48GB 以上)

安装步骤

  1. 下载 EasyWanVideo
    • 从 GitHub 获取安装程序(EasyWanVideoInstaller.bat)。
  2. 运行安装程序
    • 将批处理文件放置在合适的文件夹(例如,C:\EasyWan\)并执行。
  3. 下载 SageAttention 要求
    • 执行 SetupSageAttention.bat
  4. 安装 SageAttention
    • 执行 vs_buildtools.exe,选择“使用 C++ 的桌面开发”,安装 Visual Studio Build。
  5. 安装英伟达 CUDA Toolkit
    • 使用位于 EasyWanVideo/SageAttention/ 中的 cuda_12.8.1_windows_network.exe 安装英伟达 CUDA Toolkit。
  6. 删除 Triton 缓存(如果需要)
    • 如果你在其他环境中使用过 SageAttention,请使用 EasyWanVideo/SageAttention/DeleteTritonCache.bat 删除 Triton 缓存。
EasyWanVideo:将Wan 2.1所需的节点和依赖项打包而成的一个 ComfyUI一键安装工具

启动工具

  • 启动 ComfyUI
    • 运行 ComfyUi.bat 启动 ComfyUI。
  • 打开工作流
    • 点击左侧的文件夹图标,从浏览列表中打开以下 JSON 文件:
      • 00_Kijai_I2v:用于 I2V(图像到视频)生成的主工作流。
      • 55_ConcatInterpolate:平滑拼接两个视频。
      • 60_Upscale:使用基于 ESRGAN 的放大器对视频进行放大。
      • 70_Interpolate:插值视频帧并转换为 .mp4

如何使用主工作流(I2V)

以下是一个详细的使用教程,以图像到视频(I2V)生成为例:

  1. 加载图像
    • 选择你的输入图像。
  2. 设置
    • 重要
      • “保存最终帧图像”:对于创建超过 5 秒的视频是必要的。
      • “从图像生成提示”:根据输出视频是否符合你的期望结果进行调整。
  3. 设置更快生成或高质量生成
    • 注意
      • 如果你没有 RTX 40x0 或更高版本的显卡,建议禁用“sageattention”。如果你有 RTX 40x0 或更高版本的显卡,建议尝试启用。
  4. 加载 Wan2.1 模型设置
    • 如果你创建 480 像素高度的视频,选择:
      • Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
    • 如果你创建 720 像素高度的视频,选择:
      • Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors
    • 注意:不要使用 Wan2_1-T2V-1_3B_fp8_e4m3fn.safetensors,该模型用于 Text2Video。
  5. 设置高度和长度
    • 选择 480 或 720。
    • 注意:704 是错误的,应修正为 720。
  6. 加载 Wan2.1 LoRA
    • LoRA 使复现特定动作变得非常简单。
    • 在此工作流中,你可以同时应用最多三个 LoRA。通过切换激活状态来启用或禁用它们。
    • 重要:要启用 LoRA,你需要在提示输入字段中输入触发词。你可以通过以下步骤查看触发词:
      • 在工作流中找到 LoRA 节点,查看其描述或文档。
  7. 输入提示
    • 输入生成视频所需的提示。
    • 输入所需的动作。
    • 示例提示可在 WAN 2.1 官方网站上找到。
    • 如果启用了自动提示生成,你在此处输入的提示后将添加自动生成的提示。
    • 确保输入步骤 6 中的触发词以启用 LoRA
  8. 技巧
    • 如果输入图像小于生成视频,使用 lanczos
    • 如果输入图像大于生成视频,使用 area
    • 放大时
      • nearest-exact:简单复制原始图像中最接近的像素。原始像素保持不变,可能导致图像出现锯齿。
      • bilinear:从原始图像中选择 4 个附近像素,并根据距离取平均值。这会生成模糊图像,并可能出现各向异性伪影。
      • bicubic:与 bilinear 类似,但使用三次样条插值而非线性插值。这也会生成模糊图像。
      • area:与 nearest-exact 相同。
    • 缩小时
      • nearest-exact:简单复制原始图像中最接近的像素。这可能导致摩尔纹或图像中保留不自然的点。
      • bilinear:尽管是缩小,仍与放大时类似,可能导致摩尔纹或不自然的点。
      • bicubic:尽管是缩小,仍与放大时类似,可能导致摩尔纹或不自然的点。
      • area:使用自适应平均池化进行缩小。它对原始图像的像素取平均值以匹配缩小图像中的对应像素,调整原始图像像素的重叠小于或等于 1。这有助于避免不必要的模糊并减少摩尔纹等问题。
  9. 运行
    • 点击“运行”按钮,开始生成视频。
  10. 输出结果
    • 输出结果将保存在 \Output\yyyy-mm-dd 文件夹中。
  11. 创建视频的延续
    • 如果你想创建视频的延续,加载与普通 .webp 文件同时输出的 LastImage.webp,从步骤 1 的“加载图像”开始,然后再次运行工作流。

如何使用 ConcatInterpolate 工作流

  • 功能:平滑拼接两个视频。
  • 输出结果
    • 输出结果将保存在 \Output\yyyy-dd\MMdd_HHmmss_ConcatInterpolate_00001_.webp 文件夹中。

如何使用 Upscale 工作流

  • 功能:使用基于 ESRGAN 的放大器对视频进行放大。
  • 默认设置
    • ESRGAN 放大器将图像放大 4 倍,然后 Upscaler 将图像尺寸缩小 0.5 倍,最终图像尺寸加倍。
  • 输出结果
    • 输出结果将保存在 \Output\yyyy-MM-dd\MMdd_HHmmss_Upscale_00001_.webp 文件夹中。

如何使用 Interpolate 工作流

  • 功能:插值视频帧并转换为 .mp4
  • 输出结果
    • 输出结果将保存在 \Output\yyyy-MM-dd\MMdd_HHmmss_Interpolate_00001.mp4 文件夹中。
  • 帧数插值选项
    • 3:帧数插值增加 3 倍,视频速度设置为 125%。
    • 3p:帧数插值增加 3 倍,视频速度设置为 125%,视频播放一次后将继续反向播放。
    • 4:帧数插值增加 4 倍,视频速度设置为 94%。
    • 4p:帧数插值增加 4 倍,视频速度设置为 94%,视频播放一次后将继续反向播放。
© 版权声明

相关文章

暂无评论

none
暂无评论...