ComfyUI-TwinFlow:加速Qwen-Image、Z-Image生成速度,兼容 LoRA 与 ControlNet

插件3周前更新 小马良
31 0

TwinFlow是一种通过自对抗流(Self-adversarial Flows)将大型扩散模型(如 Qwen-ImageZ-Image)加速至 1 步或极低步数(2–4 步)生成的先进技术。

1步顶100步!TwinFlow让Qwen-Image、Z-Image推理提速100倍,无需判别器或教师模型

ComfyUI-TwinFlow 是一个严格遵循 ComfyUI 节点规范的自定义节点实现,让你在保持工作流灵活性的同时,安全、高效地使用 TwinFlow 的加速能力。

为什么选择本实现?(vs 其他 TwinFlow 节点)

目前存在另一个 TwinFlow 节点(smthemex/ComfyUI_TwinFlow),但其存在以下问题:

  • ❌ 使用独立模型加载器,无法与标准 ComfyUI UNet/CLIP 节点兼容;
  • ❌ 内置封闭式 KSampler,难以与其他节点(如 LoRA、ControlNet)组合;
  • ❌ 缺少原始论文中的部分调度选项,灵活性受限。

而本实现:

  • ✅ 完全基于 ComfyUI 标准接口,模型、VAE、CLIP 均通过标准节点接入;
  • ✅ 模块化设计:提供独立的 Model PatcherSamplerScheduler,也可使用一体化 KSampler
  • ✅ 完整支持 TwinFlow 调度参数(Kumaraswamy 分布、时间间隙等);
  • ✅ 兼容 LoRA、IP-Adapter、ControlNet 等第三方节点,可自由构建复杂工作流。

核心功能

功能说明
TwinFlow Model Patcher注入 TwinFlow 补丁权重(.safetensors 或 .gguf),恢复被 ComfyUI 移除的关键时间嵌入张量(此步骤不可省略)
TwinFlow Sampler支持 euler(一阶)和 heun(二阶)积分方法
TwinFlow Scheduler实现 Kumaraswamy 时间变换,支持自定义时间流分布
TwinFlow KSampler一体化节点,简化低步数生成流程

安装

cd ComfyUI/custom_nodes
git clone https://github.com/mengqin/ComfyUI-TwinFlow.git
cd ComfyUI-TwinFlow
pip install -r requirements.txt
重启 ComfyUI 后生效。

📂 模型准备

将 TwinFlow 补丁文件放入 ComfyUI/models/unet/ 目录:

ComfyUI/
└── models/
    └── unet/
        └── TwinFlow_Z_Image_Turbo_bf16.safetensors

补丁文件需与基础模型(Qwen-Image / Z-Image)严格对应

使用方法

步骤 1:模型修补(必需)

  1. 使用标准节点加载你的 DiT 模型(如 Qwen-Image);
  2. 将模型连接到 TwinFlow Model Patcher 节点;
  3. 在 patch_file 中选择对应的 TwinFlow 补丁文件。

⚠️ 重要:TwinFlow 推理依赖一个额外的时间嵌入张量,而 ComfyUI 的标准 UNet 加载器会将其移除。必须通过本修补器恢复,否则生成将失败或失真。

步骤 2:采样(二选一)

方式 A:使用一体化节点(推荐)

  • 直接使用 TwinFlow KSampler,设置:
    • steps: 1–4(推荐 1 步用于 Z-Image Turbo,2–4 步用于 Qwen-Image)
    • sampling_style:
      • few:极低步数(1–4 步)
      • any:通用模式
      • mul:多步精细生成
    • sampling_methodeuler(快)或 heun(更准)
ComfyUI-TwinFlow:加速Qwen-Image、Z-Image生成速度,兼容 LoRA 与 ControlNet

方式 B:自定义采样链

  • 将 TwinFlow Sampler + TwinFlow Scheduler 连接到标准 SamplerCustom 节点;
  • 可自由插入 LoRA、提示词加权、高分辨率修复 等节点。
ComfyUI-TwinFlow:加速Qwen-Image、Z-Image生成速度,兼容 LoRA 与 ControlNet

关键参数说明

参数作用
dist_ctrl_abc控制 Kumaraswamy 时间分布的形状,默认 1.0 为线性流
gap_start / gap_end定义流的时间边界(通常设为 0.0 / 1.0
block_number(显存优化)若 VRAM > 16GB,可设为 0 以最大化速度

注意事项

  • 显存需求
    • Qwen-Image(1024×768):约 12GB VRAM(开启模型卸载)
    • Z-Image Turbo:12GB VRAM 下 2–3 秒/图(Q8 量化)
  • 模型格式
    • GGUF 适用于低显存设备(推荐 Q6_K / Q8_0)
    • SafeTensors(BF16/FP16)适用于高精度场景
  • 不要混用不同实现:本节点与 smthemex 版本不兼容,请勿同时安装。
© 版权声明

相关文章

暂无评论

none
暂无评论...