不列颠哥伦比亚大学(UBC)的研究人员提出的 Value Sign Flip (VSF) 方法,已在视频生成模型 Wan 2.1 上展现出卓越的负提示控制能力。
开发人员也制作了 ComfyUI节点,支持在少步生成中精准移除指定对象。该节点专为对象级内容排除设计,提供一种轻量、高效、无需分类器引导(CFG) 的负向控制方案,适用于希望精细控制生成内容的视频创作者与研究者。

功能定位:不是提升质量,而是精准排除
VSF 的核心目标是:让模型“不生成某物”。
与传统 CFG 不同,VSF 不通过加权差值引导生成方向,而是直接在注意力机制中翻转负提示值向量的符号,从而动态抑制特定语义的出现。
✅ 适合场景:
- 视频中移除特定物体(如轮子、翅膀、标志)
- 避免生成特定结构或部件
- 实现更可靠的语义约束生成
⚠️ 注意事项:
- 不推荐将“低质量”“模糊”等作为负提示来提升画质——这可能导致意外结果,甚至降低整体质量;
- 本节点专注于语义级对象排除,非通用画质增强工具。
安装方式
安装方式与其他 ComfyUI 自定义节点一致:
cd custom_nodes
git clone https://github.com/weathon/VSF/tree/main/comfyui/custom_nodes/value_sign_flip
重启 ComfyUI 后,即可在节点列表中找到 VSF Video Generator 节点。
📌 当前仅支持 Wan 2.1 系列模型,需手动下载对应 LoRA 与文本编码器。
🎛️ 使用方法:一体化节点,即连即用
VSF 节点为一体化生成节点,集成了模型加载、提示处理与视频生成流程。
连接方式
- 将节点拖入工作区;
- 输入 正向提示(positive prompt) 和 负向提示(negative prompt);
- 配置参数(见下文);
- 将输出连接至
SaveWebp或PreviewImage节点进行预览或导出。
📌 输出为一个图像列表,表示生成的视频帧序列。
⚠️ 当前版本未提供示例工作流,因设置简单且功能独立。用户可直接替换原有生成节点使用。
⚙️ 参数详解
| 参数 | 说明 | 推荐值 |
|---|---|---|
| model_id | HuggingFace 上 diffusers 格式的 Wan 模型 ID(如 Wan/1.3B 或 Wan/14B)仅用于加载配置、分词器和调度器 | Wan/Wan-Video-1.3B |
| cfg_lora | 必需的 CFG LoRA 文件,用于条件控制 例如: Wan21_CausVid_bidirect2_T2V_1_3B_lora_rank32.safetensors可从官方仓库获取 | 下载自 Wan 发布页 |
| scale | VSF 引导强度 ⚠️ 起始值为 0(与 CFG 的 1 不同) 值越大,负提示抑制越强,但过高可能导致语义扭曲 | 0.5 ~ 1.2 |
| offset | 注意力偏置项,控制负提示的影响范围 更负的值可减少负提示在非目标区域的干扰 | -1.0 ~ -3.0 |
| shift | 采样过程中的流偏移(flow shift),用于调整帧间连续性 | 0.1 ~ 0.5 |
| cfg_lora_scale | CFG LoRA 的应用强度 控制正向语义的稳定性 | 0.4 ~ 0.7 |
📌 建议从默认值开始微调,逐步调整 scale 和 offset 以获得最佳控制效果。
⚠️ 当前限制
请在使用前了解以下限制:
| 限制项 | 说明 |
|---|---|
| ❌ 无去噪进度条 | 节点内部不显示生成进度,可通过 Ctrl + ~ 打开终端查看实时日志 |
| ❌ 功能封闭 | 不支持自定义调度器或分块处理,所有功能封装在单一节点内 |
| ❌ 不支持 CPU 卸载 | 必须全程在 GPU 上运行,显存需求较高 |
| ❌ 仅支持 FP16 文本编码器 | 必须使用 umt5_xxl_fp16.safetensors,不支持 FP8 或其他精度版本 |
| ❌ 不兼容 FP8 模型 | 所有模型权重需为 FP16 格式 |
✅ 使用建议
- 推荐搭配:
- 正向 LoRA:用于增强风格或细节
lightx2vLoRA:可提升光照表现(如示例中所用)
- 调试技巧:
- 先设
scale=0观察基线输出; - 逐步增加
scale(每次 +0.2),观察负提示是否被有效抑制; - 若出现画面异常,尝试调低
cfg_lora_scale或增大offset的负值。
- 先设
- 适用模型范围:
- 支持 Wan 2.1 的 1.3B、14B 等尺寸
- 需确保 LoRA 与主模型版本匹配
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















