Regional Adaptive Sampling (RAS) 是一种用于加速 DiT模型推理的新技术。它类似于模型内部的 KV 缓存,通过选择可能在每个扩散步骤中被更新的区域,并仅传递这些 token,从而显著提高推理效率。
这种技术已被引入 ComfyUI,通过 ComfyUI-RegionalAdaptiveSampling 插件实现,并与 HunYuanVideo 和 Flux (dev & schnell) 模型兼容。未来,作者可能会扩展对更多模型的支持。

节点用法
将 Regional Adaptive Sampling 节点应用于所需的模型,并根据需求调整以下参数:

参数详解
sample_ratio
- 描述:在 RAS 传递中,模型中保留的 token 占总 token 的百分比。
- 取值范围:通常建议设置为 0.3 或更高。低于 0.3 的值可能会导致生成质量显著下降。
- 作用:控制每次扩散步骤中需要处理的 token 数量,从而影响推理速度和生成质量的平衡。
warmup_steps
- 描述:在开始时,不使用 RAS 的步骤数。
- 取值范围:根据具体任务调整。较高的值会降低加速效果,但能提高构图质量;较低的值则相反。
- 作用:为模型提供一个“热身”阶段,确保初始步骤的生成质量。
hydrate_every
- 描述:每隔多少步对所有 token 进行一次完整的模型运行,以刷新过时的缓存。
- 取值范围:设置为 0 时,禁用完整模型运行,执行完全的 RAS。
- 作用:防止缓存过时导致的生成质量下降,但会增加计算开销。
starvation_scale
- 描述:控制模型如何决定图像的哪个部分作为焦点。
- 取值范围:默认值为 0.1,增加该值可能会将质量从主体转移到背景。
- 作用:调整生成图像的焦点区域,平衡主体与背景的质量。
使用示例
- 安装插件:将 ComfyUI-RegionalAdaptiveSampling 插件安装到 ComfyUI 环境中。
- 配置节点:在 ComfyUI 的节点图中,添加 Regional Adaptive Sampling 节点,并将其连接到目标模型(如 HunYuanVideo 或 Flux)。
- 调整参数:根据任务需求调整
sample_ratio
、warmup_steps
、hydrate_every
和starvation_scale
参数。 - 运行推理:启动推理流程,观察生成结果的质量和速度变化。
注意事项
- 模型兼容性:目前该插件仅支持 HunYuanVideo 和 Flux 模型。如果需要支持其他模型,建议关注作者的更新或尝试自行适配。
- 质量与速度的平衡:调整参数时,需要权衡生成质量和推理速度。较高的
sample_ratio
和较低的warmup_steps
可能会提高速度,但可能牺牲质量。 - 实验性功能:由于该技术仍处于发展阶段,建议在实际应用中进行充分测试,以确保满足需求。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...