Reddit 用户 bymyself___ 分析了过去六个月中添加到 ComfyUI 自定义节点注册表 的 562 个插件包,并整理出按安装量排名前 25 的插件。这些数据揭示了当前 ComfyUI 社区的主要关注方向:性能优化、视频生成、模型实现和工作流效率提升 。

本文将从数据出发,结合实际使用反馈,为你解析这些热门节点的功能、性能提升效果以及背后的技术趋势。
安装量 Top 25 节点概览
性能/优化领先者:
- ComfyUI-TeaCache:136.4K(用于更快推理的缓存)
- Comfy-WaveSpeed:85.1K(推理优化套件)
- ComfyUI-MultiGPU:79.7K(多GPU设置优化)
- ComfyUI_Patches_ll:59.2K(添加了一些钩子方法,如TeaCache和First Block Cache)
- gguf:54.4K(模型量化)
- ComfyUI-TeaCacheHunyuanVideo:35.9K(用于更快视频生成的缓存)
- ComfyUI-nunchaku:35.5K(4位量化模型)
模型实现:
- ComfyUI-ReActor:177.6K(人脸交换)
- ComfyUI_PuLID_Flux_ll:117.9K(PuLID-Flux实现)
- HunyuanVideoWrapper:113.8K(视频生成)
- WanVideoWrapper:90.3K(视频生成)
- ComfyUI-MVAdapter:44.4K(多视图一致性图像)
- ComfyUI-Janus-Pro:31.5K(多模态;理解和生成图像)
- ComfyUI-UltimateSDUpscale-GGUF:30.9K(上采样)
- ComfyUI-MMAudio:17.8K(根据视频和/或文本输入生成同步音频)
- ComfyUI-Hunyuan3DWrapper:16.5K(3D生成)
- ComfyUI-WanVideoStartEndFrames:13.5K(首尾帧视频生成)
- ComfyUI-LTXVideoLoRA:13.2K(视频LoRA)
- ComfyUI-WanStartEndFramesNative:8.8K(首尾帧视频生成)
- ComfyUI-CLIPtion:9.6K(字幕生成)
工作流/实用工具:
- ComfyUI-Apt_Preset:31.5K(预设管理器)
- comfyui-get-meta:18.0K(元数据提取)
- ComfyUI-Lora-Manager:16.1K(LoRA管理)
- cg-image-filter:11.7K(工作流执行中的交互式选择)
其他:
- ComfyUI-PanoCard:10.0K(生成360度全景图像)
关键观察与趋势分析
观察:
- 过去6个月,视频生成可能已成为很多人的默认工作流。
- 性能工具越来越受欢迎。随着模型规模增大和视频生成需求的增加,硬件限制变得更加明显。
- 前25名插件总安装量超 120万次 ,占全部新增扩展的相当大比重。
关于性能专注的自定义节点:
在过去6个月中,性能优化的自定义节点在ComfyUI社区中显著增长。以下是一些基于数据的见解,探讨这些节点的实际性能改进:
- ComfyUI-TeaCache(136.4K安装)
该节点通过缓存优化推理过程,显著减少重复计算。TeaCache通过预计算和高效缓存策略减少了生成时间,尤其在处理大型模型或视频生成时效果明显。这对于需要快速迭代的艺术家或开发者来说是关键的性能提升。 - Comfy-WaveSpeed(85.1K安装)
这是一个优化套件,可能包括批处理和指导技术(如Residual Classifier-Free Guidance,RCFG),以提高生成速度同时保持高质量输出。类似StreamDiffusion的实现表明,批处理和缓存可以显著降低延迟,尤其在实时交互生成中。 - ComfyUI-MultiGPU(79.7K安装)
针对多显卡设置的优化,适合拥有高端硬件的用户。,多显卡支持可以显著提高Flux模型等大型模型的性能,尤其在显存有限的情况下,通过分配任务到多个显卡来减少显存瓶颈。 - gguf(54.4K安装)与ComfyUI-nunchaku(35.5K安装)
这两个节点专注于模型量化(例如4位量化),显著降低内存占用并加速推理。GGUF模型加载速度更快(“加载瞬间完成”),内存和显存使用量在KSampler阶段才增加。这种方法在低显存设备(例如8GB 显卡)上特别有效,与FP16相比,FP8和GGUF模型在加载时间和内存使用上具有明显优势。 - ComfyUI-TeaCacheHunyuanVideo(35.9K安装)
专为视频生成优化的缓存解决方案,与HunyuanVideoWrapper(113.8K安装)等视频生成节点结合使用,可以减少视频生成中的冗余计算。HunyuanVideo的13B开源模型在ComfyUI中的原生支持,结合TeaCache的优化,显著提高了720p视频生成的效率。
实际性能改进:
- 速度提升:,DepthCrafter节点通过减少推理步骤(从25步到5步),将200帧896p视频的生成时间从433秒缩短到93秒,实现了约4倍的加速。类似地,ComfyUI-TeaCache和Comfy-WaveSpeed通过缓存和批处理技术显著减少了推理时间,尤其在视频生成和大型图像处理中。
- 内存效率:GGUF和nunchaku等量化节点通过降低模型精度(例如4位或8位量化)减少显存和内存使用量。GGUF模型在加载时无需页面文件,整体内存占用更低,适合低VRAM设备。
- 硬件利用率:ComfyUI-MultiGPU和相关优化节点提高了显卡利用率,FP16和GGUF模型现在更多依赖GPU而非CPU,减少了瓶颈。这对于运行Flux等资源密集型模型的用户尤其重要。
- 工作流效率:节点如ComfyUI-Apt_Preset和ComfyUI-Lora-Manager通过简化预设管理和LoRA加载,减少了手动配置时间。ComfyUI-Custom-Scripts也提到自动完成和图形自动排列等功能,进一步提升了工作流效率。
社区趋势与注意事项:
- 视频生成主导:视频生成成为默认工作流——与HunyuanVideoWrapper和WanVideoWrapper的高安装量(分别为113.8K和90.3K)以及Wan2.1和HunyuanVideo支持相符。这些节点支持高质量720p视频生成,结合TeaCache等优化工具,显著提高了视频工作流的性能。
- 硬件限制推动优化:随着模型规模增大,性能节点如TeaCache和MultiGPU变得至关重要。即便是高端GPU(如4090)在运行Wan2.1时也可能遇到显存不足问题,促使用户采用量化(GGUF)或多GPU设置。
- 兼容性挑战:频繁的ComfyUI更新可能导致自定义节点失效,迫使用户回滚版本或维护多个环境(例如Python 3.10和3.12)。这表明性能节点的有效性可能因环境配置而异,用户需谨慎管理依赖关系。
🧩 总结
过去六个月,ComfyUI 社区明显呈现出两大主线:
- 性能优化成为核心需求:TeaCache、WaveSpeed、GGUF、MultiGPU 等插件显著提升了推理效率和资源利用。
- 视频生成快速普及:HunyuanVideo、WanVideo 等插件推动 ComfyUI 向动态内容生成领域迈进。
如果你是 ComfyUI 用户,不妨尝试上述高人气插件,看看它们是否能为你的工作流带来实质性提升。同时,也欢迎在评论区分享你使用的性能优化方案和实际体验!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















