ComfyUI 自定义节点安装排行榜：性能优化和视频生成成主流

369 0

Reddit 用户 bymyself___ 分析了过去六个月中添加到 ComfyUI 自定义节点注册表的 562 个插件包，并整理出按安装量排名前 25 的插件。这些数据揭示了当前 ComfyUI 社区的主要关注方向：性能优化、视频生成、模型实现和工作流效率提升。

本文将从数据出发，结合实际使用反馈，为你解析这些热门节点的功能、性能提升效果以及背后的技术趋势。

安装量 Top 25 节点概览

性能/优化领先者：

ComfyUI-TeaCache：136.4K（用于更快推理的缓存）
Comfy-WaveSpeed：85.1K（推理优化套件）
ComfyUI-MultiGPU：79.7K（多GPU设置优化）
ComfyUI_Patches_ll：59.2K（添加了一些钩子方法，如TeaCache和First Block Cache）
gguf：54.4K（模型量化）
ComfyUI-TeaCacheHunyuanVideo：35.9K（用于更快视频生成的缓存）
ComfyUI-nunchaku：35.5K（4位量化模型）

模型实现：

ComfyUI-ReActor：177.6K（人脸交换）
ComfyUI_PuLID_Flux_ll：117.9K（PuLID-Flux实现）
HunyuanVideoWrapper：113.8K（视频生成）
WanVideoWrapper：90.3K（视频生成）
ComfyUI-MVAdapter：44.4K（多视图一致性图像）
ComfyUI-Janus-Pro：31.5K（多模态；理解和生成图像）
ComfyUI-UltimateSDUpscale-GGUF：30.9K（上采样）
ComfyUI-MMAudio：17.8K（根据视频和/或文本输入生成同步音频）
ComfyUI-Hunyuan3DWrapper：16.5K（3D生成）
ComfyUI-WanVideoStartEndFrames：13.5K（首尾帧视频生成）
ComfyUI-LTXVideoLoRA：13.2K（视频LoRA）
ComfyUI-WanStartEndFramesNative：8.8K（首尾帧视频生成）
ComfyUI-CLIPtion：9.6K（字幕生成）

工作流/实用工具：

ComfyUI-Apt_Preset：31.5K（预设管理器）
comfyui-get-meta：18.0K（元数据提取）
ComfyUI-Lora-Manager：16.1K（LoRA管理）
cg-image-filter：11.7K（工作流执行中的交互式选择）

其他：

ComfyUI-PanoCard：10.0K（生成360度全景图像）

关键观察与趋势分析

观察：

过去6个月，视频生成可能已成为很多人的默认工作流。
性能工具越来越受欢迎。随着模型规模增大和视频生成需求的增加，硬件限制变得更加明显。
前25名插件总安装量超 120万次，占全部新增扩展的相当大比重。

关于性能专注的自定义节点：

在过去6个月中，性能优化的自定义节点在ComfyUI社区中显著增长。以下是一些基于数据的见解，探讨这些节点的实际性能改进：

ComfyUI-TeaCache（136.4K安装）
该节点通过缓存优化推理过程，显著减少重复计算。TeaCache通过预计算和高效缓存策略减少了生成时间，尤其在处理大型模型或视频生成时效果明显。这对于需要快速迭代的艺术家或开发者来说是关键的性能提升。
Comfy-WaveSpeed（85.1K安装）
这是一个优化套件，可能包括批处理和指导技术（如Residual Classifier-Free Guidance，RCFG），以提高生成速度同时保持高质量输出。类似StreamDiffusion的实现表明，批处理和缓存可以显著降低延迟，尤其在实时交互生成中。
ComfyUI-MultiGPU（79.7K安装）
针对多显卡设置的优化，适合拥有高端硬件的用户。，多显卡支持可以显著提高Flux模型等大型模型的性能，尤其在显存有限的情况下，通过分配任务到多个显卡来减少显存瓶颈。
gguf（54.4K安装）与ComfyUI-nunchaku（35.5K安装）
这两个节点专注于模型量化（例如4位量化），显著降低内存占用并加速推理。GGUF模型加载速度更快（“加载瞬间完成”），内存和显存使用量在KSampler阶段才增加。这种方法在低显存设备（例如8GB 显卡）上特别有效，与FP16相比，FP8和GGUF模型在加载时间和内存使用上具有明显优势。
ComfyUI-TeaCacheHunyuanVideo（35.9K安装）
专为视频生成优化的缓存解决方案，与HunyuanVideoWrapper（113.8K安装）等视频生成节点结合使用，可以减少视频生成中的冗余计算。HunyuanVideo的13B开源模型在ComfyUI中的原生支持，结合TeaCache的优化，显著提高了720p视频生成的效率。

实际性能改进：

速度提升：，DepthCrafter节点通过减少推理步骤（从25步到5步），将200帧896p视频的生成时间从433秒缩短到93秒，实现了约4倍的加速。类似地，ComfyUI-TeaCache和Comfy-WaveSpeed通过缓存和批处理技术显著减少了推理时间，尤其在视频生成和大型图像处理中。
内存效率：GGUF和nunchaku等量化节点通过降低模型精度（例如4位或8位量化）减少显存和内存使用量。GGUF模型在加载时无需页面文件，整体内存占用更低，适合低VRAM设备。
硬件利用率：ComfyUI-MultiGPU和相关优化节点提高了显卡利用率，FP16和GGUF模型现在更多依赖GPU而非CPU，减少了瓶颈。这对于运行Flux等资源密集型模型的用户尤其重要。
工作流效率：节点如ComfyUI-Apt_Preset和ComfyUI-Lora-Manager通过简化预设管理和LoRA加载，减少了手动配置时间。ComfyUI-Custom-Scripts也提到自动完成和图形自动排列等功能，进一步提升了工作流效率。

社区趋势与注意事项：

视频生成主导：视频生成成为默认工作流——与HunyuanVideoWrapper和WanVideoWrapper的高安装量（分别为113.8K和90.3K）以及Wan2.1和HunyuanVideo支持相符。这些节点支持高质量720p视频生成，结合TeaCache等优化工具，显著提高了视频工作流的性能。
硬件限制推动优化：随着模型规模增大，性能节点如TeaCache和MultiGPU变得至关重要。即便是高端GPU（如4090）在运行Wan2.1时也可能遇到显存不足问题，促使用户采用量化（GGUF）或多GPU设置。
兼容性挑战：频繁的ComfyUI更新可能导致自定义节点失效，迫使用户回滚版本或维护多个环境（例如Python 3.10和3.12）。这表明性能节点的有效性可能因环境配置而异，用户需谨慎管理依赖关系。