TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

1,287 0

之前英伟达已经在Stable Diffusion web UI上推出了TensorRT插件，近日又联合ComfyUI开发者推出了ComfyUI插件，此插件专为英伟达GeForce RTX与 RTX显卡量身定制，确保Stable Diffusion 1.5至SDXL Turbo，乃至Stable Video Diffusion系列的运行更加流畅，全面释放RTX显卡的性能。简单来说，能够更快的生成图片。

插件地址：https://github.com/comfyanonymous/ComfyUI_TensorRT

TensorRT是英伟达推出的一个高性能深度学习推理优化器，它包括深度学习推理优化器和运行时，能够为深度学习应用提供低延迟和高吞吐量的部署推理。TensorRT能够对训练后的深度学习模型进行优化，包括量化、内核自动调整、动态张量显存、多流执行等多种优化策略，以提高模型的执行速度和效率。

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

支持的版本包括：

Stable Diffusion 1.5
Stable Diffusion 2.1
SDXL
SDXL Turbo
Stable Video Diffusion
Stable Video Diffusion-XT

使用前提：

需要一块英伟达GeForce RTX 或 NVIDIA RTX 的显卡
对于 SDXL 和 SDXL Turbo，推荐使用至少 12 GB 显存的显卡来获得最佳体验
对于 Stable Video Diffusion (SVD)，建议使用至少 16 GB 显存的显卡
对于 Stable Video Diffusion-XT (SVD-XT)，则建议使用至少 24 GB 显存的显卡

安装指南：

最简单的安装方式是通过 ComfyUI Manager ，它可以帮助你轻松完成安装。

你也可以手动安装，只需将代码仓库克隆到你的 ComfyUI/custom_nodes 文件夹，并安装所需的依赖项

cd custom_nodes 
git clone https://github.com/comfyanonymous/ComfyUI_TensorRT 
cd ComfyUI_TensorRT 
pip install -r requirements.txt

技术解析：

英伟达TensorRT 是一项技术，它可以优化 AI 模型在你的 RTX显卡上的运行，从而大幅提升性能。要做到这一点，我们需要为你的 GPU 生成专属的 TensorRT 引擎。

你可以选择构建两种类型的 TensorRT 引擎：

动态引擎（Dynamic engines ）可以适应不同的分辨率和批量大小，你可以根据最常用的设置来指定参数，以获得最佳性能。
静态引擎（Static engines）则只支持特定的分辨率和批量大小，它们提供了与动态引擎最优设置相同的性能提升。

小贴士：大部分用户可能更倾向于使用动态引擎，但如果你经常使用固定的分辨率和批量大小，静态引擎会是一个很好的选择。静态引擎还占用较少的显存；动态范围越宽，所需的显存就越多。

操作指引：

在代码仓库的 workflows 文件夹中找到不同的操作流程，直接将这些 .json 文件拖入 ComfyUI 中即可使用。

构建 TensorRT 引擎的步骤：

1. 在 ComfyUI 中添加一个模型加载点，也可以直接从workflows 文件夹中加载转换工作流

2. 选择添加静态模型 TensorRT 转换节点或动态模型 TensorRT 转换节点

3. 将模型加载节点的输出连接到 TensorRT 转换节点的模型输入端口

4. 为了更容易识别转换后的 TensorRT 模型，请给文件名加上有意义的前缀，并放在“tensorrt/”后面

在设置转换的时候，需要注意尺寸和批次，批次不宜设置过大，除非你显存大

动态转换后的TensorRT引擎，对于显存占用非常高，生成时间可能会更长

5. 点击开始提示以构建 TensorRT 引擎，生成的引擎存放在ComfyUI\output中

转换一次SD1.5动态引擎所消耗的时间

注意事项：

构建过程中，模型转换节点会有高亮提示。
关于模型转换的详细信息可以在控制台中查看。
第一次为模型生成引擎可能需要一些时间，但之后再次生成会快得多。图像生成模型的引擎生成可能需要 3-10 分钟，SVD 可能需要 10-25 分钟。SVD-XT 是一个极其庞大的模型 - 引擎构建时间可能需要一个小时。

使用 TensorRT 引擎加速图像生成：

大家从下图图示也能看出，使用了TensorRT 引擎的工作流与原工作流唯一的区别就是在K采样器的模型端口连接处，原工作流是将模型加载处与K采样器连接。

这是使用SD1.5模型使用TensorRT 引擎生成图片时间对比，快了近2秒钟时间

常见问题与限制：

ComfyUI 的 TensorRT 引擎目前还不支持 ControlNets 或 LoRAs，但未来的更新将会解决这个问题
不建议使用动态引擎，从下图可以看出使用动态引擎，显存不够大，生成的时候反而会更长
加速效果适用性广，单更推荐大家使用蒸馏模型，如LCM、PCM、SDXL-Lightning、Hyper-SD等

文章版权归作者所有，未经允许请勿转载。

个性化人物定制PuLID-FLUX：针对FLUX模型推出的PuLID版本

插件 # PuLID-FLUX # 个性化人物定制

5个月前

02180

英伟达推出Autoguidance：改进图像生成扩散模型的性能

新技术 # Autoguidance # 英伟达

10个月前

04470

英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

视频模型 # Cosmos-Transfer1 # 英伟达

4周前

0550

英伟达开源了世界上第一个人形机器人基础模型 GR00T N1，加速通用人形机器人开发

多模态模型 # GR00T N1 # 人形机器人基础模型 # 英伟达

4周前

0530

暂无评论

暂无评论...

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

没有更多了...

降低生成步数！腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

相关文章

个性化人物定制PuLID-FLUX：针对FLUX模型推出的PuLID版本

英伟达推出Autoguidance：改进图像生成扩散模型的性能

英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

英伟达开源了世界上第一个人形机器人基础模型 GR00T N1，加速通用人形机器人开发

暂无评论

文章

新阿里云无影AgentBay发布，5分钟搭建高并发Agent环境

使用ComfyUI轻松制作“苦命小人”Q版头像，教程来了！

新OpenAI即将推出GPT-4o的升级版GPT-4.1：更智能、更小巧

新爱尔兰数据监管机构调查X：欧洲用户数据是否被滥用于训练Grok？

新微软Recall功能终于来了！你的电脑将记住你的一举一动

新伊利亚·苏茨凯维的新AI公司SSI正与谷歌云展开深度合作

Google AI Studio

朱雀大模型检测

Open ASR 排行榜

Higgsfield AI

Tripo

Yourware.so

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

没有更多了...

降低生成步数！腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

相关文章

文章

标签云

网址

Google AI Studio

朱雀大模型检测

Open ASR 排行榜

Higgsfield AI

Tripo

Yourware.so