ComfyUI 首发支持 FLUX.2:本地/云端/合作节点三重方案,开箱即用黑森林实验室刚刚开源了 FLUX.2。ComfyUI 的首发日支持现已上线!FLUX.2 是下一代图像模型,可生成高达 400 万像素的照片级真实感输出,在光照、皮肤、织物和手部细节方面表现大幅提升...工作流# FLUX.22个月前0730
字节跳动Seedream 4.0 正式接入 ComfyUI:一模型打通生成与编辑全流程ComfyUI官方宣布字节跳动的Seedream 4.0 已集成至 ComfyUI,通过官方 API 节点即可直接调用,无需额外部署,开箱即用。 这一次更新不只是“多一个模型选项”,而是带来了一种全新...工作流# ComfyUI# Seedream 4.0# 字节跳动5个月前08270
Nunchaku 正式发布 1.0:让 Qwen-Image 与 Qwen-Image-Edit 模型在低显存设备上跑起来9月4日,Nunchaku 团队正式发布 v1.0.0 版本,标志着这一面向 4 位量化神经网络(SVDQuant) 的高性能推理引擎进入稳定可用阶段。 GitHub:https://github.c...工作流# Nunchaku# Nunchaku v1.0.0# Qwen-Image5个月前01,5800
ComfyUI 中使用 Stable Audio 2.5 API:文本转音频、音频转换与修复完整指南随着 Stability AI 发布 Stable Audio 2.5 ——首个专为大规模企业级音效制作设计的 AI 音频模型,其官方 API 已正式集成至 ComfyUI,支持开发者和创意团队通过可...工作流# ComfyUI# Stable Audio 2.55个月前04060
字节跳动 USO 模型 ComfyUI 原生工作流指南:实现风格与主体统一的 AI 生成在 AI 图像生成中,两个核心挑战长期并存: 主体一致性:如何让同一个角色在不同场景中保持身份不变? 风格迁移:如何将参考图的艺术风格准确迁移到新内容上? 传统方案往往需要多个模型、复杂调参,或依赖 ...工作流# USO 模型# 字节跳动5个月前09310
用语音激活静态图像!ComfyUI 原生适配 Wan2.2-S2V,一键生成口型同步视频ComfyUI官方宣布,高性能音频驱动视频生成模型Wan2.2-S2V已实现原生适配——无需额外插件,即可直接在ComfyUI中调用该模型,将静态图片与音频结合,生成对话、唱歌、角色表演等动态视频内容...工作流# ComfyUI# Wan2.2-S2V# 口型同步视频5个月前01,5530
Nano-banana 来了!通过 ComfyUI 原生节点调用 Gemini 2.5 Flash 图像模型一个轻量但高效的图像生成模型——Nano-banana(即 Google 的 Gemini 2.5 Flash 图像模型)现已接入 ComfyUI,通过原生 API 节点实现无缝集成。 你无需离开熟悉...工作流# Gemini 2.5 Flash# nano-banana5个月前02,8200
Qwen-Image 图像生成实操指南:三大ControlNet 方案从部署到运行,新手也能上手阿里巴巴通义千问团队发布的 Qwen-Image,是首个基于 MMDiT 架构的开源图像生成基础模型,参数规模达 20B,采用 Apache 2.0 许可证开放,支持高分辨率、多轮对话式图像生成。 H...工作流# controlnet# Lora# Qwen-Image5个月前01,0810
Qwen-Image-Edit 避坑指南:从 VAE 连接到尺寸适配,解决图像意外更改在使用 Qwen-Image-Edit 进行图像编辑时,不少用户会遇到图像出现意外更改(如莫名放大)的问题。这一现象并非模型本身缺陷,而是节点设置、模型尺寸要求与内部预处理逻辑共同作用的结果。 本文将...工作流# Qwen-Image-Edit5个月前01,1910
ComfyUI原生支持Qwen-Image-Edit:实现 SOTA 级图像编辑,4 步快速出图Qwen-Image-Edit 是基于 Qwen-Image 20B 模型进一步训练的图像编辑专用版本,由通义实验室推出。它不仅继承了 Qwen-Image 在文本渲染方面的强大能力,更实现了对图像内...工作流# ComfyUI# Qwen-Image-Edit5个月前02,0820
ComfyUI 原生支持 Wan2.2 Fun:首尾帧控制与多模态视频生成全面集成ComfyUI 社区迎来重要更新!现已原生支持阿里巴巴 PAI 团队推出的 Wan2.2 Fun 系列视频生成模型,包括 Wan2.2 Fun InP 与 Wan2.2 Fun Control,并集成...工作流# ComfyUI# Wan2.2 Fun Control# Wan2.2 Fun InP6个月前01,8650
4步出图,文本清晰!高效推理加速Lora,Qwen-Image-Lightning来了LightX2V团队推出 Qwen-Image-Lightning —— Qwen-Image 系列的高效推理加速Lora,它在显著降低计算成本的同时,完整保留了原模型对复杂文本内容生成(如广告文案...工作流# Qwen-Image-Lightning6个月前01,3630