用语音激活静态图像!ComfyUI 原生适配 Wan2.2-S2V,一键生成口型同步视频ComfyUI官方宣布,高性能音频驱动视频生成模型Wan2.2-S2V已实现原生适配——无需额外插件,即可直接在ComfyUI中调用该模型,将静态图片与音频结合,生成对话、唱歌、角色表演等动态视频内容...工作流# ComfyUI# Wan2.2-S2V# 口型同步视频3个月前01,2390
如何兼顾“创意”与“真实”?用 Qwen-Image + Wan 2.2 实现高质量图像生成阿里Qwen项目组近期发布的两款模型Qwen-Image和Wan 2.2都具有图像生成功能,但两款模型在生成图片的时候具有局限性: Qwen-Image 擅长创意构图,想象力丰富,但人物细节 AI 感...工作流# Qwen-Image# WAN 2.2# 图像生成4个月前01,2320
4步出图,文本清晰!高效推理加速Lora,Qwen-Image-Lightning来了LightX2V团队推出 Qwen-Image-Lightning —— Qwen-Image 系列的高效推理加速Lora,它在显著降低计算成本的同时,完整保留了原模型对复杂文本内容生成(如广告文案...工作流# Qwen-Image-Lightning4个月前01,2280
使用ComfyUI轻松制作“苦命小人”Q版头像,教程来了!在抖音上,“苦命小人”Q版表情包因其独特的风格和搞笑效果而备受欢迎。许多人甚至愿意花钱请人绘制这种风格的表情包,但实际上,在AI时代,我们完全可以用更高效、更低成本的方式制作它们。今天,就让我们一起探...工作流# ComfyUI# Q版头像# 苦命小人8个月前01,1020
ComfyUI已原生支持文生图模型HiDream-I1,官方发布工作流智象未来(HiDream-ai)于2025年4月7日正式开源了HiDream-I1,这是一个拥有170亿参数规模的文生图模型,采用MIT许可证发布,支持个人项目、科学研究以及商用。目前,该模型在多项基...工作流# ComfyUI# HiDream-I1# 工作流8个月前01,0370
无需GPT-4o,用ComfyUI打造梦幻吉卜力风最近,OpenAI对GPT-4o 模型进行了升级,因其强大的图片生成与编辑能力引发了广泛关注,尤其是其将各种图片转换为吉卜力风格的功能,让这一风格转换功能在社交网络上迅速走红。 无论是特朗普的肖像、流...工作流# ComfyUI# GPT-4o# 吉卜力8个月前39780
Qwen-Image-Edit 避坑指南:从 VAE 连接到尺寸适配,解决图像意外更改在使用 Qwen-Image-Edit 进行图像编辑时,不少用户会遇到图像出现意外更改(如莫名放大)的问题。这一现象并非模型本身缺陷,而是节点设置、模型尺寸要求与内部预处理逻辑共同作用的结果。 本文将...工作流# Qwen-Image-Edit3个月前08900
Wan2.2 14B FLF2V:首尾帧视频生成工作流使用指南ComfyUI官方宣布已原生支持Wan2.2 14B FLF2V(首尾帧视频生成) ,你现在可以直接在 ComfyUI 中,仅通过一张起始帧和一张结束帧图像,生成一段自然过渡的视频序列。 这一功能为创...工作流# Wan2.2 14B FLF2V# 首尾帧视频生成4个月前08770
ComfyUI原生支持Wan2.1 Fun InP :通过图像生成视频并实现首尾帧控制Wan-Fun InP 是阿里巴巴推出的开源视频生成模型,属于 Wan2.1-Fun 系列的一部分,专注于通过图像生成视频并实现首尾帧控制。 核心功能: 首尾帧控制:支持输入首帧和尾帧图像,生...工作流# ComfyUI# Wan2.1 Fun InP# 首尾帧控制8个月前08260
Wan2.1原生首尾帧视频生成工作流:支持多种模型优化节点且支持 LoRA 模型ComfyUI-WanStartEndFramesNative 是一个用于在起始图像和结束图像之间生成视频的ComfyUI节点。作为原生实现,它支持多种模型优化节点,例如GGUF、Teacache 等...工作流# TeaCache# Wan2.1 480P I2V# 首尾帧视频生成8个月前08210
ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制ComfyUI 官方宣布,LTX-Video 0.9.5 已获得全面支持!此次更新带来了闪电般的速度和全新控制水平,包括多关键帧控制、质量提升和更长的视频支持。这些功能现已完全集成到 ComfyUI ...工作流# ComfyUI# LTX-Video 0.9.5# 图生视频9个月前08210
Qwen-Image 图像生成实操指南:三大ControlNet 方案从部署到运行,新手也能上手阿里巴巴通义千问团队发布的 Qwen-Image,是首个基于 MMDiT 架构的开源图像生成基础模型,参数规模达 20B,采用 Apache 2.0 许可证开放,支持高分辨率、多轮对话式图像生成。 H...工作流# controlnet# Lora# Qwen-Image3个月前08120