Qwen-Image 图像生成实操指南:三大ControlNet 方案从部署到运行,新手也能上手阿里巴巴通义千问团队发布的 Qwen-Image,是首个基于 MMDiT 架构的开源图像生成基础模型,参数规模达 20B,采用 Apache 2.0 许可证开放,支持高分辨率、多轮对话式图像生成。 H...工作流# controlnet# Lora# Qwen-Image3个月前08120
别忘了 ControlLoRA:轻量化 ControlNet 的高效方案随着大模型不断升级,显存消耗也水涨船高。在追求高画质生成的同时,我们不应忽视那些能显著提升效率的经典技术。 ControlLoRA —— 作为 ControlNet 的 LoRA 化版本,正是一种兼顾...插件# ControlLoRA# controlnet4个月前02280
FramePack:用神经网络破解视频生成难题,能够将输入上下文压缩至固定长度,使生成工作量不受视频长度影响视频生成技术一直是AI领域的热门研究方向之一。然而,现有的视频生成模型在处理长视频时常常面临两大挑战:一是“遗忘”问题,模型难以记住早期的视频内容,导致生成的视频缺乏连贯性;二是“漂移”问题,随着视频...视频模型# controlnet# FramePack# Lvmin Zhang7个月前04100
Liblib AI推出基于 ControlNet 框架RepText:实现中文文本的准确生成在当今的文本到图像生成领域,尽管模型在生成视觉上吸引人的图像方面取得了显著进步,但在处理精确且灵活的排版元素时,尤其是对于非拉丁字母,仍然存在明显的局限性。这种局限性主要源于文本编码器在处理多语言输入...新技术# controlnet# Liblib AI# RepText7个月前03910
FLUX.1-dev-ControlNet-Union-Pro-2.0:Shakker Labs发布的新一代ControlNet,功能升级,性能优化!Shakker Labs近期发布了FLUX.1-dev-ControlNet-Union-Pro-2.0,这是FLUX.1-dev模型的升级版统一ControlNet。该版本在功能和性能上都进行了显著...Flux衍生# controlnet# FLUX.1-dev-ControlNet-Union-Pro-2.0# Shakker Labs8个月前01,2060
ComfyUI v0.3.0版本正式推出,支持FLUX.1 Tools系列开源模型在Black Forest Labs发布了FLUX.1 Tools系列开源模型以后,ComfyUI也在第一时间宣布支持这些模型,并且v0.3.0版本也正式释出。ComfyUI现在支持来自Black F...工作流# ComfyUI v0.3.0# controlnet# Fill1年前04410
Controlnet作者lllyasviel新开源项目Omost:将大语言模型的编程能力转化为图像合成能力Controlnet作者lllyasviel的新开源项目Omost,这是一个将大语言模型的编程能力转化为图像合成能力的项目。项目名称“Omost”(发音类似于“almost”,意为“几乎”)蕴含双重意...新技术# controlnet# lllyasviel# Omost2年前07510
ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...新技术# controlnet# 可控性# 文生图模型2年前08580
Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...新技术# controlnet# IC-Light# 打光2年前09010
开源人像生成器InstantID:只需一张人脸照片,快速生成不同风格的人物照片开源人像生成器InstantID今天在推特引发了热议,InstantID只需要一张人脸照片,就能快速生成多种风格的人物照片,无需复杂的训练或微调过程。InstantID还能与流行的图像扩散模型(如 S...新技术# controlnet# InstantID# LCM2年前08660