GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

Estimated reading: 1 minute 931 views

GLIGEN模型在去年并未得到太多关注,然而它具有独特的功能,即能够将Stable Diffusion模型扩展为可定制版本,从而实现对图像内容和布局的更精确控制。此模型仅支持SD1.5模型,由于不受重视,开发者也没有对此模型进行升级。

最近,一位开发者因为找不到GLIGEN的直观图形用户界面(GUI)而决定自己开发一个并将其开源。这款名为GLIGEN GUI的应用需要与ComfyUI一起使用,允许用户指定生成图像对象的大小、位置以及它们之间的空间关系。

通过开发者提供的界面,用户可以在画布上圈定生成物体的位置,并书写相应的提示词,从而实现对生成图像中画面布局的精确控制。

如何安装

1、首先,请确保您已经成功安装了ComfyUI,并将GLIGEN模型文件下载到ComfyUI/models/gligen文件夹下

2、确保您的电脑上已经安装了Python,版本建议3.10以上。然后,使用鼠标右键单击打开终端,并输入以下命令来安装必要的依赖:

pip install flask

Flask 是一个轻量级的 Web 开发框架,由 Armin Ronacher 开发,使用 Python 语言。它的设计目的是为了快速和容易地构建 Web 应用程序。

3、下载安装GLIGEN GUI,请注意,安装位置路径中不应包含中文字符。在终端中使用以下命令进行安装:

git clone https://github.com/mut-ex/gligen-gui.git
cd gligen-gui

4、启动并运行ComfyUI,然后在之前的终端窗口,使用以下命令启动GLIGEN GUI:

flask --app 'gligen_gui:create_app(8188)' run --port 5000

注意:如果您的ComfyUI端口是8188,则无需修改上面的命令。如果不是,请将命令中的8188替换为您实际的端口号。

5、最后,在浏览器中打开http://127.0.0.1:5000,您就可以开始使用GLIGEN GUI了

创建快捷启动

1、打开一个文本编辑器,如记事本。

2、在文本编辑器中,输入以下命令:

@echo off  
set FLASK_APP=gligen_gui:create_app(8188)  
flask run --port 5000

3、保存这个文件时,将文件类型更改为.bat

4、双击这个.bat文件,它应该会启动你的GLIGEN GUI应用,并且使用指定的端口5000。

如何使用

1、启动GLIGEN GUI后的界面如下,按照图示教程进行设置,目前只支持SD1.5类模型,可添加多个Lora,在提示词处可自己进行背景、风格等方面的添加

点击放大图片

效果图:

2、也可进行图生图,上传图片后,再框选位置添加物品进行生成

效果图:

结语

可惜的是目前尚不支持SDXL模型,希望开发者们重视此模型,后续能对模型进行更新。

以上所需软件与模型,如果无法直接下载,可从本人网盘里下载:

暂无评论

none
暂无评论...
分享此文档

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

或复制链接

文章目录
EdgeOne Pages

EdgeOne Pages

EdgeOne Pages 是基于 Tencent EdgeOne 基础设施打造的全栈开发部署平台,提供从前端页面到动态 API 的无服务器部署体验,适用于构建营销网站、AI 应用等现代 Web 项目。通过边缘网络全球加速,确保应用获得快速、稳定的访问体验。
Ebook2Audiobook

Ebook2Audiobook

Ebook2Audiobook是一款将非DRM保护的电子书转换为高质量有声书的工具,并保留章节和元数据。通过结合Calibre、Coqui XTTSv2和Fairseq等开源项目,确保每本有声书听起来自然流畅。
马卡龙(Macaron AI)

马卡龙(Macaron AI)

马卡龙是超懂你的个人智能体,一句话就能生成你的专属工具。马卡龙不是又一个“效率机器人”。它温暖、有共情,会记住你是谁、你喜欢什么、你在意什么;更会把每次对话都变成能真正帮上忙的工具,让每天更省心、更有趣。
OiiOii AI

OiiOii AI

OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
QM-Music 

QM-Music 

QM-Music 是一个基于 Subsonic 构建的轻量级私有云音乐服务器,专为音乐爱好者设计的轻量级高性能解决方案。支持 Docker 一键部署,完美兼容 Subsonic 生态客户端(如音流/Amperfy/substreamer/feishin/music-assistant),让您随时随地安全访问个人音乐库。
Grok

Grok

Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
查看完整榜单