GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

Estimated reading: 1 minute 610 views

GLIGEN模型在去年并未得到太多关注,然而它具有独特的功能,即能够将Stable Diffusion模型扩展为可定制版本,从而实现对图像内容和布局的更精确控制。此模型仅支持SD1.5模型,由于不受重视,开发者也没有对此模型进行升级。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

最近,一位开发者因为找不到GLIGEN的直观图形用户界面(GUI)而决定自己开发一个并将其开源。这款名为GLIGEN GUI的应用需要与ComfyUI一起使用,允许用户指定生成图像对象的大小、位置以及它们之间的空间关系。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

通过开发者提供的界面,用户可以在画布上圈定生成物体的位置,并书写相应的提示词,从而实现对生成图像中画面布局的精确控制。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

如何安装

1、首先,请确保您已经成功安装了ComfyUI,并将GLIGEN模型文件下载到ComfyUI/models/gligen文件夹下

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

2、确保您的电脑上已经安装了Python,版本建议3.10以上。然后,使用鼠标右键单击打开终端,并输入以下命令来安装必要的依赖:

pip install flask

Flask 是一个轻量级的 Web 开发框架,由 Armin Ronacher 开发,使用 Python 语言。它的设计目的是为了快速和容易地构建 Web 应用程序。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

3、下载安装GLIGEN GUI,请注意,安装位置路径中不应包含中文字符。在终端中使用以下命令进行安装:

git clone https://github.com/mut-ex/gligen-gui.git
cd gligen-gui

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

4、启动并运行ComfyUI,然后在之前的终端窗口,使用以下命令启动GLIGEN GUI:

flask --app 'gligen_gui:create_app(8188)' run --port 5000

注意:如果您的ComfyUI端口是8188,则无需修改上面的命令。如果不是,请将命令中的8188替换为您实际的端口号。

5、最后,在浏览器中打开http://127.0.0.1:5000,您就可以开始使用GLIGEN GUI了

创建快捷启动

1、打开一个文本编辑器,如记事本。

2、在文本编辑器中,输入以下命令:

@echo off  
set FLASK_APP=gligen_gui:create_app(8188)  
flask run --port 5000

3、保存这个文件时,将文件类型更改为.bat

4、双击这个.bat文件,它应该会启动你的GLIGEN GUI应用,并且使用指定的端口5000。

如何使用

1、启动GLIGEN GUI后的界面如下,按照图示教程进行设置,目前只支持SD1.5类模型,可添加多个Lora,在提示词处可自己进行背景、风格等方面的添加

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制
点击放大图片

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

效果图:

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

2、也可进行图生图,上传图片后,再框选位置添加物品进行生成

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

效果图:

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

结语

可惜的是目前尚不支持SDXL模型,希望开发者们重视此模型,后续能对模型进行更新。

以上所需软件与模型,如果无法直接下载,可从本人网盘里下载:

暂无评论

none
暂无评论...
分享此文档

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

或复制链接

文章目录
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Magi

Magi

MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频,每个视频块由固定长度的连续帧组成。这是首个具有顶级质量输出的自回归视频模型,而且还是开源的,目前Sand AI还推出了视频生成平台Magi,不过目前仅支持图生视频。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
Qwen Chat

Qwen Chat

Qwen Chat是阿里通义团队在海外市场推出了一款全新的AI助手,可以看作是通义千问的海外版,这款助手基于开源的Open WebUI框架开发而成。
Higgsfield AI

Higgsfield AI

Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
查看完整榜单