GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

预计阅读时间1 分 567 views

GLIGEN模型在去年并未得到太多关注,然而它具有独特的功能,即能够将Stable Diffusion模型扩展为可定制版本,从而实现对图像内容和布局的更精确控制。此模型仅支持SD1.5模型,由于不受重视,开发者也没有对此模型进行升级。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

最近,一位开发者因为找不到GLIGEN的直观图形用户界面(GUI)而决定自己开发一个并将其开源。这款名为GLIGEN GUI的应用需要与ComfyUI一起使用,允许用户指定生成图像对象的大小、位置以及它们之间的空间关系。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

通过开发者提供的界面,用户可以在画布上圈定生成物体的位置,并书写相应的提示词,从而实现对生成图像中画面布局的精确控制。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

如何安装

1、首先,请确保您已经成功安装了ComfyUI,并将GLIGEN模型文件下载到ComfyUI/models/gligen文件夹下

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

2、确保您的电脑上已经安装了Python,版本建议3.10以上。然后,使用鼠标右键单击打开终端,并输入以下命令来安装必要的依赖:

pip install flask

Flask 是一个轻量级的 Web 开发框架,由 Armin Ronacher 开发,使用 Python 语言。它的设计目的是为了快速和容易地构建 Web 应用程序。

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

3、下载安装GLIGEN GUI,请注意,安装位置路径中不应包含中文字符。在终端中使用以下命令进行安装:

git clone https://github.com/mut-ex/gligen-gui.git
cd gligen-gui

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

4、启动并运行ComfyUI,然后在之前的终端窗口,使用以下命令启动GLIGEN GUI:

flask --app 'gligen_gui:create_app(8188)' run --port 5000

注意:如果您的ComfyUI端口是8188,则无需修改上面的命令。如果不是,请将命令中的8188替换为您实际的端口号。

5、最后,在浏览器中打开http://127.0.0.1:5000,您就可以开始使用GLIGEN GUI了

创建快捷启动

1、打开一个文本编辑器,如记事本。

2、在文本编辑器中,输入以下命令:

@echo off  
set FLASK_APP=gligen_gui:create_app(8188)  
flask run --port 5000

3、保存这个文件时,将文件类型更改为.bat

4、双击这个.bat文件,它应该会启动你的GLIGEN GUI应用,并且使用指定的端口5000。

如何使用

1、启动GLIGEN GUI后的界面如下,按照图示教程进行设置,目前只支持SD1.5类模型,可添加多个Lora,在提示词处可自己进行背景、风格等方面的添加

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制
点击放大图片

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

效果图:

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

2、也可进行图生图,上传图片后,再框选位置添加物品进行生成

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

效果图:

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

结语

可惜的是目前尚不支持SDXL模型,希望开发者们重视此模型,后续能对模型进行更新。

以上所需软件与模型,如果无法直接下载,可从本人网盘里下载:

暂无评论

none
暂无评论...
分享此文档

GLIGEN模型图形界面GLIGEN GUI:对SD生图内容和布局更精确控制

或复制链接

Genspark

Genspark

Genspark 超级智能体——您的全能AI伙伴,从拨打电话、制作幻灯片到生成TikTok短视频,轻松应对日常任务。内置80+预装工具与海量数据集,更快、更可靠、更可控。
Google AI Studio

Google AI Studio

Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Nova Act

Nova Act

亚马逊发布了其通用AI智能体(AI agent) ——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的 Nova Act 软件开发工具包(SDK),帮助开发者利用 Nova Act 构建智能体应用原型。
DiffSynth-Studio

DiffSynth-Studio

DiffSynth Studio 是一个开源的扩散引擎,专注于 AI 生成内容(AIGC)技术创新,特别适合学术研究。它通过连接开源扩散模型,提供尖端技术支持和新型推理能力,帮助用户探索图像和视频生成的新可能性。
查看完整榜单