界面(基础工作流创建)

Estimated reading: 2 minutes 795 views

在了解完ComfyUI基础知识、安装、模型导入及插件安装后,大家就可以进行AI生图的工作了,但我还是建议大家先对ComfyUI的界面及操作有个初步了解,现在就给大家介绍。

界面(基础工作流创建)

在开始本章的学习钱,请先确保你已经按照之前篇章所介绍的方法安装好ComfyUI、插件及导入相应模型。

打开ComfyUI 后,你就能看到下面这样一个默认的工作流界面,如果没有看到此界面,可点击右侧面板的加载默认按钮,就会加载出此工作流。

界面(基础工作流创建)
图片可以点击放大

对于习惯了使用Stable Diffusion web UI(以下简称:SD web UI)的朋友,看到此界面上的线条和方块肯定一脸懵逼,其实使用此工作流已经可以正常生成图片。

这些方块就是节点(Node),一个节点就是一个功能模块,这些线条就是将这些节点进行连接,将各个功能模块连接在一起组成一个完整的工作流程,接下来将此默认工作流分拆进行讲解。

我们将一步一步复刻上面的默认工作流,然后讲解此工作流上的每个节点。

1、在ComfyUI界面,【鼠标右键点击-新建节点-加载器-Checkpoint加载器(简易)

我们在加载器选项中能看到非常多加载器,如果你使用过SD web UI,一定对于这些加载器名字不陌生,不过我们先不要管其他加载器

界面(基础工作流创建)

2、点击“Checkpoint 名称”位置就可以选择我们需要的模型,此加载器就是用来加载大模型,目前主流的大模型有SD1.5、SDXL、SDXL-Turb及衍生的第三方模型,大家可以在模型这章进行了解。

我们在使用SD web UI时候,有正反提示词输入框,这个输入框在ComfyUI就是CLIP 文本编码器,我们需要新建两个CLIP 文本编码器节点当正反提示词输入框。

1、同样的方法,在界面上【鼠标右键点击-新建节点-条件——CLIP文本编码器】,我们需要新建两个当正、反提示词输入框

界面(基础工作流创建)

2、我们可以修改输入框的标题和颜色,用以区分两个节点。我们在节点上【鼠标右键点击】就可以看到标题、颜色、形状等选项,根据自己的需求进行修改

界面(基础工作流创建)

新建这些节点后,就需要使用线条将节点连接,在“Checkpoint 加载器”和“CLIP 文本编码器”上面都有一个同样名称、同样颜色的黄点“CLIP”,我们将鼠标放在上面会有“十”字标识,左键按住拖到另一个节点的对应位置就连上了。

界面(基础工作流创建)

节点的连接需要遵守以下规则,大致可以分为:

  • 同类相连:只有同类才能相互连接起来,每个节点上都有连接点,连接点也标注好了名称,同名的连接点才可以进行连接,比如上面提到的黄点“CLIP”

  • 左入右出:一个节点如果左右两边都有连接点,那么左边就是输入端,右边就是输出端,连接的原则就是输出端与输入端连接,不能输入连输入、输出连输出。

  • 一进多出一个输出端可与多个输入端相连接,但一个输入端只能与一个输出端想连接,你可以理解为一个信息可以输出给多个节点进行处理。

K采样器就是将SD web UI上多个设置项(采样器、CFG Scale、迭代步数等)集成在一个节点上。

1、同样的方法,在界面上【鼠标右键点击-新建节点-采样——K采样器

界面(基础工作流创建)

2、我们可以在新建的K采样器上看到7个设置选项,有不少是与SD web UI相同,以下就给大家做个简介,之后一些选项会做详解:

  • 随机种子(seed):随机种子,主要是用于控制潜空间生图的初始噪声。如果你想复刻他人的图片,那么随机种子和提示词一定要设置相同才可以。

  • 运行后操作(control_after_generate):每次生成图片后,随机种子数字都会发生变化,此配置项就是设置这个变化规则:randomize(随机)、increment(递增 1)、decrement(递减 1)、fixed(固定),我们一般使用固定和随机。

  • 步数(step:采样的步数,也就是去除噪波的次数,一般步数越大,效果越好,但还是要根据模型与采样器进行设置。

  • 调度器(scheduler):调度器主要是控制每个步骤中去噪的过程,不同的调度器算法不同,一般选择normal 或 karras。

  • 降噪(denoise):表示要增加多少初始噪声,这与步数也有关系,1 就是我们 100%的按照上方输入的步数去完成,0.1 就是 10%,一般文生图你都可以默认将其设置成 1。

界面(基础工作流创建)

3、连线,按照上面的连线规则,将“模型”和Checkpoint 加载器的“模型”相连,“正向提示词”和“正面条件”相连,“反向提示词”和“负面提示词的条件”相连,剩下的“Latent”将用来连接下个新建节点

此节点就是用来设置生成图片大小和数量

1、同样的方法,在界面上【鼠标右键点击-新建节点-latent——空 Latent

界面(基础工作流创建)

2、也可以鼠标点击K采样器上的“Latent”往外拉,松开然后选择“空 Latent”,即可自动创建空 Latent节点并直接连线上

界面(基础工作流创建)

3、对于图片大小设置和生成批次,应该根据模型和自己的硬件配置来进行设置,需要注意的是宽度和高度数字尽量设置能被8整除,不如生成的图片质量会很差

比例SD 1.5SDXL
1:1(正方形)512x512、768x7681024x1024、768x768
3:2(横向)768x5121152x768
2:3(纵向)512x768768x1152
4:3(横向)768x5761152x864
3:4(纵向)576x768864x1152
16:9(宽屏912x5121360x768
9:16 (竖屏)512x912768x1360

VAE(即变分自编码器)在Stable Diffusion模型中是一个非常重要的组成部分,具体来说,它通过对变分自编码器进行改进,提高了生成样本的质量和多样性。

1、同样的方法,可以使用新建节点,也可以使用上面空 Latent的方法,直接在K采样器上左键拖拽新建VAE 解码,需要注意的是此工作流需要的是解码而不是加载;将VAE 解码上的VAE与Checkpoint 加载器上的VAE相连接

界面(基础工作流创建)

2、目前很多模型包含了VAE模型,如果你的模型不包含VAE模型,那么你可以新建一个VAE 加载器(鼠标右键点击-新建节点-加载器-VAE 加载器),这样你就可以选择VAE模型了

界面(基础工作流创建)

此节点自然就是保存生成后的图片

1、同样的方法,可以使用新建节点【鼠标右键点击-新建节点-图像——保持图像】,也可以使用左键拖拽创建

界面(基础工作流创建)

2、其实我们有两种选择“保存图像”和“预览图像”,保存图像就是把生成的图像保存到ComfyUI安装目录下的output文件夹内,保存图像同样具有预览的功能。

1、按照上面的步骤,你就可以创建一个基本的文生图工作流,我们选择模型、输入关键词、设置步数、采样器等就可以进行生成图像

2、点击右侧设置面板的“提示词队列”或者“ctrl+回车”进行生成测试。如果出图成功,就说明我们创建的工作流没问题

界面(基础工作流创建)

3、点击右侧面板的保持按钮,就可以将自己创建的工作流保持下来,而在生图过程中进行到哪一步,哪一个节点就会有绿色的框。

ComfyUI的开发者已经在GitHub页面给出了快捷键,大家使用快捷键可以更快的建立节点,进行生图炒作,不必每次都右键点击创建节点:‘

  • Clrt+C:复制,Clrt+V:粘贴,Clrt+Shift+V:带节点连接线粘贴
  • 点击鼠标右键:会弹出一个菜单,你可以在里面找到需要添加的节点。
  • 双击鼠标左键:打开节点搜索框,可搜索想要的节点,方向键上下选择节点,点击回车就能添加到画布上
  • Ctrl + Enter:生成图片
  • Ctrl + D: 加载默认工作流
  • H:隐藏/显示历史记录面板,此面板会记录你的操作历史,与PS的操作历史相同,你可点击回退到之前的状态

以上是常用快捷键,下面是完整快捷键列表:

快捷键说明
Ctrl + Enter效果等同于点击右侧面板上的添加提示词队列按钮
Ctrl + Shift + Enter将当前图作为首个任务进行生成
Ctrl + Z/Ctrl + Y撤销/重做
Ctrl + S保存工作流
Ctrl + O加载工作流
Ctrl + A 全选节点
Alt + C折叠/展开选中的节点
Ctrl + M静音/取消静音选中的节点
Ctrl + B绕过选中的节点(效果相当于从图中移除该节点,并重新连接线路)
Delete/Backspace删除选中的节点
Ctrl + Delete/Backspace删除当前图
Space当按住并移动光标时,移动画布
Ctrl/Shift + Click将点击的节点添加到选择中
Ctrl + C/Ctrl + V复制并粘贴选中的节点(不保持与未选中节点输出的连接)
Ctrl + C/Ctrl + Shift + V复制并粘贴选中的节点(保持从未选中节点的输出到粘贴节点的输入的连接)
Shift + Drag同时移动多个选中的节点
Ctrl + D加载默认工作流
Q切换队列的可见性
H切换历史的可见性
R刷新图
双击鼠标左键打开节点快速搜索面板

暂无评论

none
暂无评论...
分享此文档

界面(基础工作流创建)

或复制链接

文章目录
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Daan

Daan

Daan 是一款简洁、高效的LLM客户端,适合那些希望快速上手并享受流畅AI体验的用户。它不仅支持多种模型和API,还提供了丰富的个性化设置,让你能够根据自己的需求打造专属的AI助手。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
Genspark

Genspark

Genspark 超级智能体——您的全能AI伙伴,从拨打电话、制作幻灯片到生成TikTok短视频,轻松应对日常任务。内置80+预装工具与海量数据集,更快、更可靠、更可控。
MinerU

MinerU

MinerU是一款功能强大、操作简单的文档解析工具。它不仅支持多种格式和导入方式,还能精准提取复杂元素,适用于多种场景。无论是学术研究、数据分析还是日常办公,MinerU都能为你带来流畅、准确的解析体验。在科研、学习和工作中,处理复杂文档格式一直是一个让人头疼的问题。无论是科技文献中的公式、表格,还是多语言扫描版PDF,传统工具往往难以满足高效、精准的解析需求。而今天要介绍的 MinerU,正是一款专为解决这些问题而生的免费文档解析神器。它不仅能精准提取复杂元素,还支持多种格式一键转换,适用于从机器学习到大模型语料生产的多种场景。 全格式兼容,轻松导入 MinerU 的一大亮点是其强大的格式兼容性。无论你的文档是 PDF、Word、PPT 还是图片,MinerU 都能轻松应对。通过简单的拖拽、截图或批量上传,你就可以快速将文件导入工具中,无需繁琐的操作。 支持格式:PDF、Word、PPT、图片等主流文档类型。 操作便捷:拖拽、截图、批量上传,一键完成导入。 智能识别:自动检测扫描版PDF和乱码PDF,并启用OCR功能,支持84种语言的检测与识别。 复杂元素精准提取 对于科技文献、学术论文等包含复杂排版的文档,MinerU 表现尤为出色。它能够精准定位并提取图表、公式等复杂元素,确保内容完整且语义连贯。 精准定位:自动识别文档中的图表、公式、表格等复杂元素,并进行精准提取。 结构保留:输出结果保留原文档的标题、段落、列表等结构,确保逻辑清晰。 多模态解析:支持图像描述、表格标题、脚注等内容的提取,适配多种使用场景。 多场景极速输出 MinerU 不仅擅长解析文档,还提供了丰富的输出格式选择,满足不同场景的需求。无论是用于机器学习训练、大模型语料生产,还是构建 RAG(检索增强生成)系统,MinerU 都能提供高效的解决方案。 多种输出格式: Markdown:适合多模态与NLP任务。 JSON:按阅读顺序排序,便于后续处理。 LaTeX:自动识别并转换公式,极大提升科研效率。 HTML:自动转换表格,方便网页展示。 可视化支持:提供 layout 可视化、span 可视化等功能,便于高效确认输出效果与质检。 技术亮点与性能优化 MinerU 在技术层面同样表现出色,兼顾了易用性与性能优化: 跨平台支持:兼容 Windows、Linux 和 Mac 平台,满足不同用户的设备需求。 硬件加速:支持纯 CPU 环境运行,同时可选 GPU(CUDA)、NPU(CANN)、MPS 加速,显著提升处理速度。 高精度 OCR:针对扫描版PDF和乱码文档,MinerU 内置高精度OCR功能,支持84种语言的检测与识别。 主要功能一览 MinerU 的核心功能覆盖了文档解析的方方面面,帮助用户高效完成复杂的文档处理任务: 删除冗余元素:自动移除页眉、页脚、脚注、页码等内容,确保输出文本语义连贯。 阅读顺序优化:输出符合人类阅读习惯的文本,无论是单栏、多栏还是复杂排版都能轻松应对。 公式与表格转换: 自动识别并转换公式为 LaTeX 格式。 自动识别并转换表格为 HTML 格式。 多语言支持:OCR 功能支持84种语言,满足国际化需求。 灵活输出:支持多种格式输出(Markdown、JSON、LaTeX、HTML 等),适配多种应用场景。 适用场景广泛 MinerU 的设计初衷是为了服务于科研和技术发展,但它的应用范围远不止于此。以下是一些典型的应用场景: 机器学习与大模型训练:将大量文档转化为高质量的训练数据,助力模型语料生产。 RAG 系统构建:为检索增强生成系统提供结构化数据支持。 学术研究:快速解析科技文献,提取关键信息,提升科研效率。 企业办公:批量处理合同、报告等文档,节省人工整理时间。 为什么选择 MinerU? 相比其他文档解析工具,MinerU 的优势在于其全面性和精准性。它不仅能够处理各种复杂文档,还能根据用户需求输出多样化的结果。更重要的是,MinerU 完全免费,且持续优化以解决科技文献中的符号转化问题,为大模型时代的技术进步贡献力量。
查看完整榜单