ToDo:高分辨率图像生成

预计阅读时间1 分 449 views

ToDo是Leonardo AI为提高高分辨率图像生成效率而设计的方法。现已有ComfyUI插件支持,方便用户在ComfyUI平台上使用。经过测试,此方法对于SD1.5模型表现优异,但请注意,生成的图片尺寸不宜过大,例如设置为2048x2048可能会出现图像崩坏的情况。

ToDo:高分辨率图像生成

目前,此插件尚未在ComfyUI Manager中上架,因此需要用户手动下载并安装。具体的插件安装方法,请查阅“插件安装”指南。

\ComfyUI\custom_nodes文件夹下,使用终端或命令提示符输入以下命令:

git clone https://github.com/ethansmith2000/comfy-todo.git

使用方法非常简单,只需在基础工作流上添加一个ToDo节点即可。开发者已经在插件内提供了预设的工作流,用户只需将\ComfyUI\custom_nodes\comfy-todo文件夹下的workflow文件拖入到ComfyUI界面中即可。

ToDo:高分辨率图像生成

请注意,虽然ToDo在SD1.5模型上表现良好,但对于SDXL模型,并不推荐使用此节点。

  • Downsample_depth_1:这是第一级注意力的降采样程度。

  • Downsample_depth_2:这是第二级注意力的降采样程度。

注意:对于SDXL模型,我们在第一深度并不进行注意力处理,因此Downsample_depth_1的设置将无关紧要。

1024x1024

  • Downsample_depth_1: 2.0
  • Downsample_depth_2: 1.0

1536x1536

  • Downsample_depth_1: 3.0
  • Downsample_depth_2: 1.0

2048x2048(请谨慎使用,可能会出现图像崩坏):

  • Downsample_depth_1: 4.0
  • Downsample_depth_2: 2.0

请根据实际情况调整参数,以获得最佳的图像生成效果。

暂无评论

none
暂无评论...
分享此文档

ToDo:高分辨率图像生成

或复制链接

Genspark

Genspark

Genspark 超级智能体——您的全能AI伙伴,从拨打电话、制作幻灯片到生成TikTok短视频,轻松应对日常任务。内置80+预装工具与海量数据集,更快、更可靠、更可控。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Google AI Studio

Google AI Studio

Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
Nova Act

Nova Act

亚马逊发布了其通用AI智能体(AI agent) ——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的 Nova Act 软件开发工具包(SDK),帮助开发者利用 Nova Act 构建智能体应用原型。
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
DiffSynth-Studio

DiffSynth-Studio

DiffSynth Studio 是一个开源的扩散引擎,专注于 AI 生成内容(AIGC)技术创新,特别适合学术研究。它通过连接开源扩散模型,提供尖端技术支持和新型推理能力,帮助用户探索图像和视频生成的新可能性。
查看完整榜单