LOADING STUFF...

ToDo:高分辨率图像生成

Estimated reading: 1 minute 494 views

ToDo是Leonardo AI为提高高分辨率图像生成效率而设计的方法。现已有ComfyUI插件支持,方便用户在ComfyUI平台上使用。经过测试,此方法对于SD1.5模型表现优异,但请注意,生成的图片尺寸不宜过大,例如设置为2048x2048可能会出现图像崩坏的情况。

ToDo:高分辨率图像生成

目前,此插件尚未在ComfyUI Manager中上架,因此需要用户手动下载并安装。具体的插件安装方法,请查阅“插件安装”指南。

\ComfyUI\custom_nodes文件夹下,使用终端或命令提示符输入以下命令:

git clone https://github.com/ethansmith2000/comfy-todo.git

使用方法非常简单,只需在基础工作流上添加一个ToDo节点即可。开发者已经在插件内提供了预设的工作流,用户只需将\ComfyUI\custom_nodes\comfy-todo文件夹下的workflow文件拖入到ComfyUI界面中即可。

ToDo:高分辨率图像生成

请注意,虽然ToDo在SD1.5模型上表现良好,但对于SDXL模型,并不推荐使用此节点。

  • Downsample_depth_1:这是第一级注意力的降采样程度。

  • Downsample_depth_2:这是第二级注意力的降采样程度。

注意:对于SDXL模型,我们在第一深度并不进行注意力处理,因此Downsample_depth_1的设置将无关紧要。

1024x1024

  • Downsample_depth_1: 2.0
  • Downsample_depth_2: 1.0

1536x1536

  • Downsample_depth_1: 3.0
  • Downsample_depth_2: 1.0

2048x2048(请谨慎使用,可能会出现图像崩坏):

  • Downsample_depth_1: 4.0
  • Downsample_depth_2: 2.0

请根据实际情况调整参数,以获得最佳的图像生成效果。

暂无评论

none
暂无评论...
分享此文档

ToDo:高分辨率图像生成

或复制链接

文章目录
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Magi

Magi

MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频,每个视频块由固定长度的连续帧组成。这是首个具有顶级质量输出的自回归视频模型,而且还是开源的,目前Sand AI还推出了视频生成平台Magi,不过目前仅支持图生视频。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
Qwen Chat

Qwen Chat

Qwen Chat是阿里通义团队在海外市场推出了一款全新的AI助手,可以看作是通义千问的海外版,这款助手基于开源的Open WebUI框架开发而成。
Higgsfield AI

Higgsfield AI

Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
查看完整榜单