字节跳动在今年4月份推出了PuLID,一个用于个性化文本到图像生成的模型。最初,PuLID主要基于SD1.5和SDXL模型。近期,字节跳动对其进行了多次更新,推出了PuLID-v1.1版本,并针对FLUX模型推出了PuLID-FLUX。目前,PuLID-FLUX已经支持在ComfyUI上使用。(相关:字节跳动推出PuLID:用于个性化文本到图像的生成)
最新版本
-
PuLID-v1.1:对原有模型进行了优化,提高了生成图像的质量和稳定性。 -
PuLID-FLUX:专门针对FLUX模型进行了适配,支持最新的FLUX 0.9.1版本。
- 插件:https://github.com/sipie800/ComfyUI-PuLID-Flux-Enhanced
- Demo:https://huggingface.co/spaces/yanze/PuLID-FLUX
- 模型:https://huggingface.co/guozinan/PuLID/tree/main
使用方法
1、安装插件:
-
通过ComfyUI-Manager安装PuLID插件,插件安装完成后,可以在ComfyUI中找到PuLID相关的节点。
2、设置工作流:
-
在 examples
目录下找到预设的工作流文件,将工作流文件拖入ComfyUI中,安装缺失的节点并下载相应的模型。
3、节点设置:
-
Apply PuLID Flux节点: -
FLUX 0.9.0:最佳的weight权重大约在0.8-0.95之间。1.0并不好。 -
FLUX 0.9.1:最佳的weight权重大约在0.9-1.0之间。尽管如此,0.9.1并不总是比0.9.0好。
-
-
基础模型:推荐使用 flux-dev
或其微调版本。精度非常重要,fp16最好,但可能会导致显存不足的问题。如果显存低于12GB,建议使用gguf格式模型。 -
微调模型:一些微调的 flux-dev
模型可能会有强烈的偏见,例如将面部偏向某种人种。 -
采样器选择: Euler
简单总是有效的。Euler beta
可以提供更高的质量,特别是输入图像质量较低时。
优势
-
细粒度控制:PuLID及其最新版本提供了细粒度的控制,使得生成的图像能够更准确地反映文本提示中的细节。 -
高质量生成:通过优化模型和参数设置,PuLID能够生成高质量的图像。 -
易用性:通过ComfyUI的支持,用户可以方便地使用PuLID进行个性化文本到图像的生成。
注意事项
-
显存限制:使用fp16精度的模型可能会导致显存不足的问题,建议根据显存大小选择合适的模型格式。 -
模型偏见:微调的模型可能会有偏见,使用时需要注意这一点。
评论0