Stable Diffusion中的embedding是什么?什么是文本嵌入?

在使用Stable Diffusion进行生图的时候,我们常常会用到embedding模型,这个embedding模型是什么呢?在中文中通常被翻译为“文本嵌入”,其实也就是我们之前介绍的Textual Inversion

什么是embedding(文本嵌入)?

embedding也就是“Textual Inversion”,它允许用户通过少量的图像和自然语言描述来创建新的“伪词”(pseudo-words),这些伪词代表了特定的概念,并且可以被用来指导图像生成过程。具体可查看:文本反转Textual Inversion

embedding模型是如何工作的?

举例说明,在超市中,每个商品都有一个独特的条形码,当收银员扫描条形码时,系统会检索到与该商品相关的所有信息,如名称、价格、库存等。

在SD绘画中,embedding模型就类似于条形码,可以帮助大模型(SD模型)理解提示词(如“猫”)的复杂含义,并生成相应的图像。

在使用SD模型进行AI绘画时,正面提示词(Positive Prompts)和负面提示词(Negative Prompts)中的Embeddin模型都是为了引导AI生成符合用户期望的图像。不过,它们在应用和功能上有所不同:

正面提示词(Positive Prompts):
  • 正面提示词用于告诉AI模型你想要在图像中看到的内容。这些提示词可以是描述性的,如“高清的肖像”、“印象派风格”或“温暖的色调”等。
  • 正面提示词的Embedding模型会指导模型生成与这些描述相匹配的视觉特征。例如,如果你使用了“猫”的Embedding模型,模型就会在图像中尝试生成猫的特征。
  • 正面提示词的Embedding模型通常用于强化特定的视觉元素或风格,确保生成的图像尽可能接近用户的期望。
负面提示词(Negative Prompts):
  • 负面提示词用于告诉AI模型你不想在图像中看到的内容。这些提示词可以是避免某些风格、元素或错误的描述,如“无光晕”、“不真实的人脸”或“过多的细节”等。
  • 负面提示词的Embedding模型会指导模型避免生成与这些描述相匹配的视觉特征。例如,如果你使用了“模糊”的Embedding模型作为负面提示,模型就会尽量避免生成模糊的图像。
  • 负面提示词的Embedding模型通常用于减少或消除不希望出现的图像特征,帮助提高生成图像的质量和准确性。

在哪里可以找到embedding模型

下载embedding模型首选Civitai,在 Civitai 上找到各种各样的 Embedding 模型,SDWeb UI则是放置在stable-diffusion-webui/embeddings目录下,ComfyUI则是放在models/embeddings 文件夹下,embedding模型通常比较小,只有几十KB大小。具体使用方法在Stable Diffusion web UIComfyUI会提到。

embedding模型推荐

目前广泛使用的是“负面嵌入(negative embedding)”模型,用于解决手部崩坏、画面阴暗等问题。

EasyNegative

EasyNegative 是 Anything 和 OrangeMix 等动漫模型的负嵌入。

badhandv4

badhandv4能够在对画风影响较小的前提下改善AI生成图片的手部细节。

BadDream

BadDream 是 DreamShaper 模型的负嵌入。

UnrealisticDream

UnrealisticDream 是写实风格图像的负嵌入。您应该将其与写实模型一起使用。

embedding模型的优缺点

embedding模型的一个优点是其文件较小。由于文件大小只有100KB或更小,不占用本地空间。可以多个embedding模型一起使用。embedding模型的缺点是,有时不清楚应该与哪个模型一起使用它。

以上所需模型,如果无法直接下载,可从本人网盘里下载:
0

评论0

没有账号?注册  忘记密码?