bigger breasts and butts

233 00

bigger breasts and butts是专为图像编辑模型 FLUX.1 Kontext [dev]训练的一个LoRA,用于微调胸部和臀部尺寸,输出可重复输入以增强效果或调整LoRA权重。

作者
ultraautism
触发词
make the woman's breasts larger and her hips wider
基础模型
FLUX.1 Kontext dev
bigger breasts and butts

bigger breasts and butts是专为图像编辑模型 FLUX.1 Kontext [dev]训练的一个LoRA,用于微调胸部和臀部尺寸,输出可重复输入以增强效果或调整LoRA权重。对于此模型, 训练者ultraautism 还发布了自己的训练心得。

PS:由于ultraautism使用fal.ai训练,其模型无法在ComfyUI-nunchaku 中正常加载,本人已使用之前介绍的ComfyUI-RBG-LoRA-Converter插件进行了转换,大家可以从网盘下载修改版的模型进行使用。

核心目标:打造“可重复使用”的图像编辑工具

该 LoRA 的设计初衷是:

  • 实现对图像中特定语义属性(如胸部、臀部尺寸)的可控编辑;
  • 保持其余内容(服装、姿势、光照、背景)不变;
  • 支持跨风格应用(真实风格 ↔ 动漫风格);
  • 可多次迭代增强效果,类似 3D 建模中的“参数滑块”。

与传统“滑块 LoRA”不同,这类模型并非通过文本嵌入间接影响生成,而是直接学习图像对之间的变换规律,因此具备更强的上下文理解能力。

训练数据构建:精准控制变量是关键

训练数据集由 50 对图像组成,使用 3D 虚拟角色平台 Virt-a-Mate(VAM) 渲染生成。

每对图像包含同一角色的两种状态:

  • 原始形态:较小胸部与臀部;
  • 目标形态:增大后的胸部与臀部;

所有图像在以下维度保持完全一致:

  • 姿势(共约 45 种)
  • 服装(约 30 套)
  • 光照与背景
  • 相机角度(50 种)
  • 角色位置与镜头构图

✅ 优势:VAM 支持“仅调整单一参数”(如胸部大小),其他变量不受影响,确保训练数据的“干净性”。

此外,数据集中包含 21 对双人图像(男女同框),其中仅女性身体发生变化,用于测试模型的选择性编辑能力。

训练过程:低成本、高效率

  • 平台fal.ai(云端训练服务)
  • 步数:2000 步(学习率 0.0001)
  • 耗时:约 30 分钟
  • 成本:2.5 美元

作者选择云端训练以释放本地 GPU 资源,用于生成更多数据集。他认为,对于此类小规模任务,付费换时间是合理选择

📌 注:测试表明,1000 步通常已足够,适合快速迭代。

✅ 实际表现:优势与局限并存

优势:

  • 跨风格泛化能力强:在真实风格与动漫风格图像上均有效;
  • 复杂姿势处理良好:得益于多样化的训练姿态;
  • 支持着装与裸体图像
  • 编辑结果自然,未出现明显伪影(单次使用);
  • 无需重绘整个图像,适合精细化调整。

局限:

  1. 编辑幅度有限:输出变化约为训练数据变化的 50%。若需更大调整,需将输出反复输入,但多次迭代会导致图像质量下降(噪点、色彩偏移、细节丢失)。
  2. 多主体编辑缺乏选择性:在男女同框图像中,尽管训练目标仅为修改女性,但部分生成结果显示男性身体也被轻微影响,表明模型尚未完全理解“仅作用于特定角色”。
  3. 服装细节仍需修补:对于复杂纹理(针织、皮革、透明材质),LoRA 可能导致服装变形,通常需要后续手动修补(inpainting)。

相关图书

Blur Background和Unblur Background

Blur Background和Unblur Background

Blur Background 与 Unblur Background 是一次对生成图像“后期控制前移”的有益尝试。它们不追求极致的图像修复能力,而是以轻量 LoRA 的形式,为创作者提供一种在生成过程中直接干预背景清晰度的手段。
Flux Kontext Zoom Out LoRA

Flux Kontext Zoom Out LoRA

Flux Kontext Zoom Out LoRA 是一款专为图像编辑模型 FLUX.1 Kontext [dev] 训练的 LoRA模型,实现高质量的图像“放大”或“画布外扩”(zoom out)效果。
Fix JPEG artifacts compression lora

Fix JPEG artifacts compression lora

Fix JPEG artifacts compression lora是一款基于图像编辑模型Flux Kontext开发的微调LoRA模型,此模型是用来修复JPEG压缩伪影。
Kontext-Emoji-LoRA

Kontext-Emoji-LoRA

Kontext-Emoji-LoRA是一个用于风格迁移的模型,基于FLUX.1-Kontext-dev 训练,适用于人类形象的emoji风格化任务,可在 ComfyUI 中使用。

暂无评论

none
暂无评论...