Diffusion Training Dataset Composer
Diffusion Training Dataset Composer

Diffusion Training Dataset Composer最新版

官方版无广告51

Diffusion Training Dataset Composer是一款基于 PyQt5 的图形化界面工具,专为构建适用于 LoRA/DreamBooth 和微调任务的数据集而设计,支持高度定制化的设置、错误处理机制以及友好的用户体验,非常适合需要频繁构建训练样本的用户。

更新日期:
2025年6月1日
语言:
中文
平台:

30K0 人已下载 手机查看

如果你正在为 SD(Stable Diffusion)或 Flux 系列模型准备训练数据集,那么 Diffusion Training Dataset Composer 将是一个值得尝试的高效工具。

Diffusion Training Dataset Composer

它是一款基于 PyQt5 的图形化界面工具,专为构建适用于 LoRA/DreamBooth 和微调任务的数据集而设计,支持高度定制化的设置、错误处理机制以及友好的用户体验,非常适合需要频繁构建训练样本的用户。

🧰 主要功能亮点

功能说明
三列式界面布局清晰划分“项目设置”、“源文件夹”和“正则化控制”,操作流程一目了然
LoRA/DreamBooth & 微调模式根据训练目标选择不同模式,自动适配对应逻辑
持久化设置自动记忆上次使用的路径、选项状态等偏好配置
防重命名机制相同文件名会自动添加后缀,避免覆盖风险
彩色编码文件夹每个文件夹用独特颜色标识,视觉区分清晰
正则化控制支持子文件夹选择、百分比设定,并可实时查看图像数量
种子控制提供静态随机种子,确保采样过程可重复
响应式 UI 布局界面现代、紧凑且支持缩放,适应不同分辨率屏幕
跨平台支持兼容 Windows 与 Linux 系统

📦 安装要求与步骤

✅ 运行环境依赖

  • Python 3.8 或更高版本
  • PyQt5
  • Pillow

推荐在虚拟环境中安装依赖:

pip install PyQt5 Pillow

🖥️ 启动方式

Windows 用户:

python image_sampler_tool.py

Linux 用户:

bash run_linux.sh

或直接运行

python3 image_sampler_tool.py

⚠️ 如果遇到 Qt 平台插件错误,请安装系统所需的 Qt 依赖包,例如:

sudo apt install python3-pyqt5

🛠️ 使用指南(分步说明)

1️⃣ 项目设置(左侧栏)

  • 训练模式选择
    • LoRA/DreamBooth:用于角色/主体训练,支持实例提示、类提示、重复次数设置
    • 微调模式:用于风格/概念训练,标题类型支持空白、基本、详细等
  • 目标文件夹设置
    通过“浏览”按钮指定输出目录,用于保存生成的训练数据集
  • 图像参数设置
    • 设置总图像数
    • 可选是否调整图像大小至指定像素值
    • 是否将非 PNG 图像转换为 PNG
    • 是否复制训练集 / 正则化集(仅限 LoRA/DreamBooth)
    • 种子控制(随机或固定)
    • 是否解锁文件夹百分比自由设置

2️⃣ 源文件夹管理(中间栏)

  • 添加一个或多个包含训练图像的文件夹(支持批量导入)
  • 每个文件夹拥有独立的色彩编码区域,便于区分
  • 设置每个文件夹的采样比例(%)
  • 设置该文件夹下图像的标题类型(空白、基本、详细、结构化)
  • 针对 LoRA/DreamBooth 模式可设置:
    • 实例提示词
    • 类别提示词
    • 图像重复次数
  • 支持移除文件夹、动态更新预览图像数量

3️⃣ 正则化控制(右侧栏,仅限 LoRA/DreamBooth 模式)

  • 选择包含正则化图像的文件夹
  • 开启/关闭正则化图像使用
  • 设置正则化图像占比(相对于总训练图像)
  • 支持选择子文件夹或根目录进行采样
  • 快速全选/取消全选子文件夹
  • 实时显示可用图像数与所需图像数对比

4️⃣ 执行与日志(左下角)

  • 点击“开始”启动数据集构建流程
  • 进度条与日志窗口实时反馈当前状态
  • 若目标文件夹已存在 img 或 reg 文件夹,将弹出提示让你选择“清理”或“追加”
  • 不会影响其他已有文件夹内容

💡 高级功能与实用技巧

  • 持久化设置:退出后下次打开仍保留上次配置
  • 智能文件命名:重复文件自动添加 _1, _2 后缀,防止覆盖
  • 标题样式检查:根据是否存在标题文件对标签进行颜色标记
  • 百万像素统计:提供各文件夹贡献的像素总量,帮助平衡数据分布
  • 种子复现机制:使用相同种子可重现完全一致的采样结果
  • 微调模式限制:正则化功能在此模式下不可用

🔧 常见问题与解决方案

问题解决方法
Qt 平台插件缺失在 Linux 上安装 python3-pyqt5 
无法识别图像确保图像格式为 .jpg, .jpeg, .png, .bmp, .tiff, .tif, .gif
文件夹已存在警告工具不会删除除 img/reg 外的任何文件夹,可放心选择“清理”或“追加”
权限不足确保你对目标文件夹具有写入权限

相关软件

Upscayl

Upscayl - 最新版

阿普升图是一款免费且开源的 AI 图片放大软件,通过AI技术提升低分辨率图片的分辨率和质量。它支持 Linux、macOS 和 Windows,适合个人用户和专业用户,用于处理老照片、社交媒体图片或打印用高分辨率图像。
K3U Installer

K3U Installer - 最新版

K3U Installer v2 Beta是一款功能强大、灵活且可视化的ComfyUI安装工具。它不仅简化了安装流程,还提供了丰富的配置选项和自动化支持,非常适合初次使用者和需要版本控制与自动化的高级开发者。

暂无评论

none
暂无评论...