Klok Caption Tagger :用于AI图像生成的训练数据集管理工具

工具2天前发布 小马良
10 0

Klok Caption Tagger 是一款功能强大的基于浏览器的工具,专门用于创建和管理AI图像生成的训练数据集,例如为 Z-ImageStable DiffusionFLUXIllustrious 等模型制作 LoRA

KCT 简化了繁琐的训练图像准备工作,提供了一系列客户端工具,包括AI驱动的自动标注、自动描述生成以及递归文件夹管理。它完全在浏览器中运行,确保您的数据私密与安全。

  • 支持从文件夹/目录、单张图片与文本文件,或压缩包上传图像
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具
  • 可选择五种免费的 Gemini 模型,或输入付费 API 密钥使用 OpenAI 或 Claude 的模型
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具
  • 内置带有描述说明的系统提示词,您可以编辑或完全删除。您也可以创建自己的提示词!
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具
  • 为不了解如何正确标注的新手用户提供实用指导
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具
  • 使用简单的内置画图工具裁剪图像或移除文字/水印
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具

核心功能

  • 递归文件夹支持:加载根文件夹,KCT 将自动加载其中的所有图像,并保持子文件夹结构
  • 多模型 AI 支持
    • Google Gemini:提供免费额度
    • OpenAI:支持 GPT-4o 及变体(需付费 API 密钥)
    • Anthropic:支持 Claude 3.5 Sonnet/Haiku(需付费 API 密钥)
  • 智能自动标注与描述生成
    • 批量控制:可选择忽略现有文本、追加至末尾或完全覆盖
    • 重试逻辑:自动重试失败的 API 请求(最多3次),并设冷却时间以优雅处理速率限制
    • 提示词预设:保存您喜爱的系统提示词,并可即时切换
  • 灵活导出
    • 保存为 ZIP:将整个数据集结构下载为压缩文件
    • 保存到文件夹:将文本文件直接导出回本地文件夹,保留目录布局和现有文件名
  • 全局触发词:轻松设置一个触发词,并自动将其作为每个描述的开头
  • 数据持久化:工具会记住您的 API 密钥、模型选择和预设设置
  • 标签管理
    • 标签查看器:分析整个数据集的标签使用频率
    • 标签模式与描述模式:切换界面以优化逗号分隔标签或段落文本描述的编辑

与原版 TagPilot 的差异

  • 不重命名图像:KCT 尊重您现有的文件名。导出时,它会保留原始名称和目录结构
  • 直接文件系统访问:现在支持直接写入磁盘,同时也可导出为 ZIP 文件

设置与安装

由于 KCT 是客户端应用,因此无需 Python 后端或 Node.js 服务器

  1. 克隆或下载仓库
    git clone https://github.com/Klokinator/KlokCaptionTagger.git
    
  2. 运行应用:双击 KlokCaptionTagger.html 在浏览器中打开即可

使用流程

  1. 加载数据:选择文件夹或上传压缩包
  2. 配置模型:点击“Model Settings”,选择服务提供商,输入 API 密钥,并选择具体模型
  3. 标注/描述生成:点击“Tag All”或“Caption All”,选择预设或自定义系统提示词,设置限制条件后开始
  4. 裁剪与绘图:使用裁剪/编辑按钮调整图像,或涂抹移除不需要的文字和水印
  5. 审查:使用标签查看器全局清理不需要的标签,点击文本框进行手动编辑
  6. 导出:选择保存到文件夹或保存为 ZIP 文件
© 版权声明

相关文章

暂无评论

none
暂无评论...