用于创建数据集的桌面工具qapyq:最新版增加了图像缩放、自动遮罩和裁剪功能,以及自动字幕功能

qapyq 是一款专为生成式 AI 模型的数据集整理、微调(finetune)和 LoRA 设计的图像查看器和编辑工具。它提供了丰富的功能,帮助用户高效地处理和准备图像数据,特别适合需要大量图像标注和编辑的工作流程。无论是个人开发者还是团队协作,qapyq 都能显著提升工作效率,帮助你更好地准备和管理图像数据。

功能概览

1. 图像查看器

  • 快速启动的桌面应用程序:基于 Qt 构建,支持多窗口布局,允许在不同显示器上放置窗口。
  • 多标签支持:同时打开多个图像,方便对比和管理。
  • 缩放/平移和全屏模式:轻松查看图像细节,支持全屏浏览。
  • 缩略图画廊:快速浏览大量图像,提高工作效率。
  • 图像对比:并排显示两张图像,便于比较差异。
  • 尺寸和像素距离测量:精确测量图像中的物体尺寸和距离。
  • 幻灯片播放:自动播放图像,适合批量预览。

2. 图像/蒙版编辑器

  • 裁剪和保存图像部分:提取感兴趣的区域,保存为新文件。
  • 图像缩放:调整图像大小,适应不同的训练需求。
  • 手动编辑蒙版:支持多层蒙版编辑,适用于复杂的图像分割任务。
  • 支持压感绘图笔:提供更精细的蒙版绘制体验,适合专业用户。
  • 记录蒙版操作到宏:自动化重复性操作,节省时间。
  • 自动蒙版生成:使用 AI 模型自动生成蒙版,简化工作流程。

3. 标注功能

  • 手动编辑标注:支持拖放操作,方便添加和修改文本描述。
  • 标签排序和过滤规则:轻松管理和筛选标签,提升标注效率。
  • 彩色文本高亮:突出显示重要信息,便于快速识别。
  • 自动标注:使用 AI 模型自动生成标注,减少人工工作量。
  • 提示预设:提供常用提示模板,快速应用到图像中。
  • 迭代提示:每次标注结果保存到 .json 文件的不同条目中,便于后续优化。
  • 进一步细化:结合大语言模型(LLM)优化标注内容,确保高质量数据。

4. 批处理功能

  • 灵活的批量标注、标签和变换:一次性处理整个文件夹中的图像,节省大量时间。
  • 批量缩放图像:统一调整图像尺寸,确保数据一致性。
  • 批量蒙版生成:使用用户定义的宏自动生成蒙版,适用于大规模数据集。
  • 批量裁剪图像:快速裁剪图像,提取关键区域。

5. AI 辅助功能

  • 支持最先进的标注和蒙版生成模型:集成多种 AI 模型,确保高质量的标注和蒙版生成。
  • 模型和采样设置:支持 GPU 加速和 CPU 卸载,优化性能。
  • 实时 NF4 和 INT8 量化:减少内存占用,提升推理速度。
  • 独立的推理子进程:隔离潜在崩溃,确保系统稳定,允许完全清理 VRAM。

支持的模型

标签生成

  • JoyTag
  • WD (onnx)(推荐 eva02)

标注生成

  • Florence-2
  • InternVL2
  • MiniCPM-V-2.6 (GGUF)
  • Molmo(推荐)
  • Ovis-1.6
  • Qwen2-VL

大语言模型 (LLM)

  • GGUF 格式的模型,内置聊天模板(基于 llama-cpp 后端)。

蒙版生成

  • 框检测
  • YOLO/Adetailer 检测模型
  • 分割/背景移除
  • InSPyReNet(Plus_Ultra)
  • RMBG-2.0

    安装指南

    系统要求

    • 需要 Python。
    • 默认安装 CUDA 12.4 的预构建包。如果需要其他 CUDA 版本,请在运行安装脚本前修改 requirements-pytorch.txt  requirements-llamacpp.txt 中的索引 URL。

    安装步骤

    克隆或下载仓库

    • 使用 Git 克隆仓库,或直接下载 ZIP 文件。

    运行安装脚本

    • Linux:运行 setup.sh
    • Windows:运行 setup.bat
    • 这将创建一个虚拟环境,需要 7-9 GB 的空间。

    手动运行

    • 如果安装脚本未成功运行,但手动配置成功,请分享解决方案并提交问题。

    启动

    • Linux:运行 run.sh
    • Windows:运行 run.bat  run-console.bat
    • 可以通过操作系统中的文件类型关联,直接在 qapyq 中打开文件或文件夹。快捷方式图标可在 qapyq/res 文件夹中找到。

    更新方法

    • 使用 Git 克隆:只需运行 git pull 即可更新。
    • 下载 ZIP 文件:重新下载并替换已安装的文件。
    • 新依赖项:如果程序启动失败或崩溃,请重新运行安装脚本以安装缺失的包。
      0

      评论0

      没有账号?注册  忘记密码?