Anzhc 开源系列 YOLO 模型：专注细粒度图像分割与分类任务

561 0

在图像检测与分割领域，高质量的专用模型往往能显著提升下游任务的表现。开发者 Anzhc 基于自建标注数据集，训练并开源了一系列面向特定视觉任务的 YOLO 模型，涵盖面部、眼部、头部、胸部等细粒度目标的检测与分割，以及动漫艺术评分、无人机识别等特殊场景应用。

模型：https://huggingface.co/Anzhc/Anzhcs_YOLOs

这些模型多数基于 YOLOv8 和 YOLOv11 架构，在精度与效率之间取得良好平衡，并已在实际项目中验证可用性（如用于 Adetailer 扩展）。所有模型均已公开下载链接，适合图像修复、内容生成、自动标注等场景使用。

模型概览

类别	主要功能	典型应用场景
面部分割	精确识别人脸区域（含插画与真实）	图像修复、虚拟人像处理
眼部分割	定位动漫眼睛（眼白区域）	Adetailer 眼部增强
头部+头发分割	检测完整头部及发部轮廓	肖像自动化处理
胸部分割	动漫角色胸部区域分割	内容生成辅助
胸部大小分类	检测并分级胸部尺寸	内容标签、审核系统
无人机检测	识别空中飞行器	特殊场景监控（实验性）
动漫艺术评分	根据人类偏好预测作品受欢迎程度	数据筛选、推荐系统

所有模型均基于开发者亲自标注或协作完成的数据集训练，非公开数据集。基于公开数据集的模型将单独说明。

👁️ 面部与眼部专用模型

面部分割（通用）

适用于插画与真实人脸的高精度分割任务，支持多种分辨率输入。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhc Face seg 640 v2 y8n.pt	0.791 / 0.765	0.608 / 0.445	~500	640
Anzhc Face seg 768MS v2 y8n.pt	0.807 / 0.770	0.601 / 0.432	~500	768
Anzhc Face seg 1024 v2 y8n.pt	0.768 / 0.740	0.557 / 0.394	~500	1024
Anzhc Face seg 640 v3 y11n.pt	0.882 / 0.871	0.689 / 0.570	~660	640

📌 更新说明：

v3 版本优化了眉毛与完整睫毛的标注目标，更适合 Adetailer 使用；
从 v3 起转向 YOLOv11 架构，相比 v8 有明显提升；
YOLOv12 当前未见显著收益且训练耗时增加 50%，暂不采用。

真实面部（按性别分类）

专为真实人像设计，支持性别区分，可用于构建男女检测堆栈。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhcs ManFace v02 1024 y8n.pt	0.883 / 0.883	0.778 / 0.704	~340	1024
Anzhcs WomanFace v05 1024 y8n.pt	0.820 / 0.820	0.713 / 0.659	~600	1024

⚠️ 注意：该系列对插画类图像表现较弱，建议仅用于真实照片场景。

眼部分割

专为动漫图像设计，聚焦于眼白区域检测，不包含睫毛和外部轮廓，适用于精细化眼部修复。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhc Eyes -seg-hd.pt	0.925 / 0.868	0.721 / 0.511	~500	1024

💡 提示：当前数据集经历多次重构，未来版本将进一步扩展样本多样性。

💇 头部与头发分割

早期开发的实用模型之一，可用于自动化肖像处理流程。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhc HeadHair seg y8n.pt	0.775 / 0.777	0.576 / 0.552	~3180	640
Anzhc HeadHair seg y8m.pt	0.867 / 0.862	0.674 / 0.626	~3180	640

✅ 支持插画与真实图像，y8m 表现更优，适合高精度需求场景。

🫀 胸部相关模型

胸部分割（动漫）

仅基于动漫图像训练，专注于胸部区域的精确分割。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhc Breasts Seg v1 1024n.pt	0.742 / 0.730	0.563 / 0.535	~2000	1024
Anzhc Breasts Seg v1 1024s.pt	0.768 / 0.763	0.596 / 0.575	~2000	1024
Anzhc Breasts Seg v1 1024m.pt	0.782 / 0.775	0.644 / 0.614	~2000	1024

📌 m 版本表现最佳，适合高保真生成任务。

胸部大小检测与分类

一个创新性的多分类模型，用于识别动漫角色胸部尺寸，共 15 个等级，基于身体比例而非画面比例进行标注，避免巨型化或缩放带来的误判。

模型名称	类别数	数据量	分辨率
Anzhcs Breast Size det cls v8 y11m.pt	15（含“不可测量”类）	~16,100	640

📊 评估指标说明：

由于分类任务复杂，传统 mAP 不足以反映性能，采用以下多维度评估：

准确率（Exact Match）：预测完全正确的比例
±1 / ±2 可接受误差比率：允许小幅偏差，更贴近实际使用
漏检率：应检测但未检出
假阳性率：错误检测不存在的目标
误分类率：检测到目标但类别错误

🔍 关键发现：

极端类别（平胸或超大）检测难度较高；
中等尺寸（2级）最易混淆，主要与1级混淆；
多数常见尺寸分类准确率可达 70%–90%；
平均误分类率约 3%，整体可控；
“不可测量”类用于处理遮挡或部分出框情况。

📌 该模型可用于内容标签系统或审核流程，但需注意其主观性——所有标注均由单一标注者完成。

🛰️ 无人机检测模型

一个实验性项目，用于检测空中无人机，基于约 3,460 张图像训练。

模型名称	mAP50（框/掩码）	mAP50-95（框/掩码）	数据量	分辨率
Anzhcs Drones v03 1024 y11n.pt	0.927 / 0.888	0.753 / 0.508	~3460	1024

⚠️ 重要提示：

对无人机型号敏感，某些类型（尤其是近距离）难以稳定检测；
在复杂背景中表现下降；
不建议用于严肃或安全关键场景。

🎯 该项目为个人兴趣驱动，展示了 YOLO 在非主流目标上的可行性。

🎨 动漫艺术评分模型

一个独特的分类模型，尝试从图像特征中预测人类偏好评分。数据来源于 Danbooru，筛选出 约 9.8 万张 经充分曝光且评分稳定的图像，按评分分为 10 个百分位组（top10 到 top100）。

模型名称	Top-1 准确率	Top-3 准确率	类别数	分辨率
Anzhcs Anime Score CLS v1.pt	0.336	0.696	10	224

📊 允许 ±1/±2/±3 类别误差的扩展准确率：

±1：46.7%
±2：64.5%
±3：67.9%

🧠 研究洞察：

Top10–Top40 区间存在较强相关性，表明高质量作品具有可学习的视觉特征；
Top60 准确率接近随机（~10%），说明“中庸艺术”缺乏统一特征；
Top80–Top100（低分）有一定负相关性，可识别出明显缺陷；
NSFW 内容整体评分偏高，与普遍认知相反，但数据集中 NSFW/SFW 比例约为 50/50，排除偏差干扰；
更大模型测试未带来明显提升，推测当前架构已达瓶颈。

📌 结论：可以较好预测“好”与“差”的作品，但难以判断“普通”作品。因此，该模型更适合用于筛选优质内容，而非全面质量评估。

✅ 使用建议与注意事项

模型选择建议：
- 追求精度：优先选择 v3 及以上 + YOLOv11 架构；
- 兼容性要求高：可继续使用 v2 系列；
- 实时性要求高：考虑轻量级变体（如 n/s 版本）。
部署提示：
- 所有模型均为 .pt 格式，兼容 Ultralytics YOLO 推理框架；
- 建议在 GPU 环境下运行，尤其是 1024 分辨率模型；
- 可与 Adetailer、ControlNet 等 Stable Diffusion 扩展集成使用。
伦理与合规提醒：
- 部分模型涉及敏感人体部位识别，请遵守当地法律法规；
- 不建议用于自动化审核或决策系统，需人工复核；
- 所有模型仅供研究与个人使用，商业用途请谨慎评估风险。