Pony系列模型一直以来都是基于SDXL微调的热门绘画模型,尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今,V7版本的消息传来,带来了诸多令人期待的改进和新功能。

V7版本的重大改进
- 分辨率提升至1500像素
- 新版本支持更高的分辨率,能够输出更精细的图像质量,这对于需要高细节表现的绘画作品来说是一个巨大的提升。
- 生成极亮或极暗图像的能力
- 这一改进为创作提供了更大的灵活性,能够满足不同场景和风格的需求,无论是高对比度的动漫风格还是低光环境下的写实风格,都能轻松应对。
- 极强的提示理解能力
- V7在理解空间信息、物体描述、背景(或无背景)等方面表现出色,相比V6和SDXL有了显著提升。这使得用户可以在不进行大量人工标注的情况下,获得高质量的生成结果。
- 未审查的模型
- V7仍然保持了未审查的特性,运行稳定,且在成熟标注方面进行了大量改进,确保了模型的合规性和安全性。
- 人体解剖结构和手/脚的表现更好
- 新版本在人体解剖结构的细节表现上更为出色,生成质量的波动性更小,整体细节表现比V6更优秀。
- 风格控制显著改进
- V7支持自然语言风格描述和风格聚类,虽然目前还处于中等水平,但预计后期训练将进一步提升其效果,为用户带来更多样化的风格选择。
- 更多VRAM配置选项
- V7支持低至2bit的GGUF格式(尽管4bit可能是最佳低位选项),在推理时使用8bit运行,且未观察到明显的质量下降。这使得模型在不同硬件配置下都能高效运行。
- 对新领域的支持
- V7不仅能够生成高质量的动漫风格图像,还在写实风格上表现出色。虽然它可能无法超越Flux,但作为一个强大的起点,特别是在写实风格的微调方面,V7已经取得了显著的进步。
- 各种第一方支持工具
- 开发团队提供了标注Colab,并将发布标注微调、美学分类器、风格聚类分类器等工具,帮助用户为LoRA训练准备图像,或更好地理解新的提示系统。此外,还提供了关于如何在V7中有效编写提示的详细文档。
需要继续努力的方向
尽管V7版本带来了诸多改进,但仍有一些地方需要进一步优化:
- LoRA基础设施
- 目前虽然有两个与AuraFlow兼容的训练器,但文档编写和Colab教程的准备工作仍是当前的主要优先事项。
- 风格控制
- 某些图像的对比度过高,开发团队仍在学习如何更好地控制这一点,以确保模型始终生成符合预期的图像。
- ControlNet支持
- 尽管更好的提示系统在某些任务中降低了ControlNet的重要性,但开发团队仍希望社区能够在这方面提供帮助。相关模型的训练已经在计划中,只是时间问题。
- 模型速度较慢
- 生成完整的1500像素图像在4090显卡上需要超过一分钟的时间。开发团队正在致力于开发精简版本,并调试多种优化方案,以期将性能提升至原来的两倍。
- 清理最后的残留伪影
- V7在去除鬼影标志/签名方面表现得更好,但仍需最后一轮清理工作,以彻底解决这一问题。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...