Pony系列模型V7版本,将带来诸多令人期待的改进和新功能

早报4周前更新 小马良
71 0

Pony系列模型一直以来都是基于SDXL微调的热门绘画模型,尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今,V7版本的消息传来,带来了诸多令人期待的改进和新功能。

Pony系列模型V7版本,将带来诸多令人期待的改进和新功能

V7版本的重大改进

  1. 分辨率提升至1500像素
    • 新版本支持更高的分辨率,能够输出更精细的图像质量,这对于需要高细节表现的绘画作品来说是一个巨大的提升。
  2. 生成极亮或极暗图像的能力
    • 这一改进为创作提供了更大的灵活性,能够满足不同场景和风格的需求,无论是高对比度的动漫风格还是低光环境下的写实风格,都能轻松应对。
  3. 极强的提示理解能力
    • V7在理解空间信息、物体描述、背景(或无背景)等方面表现出色,相比V6和SDXL有了显著提升。这使得用户可以在不进行大量人工标注的情况下,获得高质量的生成结果。
  4. 未审查的模型
    • V7仍然保持了未审查的特性,运行稳定,且在成熟标注方面进行了大量改进,确保了模型的合规性和安全性。
  5. 人体解剖结构和手/脚的表现更好
    • 新版本在人体解剖结构的细节表现上更为出色,生成质量的波动性更小,整体细节表现比V6更优秀。
  6. 风格控制显著改进
    • V7支持自然语言风格描述和风格聚类,虽然目前还处于中等水平,但预计后期训练将进一步提升其效果,为用户带来更多样化的风格选择。
  7. 更多VRAM配置选项
    • V7支持低至2bit的GGUF格式(尽管4bit可能是最佳低位选项),在推理时使用8bit运行,且未观察到明显的质量下降。这使得模型在不同硬件配置下都能高效运行。
  8. 对新领域的支持
    • V7不仅能够生成高质量的动漫风格图像,还在写实风格上表现出色。虽然它可能无法超越Flux,但作为一个强大的起点,特别是在写实风格的微调方面,V7已经取得了显著的进步。
  9. 各种第一方支持工具
    • 开发团队提供了标注Colab,并将发布标注微调、美学分类器、风格聚类分类器等工具,帮助用户为LoRA训练准备图像,或更好地理解新的提示系统。此外,还提供了关于如何在V7中有效编写提示的详细文档。

需要继续努力的方向

尽管V7版本带来了诸多改进,但仍有一些地方需要进一步优化:

  1. LoRA基础设施
    • 目前虽然有两个与AuraFlow兼容的训练器,但文档编写和Colab教程的准备工作仍是当前的主要优先事项。
  2. 风格控制
    • 某些图像的对比度过高,开发团队仍在学习如何更好地控制这一点,以确保模型始终生成符合预期的图像。
  3. ControlNet支持
    • 尽管更好的提示系统在某些任务中降低了ControlNet的重要性,但开发团队仍希望社区能够在这方面提供帮助。相关模型的训练已经在计划中,只是时间问题。
  4. 模型速度较慢
    • 生成完整的1500像素图像在4090显卡上需要超过一分钟的时间。开发团队正在致力于开发精简版本,并调试多种优化方案,以期将性能提升至原来的两倍。
  5. 清理最后的残留伪影
    • V7在去除鬼影标志/签名方面表现得更好,但仍需最后一轮清理工作,以彻底解决这一问题。
© 版权声明

相关文章

暂无评论

none
暂无评论...