Pony系列模型V7版本，将带来诸多令人期待的改进和新功能

早报1年前更新小马良

460 0

Pony系列模型一直以来都是基于SDXL微调的热门绘画模型，尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今，V7版本的消息传来，带来了诸多令人期待的改进和新功能。

V7版本的重大改进

分辨率提升至1500像素
- 新版本支持更高的分辨率，能够输出更精细的图像质量，这对于需要高细节表现的绘画作品来说是一个巨大的提升。
生成极亮或极暗图像的能力
- 这一改进为创作提供了更大的灵活性，能够满足不同场景和风格的需求，无论是高对比度的动漫风格还是低光环境下的写实风格，都能轻松应对。
极强的提示理解能力
- V7在理解空间信息、物体描述、背景（或无背景）等方面表现出色，相比V6和SDXL有了显著提升。这使得用户可以在不进行大量人工标注的情况下，获得高质量的生成结果。
未审查的模型
- V7仍然保持了未审查的特性，运行稳定，且在成熟标注方面进行了大量改进，确保了模型的合规性和安全性。
人体解剖结构和手/脚的表现更好
- 新版本在人体解剖结构的细节表现上更为出色，生成质量的波动性更小，整体细节表现比V6更优秀。
风格控制显著改进
- V7支持自然语言风格描述和风格聚类，虽然目前还处于中等水平，但预计后期训练将进一步提升其效果，为用户带来更多样化的风格选择。
更多VRAM配置选项
- V7支持低至2bit的GGUF格式（尽管4bit可能是最佳低位选项），在推理时使用8bit运行，且未观察到明显的质量下降。这使得模型在不同硬件配置下都能高效运行。
对新领域的支持
- V7不仅能够生成高质量的动漫风格图像，还在写实风格上表现出色。虽然它可能无法超越Flux，但作为一个强大的起点，特别是在写实风格的微调方面，V7已经取得了显著的进步。
各种第一方支持工具
- 开发团队提供了标注Colab，并将发布标注微调、美学分类器、风格聚类分类器等工具，帮助用户为LoRA训练准备图像，或更好地理解新的提示系统。此外，还提供了关于如何在V7中有效编写提示的详细文档。

需要继续努力的方向

尽管V7版本带来了诸多改进，但仍有一些地方需要进一步优化：

LoRA基础设施
- 目前虽然有两个与AuraFlow兼容的训练器，但文档编写和Colab教程的准备工作仍是当前的主要优先事项。
风格控制
- 某些图像的对比度过高，开发团队仍在学习如何更好地控制这一点，以确保模型始终生成符合预期的图像。
ControlNet支持
- 尽管更好的提示系统在某些任务中降低了ControlNet的重要性，但开发团队仍希望社区能够在这方面提供帮助。相关模型的训练已经在计划中，只是时间问题。
模型速度较慢
- 生成完整的1500像素图像在4090显卡上需要超过一分钟的时间。开发团队正在致力于开发精简版本，并调试多种优化方案，以期将性能提升至原来的两倍。
清理最后的残留伪影
- V7在去除鬼影标志/签名方面表现得更好，但仍需最后一轮清理工作，以彻底解决这一问题。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌Gemini 新增交互式图表功能，支持点击获取科学概念解释

谷歌Gemini 新增交互式图表功能，支持点击获取科学概念解释

早报 # Gemini # 谷歌

4个月前

0420

谷歌在 Flow 中为 Ultra 订阅者推出 Nano Banana Pro

谷歌在 Flow 中为 Ultra 订阅者推出 Nano Banana Pro

早报 # Flow # Nano Banana Pro # 谷歌

4个月前

0260

谷歌将 Google Chat 迁移至新域名以提升访问速度

谷歌将 Google Chat 迁移至新域名以提升访问速度

早报 # Google Chat # 谷歌

4个月前

0220

Suno v5.5 重磅发布：打造你的“数字歌喉”，AI 音乐进入深度个性化时代

新Suno v5.5 重磅发布：打造你的“数字歌喉”，AI 音乐进入深度个性化时代

早报 # Suno v5.5

2天前

080

暂无评论

none

暂无评论...