阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

在用户热切期盼下,阿里通义 MAX 项目组正式开源 Z-Image 完整版——这是 Z-Image 系列的基础大模型,专为追求最高生成质量、最大创作自由度与最强提示控制力的专业用户设计。

与主打速度的 Z-Image-Turbo 不同,Z-Image 是一个完整容量、未经蒸馏的 Transformer 模型,保留了全部训练信号,为创作者、研究人员和开发者提供可微调、可控制、可扩展的生成基座。

阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

阿里通义发布Z-Image-Turbo:60 亿参数高效图像模型,支持中英双语文本渲染与亚秒级生成

核心特性

未经蒸馏的基础模型

  • 保留完整训练信息,支持完整的无分类器引导(CFG)
  • 为复杂提示工程、精细构图控制和专业工作流提供精确调控能力
阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

极致美学多样性

  • 覆盖超写实摄影、电影级数字艺术、精细动漫、风格化插画等多种视觉语言
  • 适用于需要多维度、跨风格表达的创作场景
  • 阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

增强的输出多样性

  • 在不同随机种子下,显著提升构图、人脸身份、光照条件的变化性
  • 特别适合生成多人场景,确保每张图像都具有独特性和动态感
阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

开发者友好

  • 作为非蒸馏模型,是 LoRA 微调、ControlNet 结构控制、语义条件生成 的理想基座
  • 社区可基于此模型快速构建垂直领域应用
阿里通义 MAX 项目组发布 Z-Image :支持 CFG 与微调,面向专业创作的非蒸馏基础模型

强大的负面控制

  • 对 negative prompt 具有高保真响应能力
  • 可有效抑制伪影、畸变、不合规内容,精准调整画面构成

Z-Image vs Z-Image-Turbo:定位分明

特性Z-Image(完整版)Z-Image-Turbo
模型类型非蒸馏基础模型蒸馏加速模型
CFG 支持✅ 完整支持❌ 不支持
推荐步数28–50 步8 步
可微调性✅ 适合 LoRA/ControlNet❌ 不建议微调
负面提示响应✅ 高保真❌ 有限
输出多样性低(偏向稳定输出)
视觉质量极高(在 Turbo 模式下优化)
强化学习(RL)❌ 未使用✅ 经 RL 优化

💡 选择建议

  • 追求速度与一致性 → 选 Z-Image-Turbo
  • 追求控制力、多样性与可定制性 → 选 Z-Image 完整版

适用场景

  • 专业艺术创作:需精细控制构图、风格、光照的数字绘画
  • 学术研究:探索生成模型的多样性、可控性与泛化能力
  • 工业应用开发:构建电商、游戏、影视等领域的定制化生成管线
  • 社区微调:作为 LoRA 或 ControlNet 的基础模型,快速适配特定需求
© 版权声明

相关文章

暂无评论

none
暂无评论...