ACE-Step 1.5稳定版v0.1.0发布:显存自动优化、LoRA 训练支持与全硬件兼容

18小时前 小马良
4 0

ACE-Step 1.5 正式发布其首个稳定版本 v0.1.0。此次更新不仅仅是简单的 Bug 修复,而是一次全方位的架构进化。新版本引入了智能显存检测与自动模型选择机制,大幅降低了硬件门槛;重构了一键启动脚本,让部署变得丝滑流畅;更重磅加入了LoRA 与 LyCORIS (LoKr) 训练支持,为开发者打开了模型微调的大门。无论你是只想快速生成一首背景音乐的玩家,还是希望定制专属声音风格的开发者,这一版本都值得立即升级。

  • GitHub:https://github.com/ace-step/ACE-Step-1.5/releases/tag/v0.1.0

核心亮点:更稳、更快、更强

1. 智能显存管理,告别 OOM 焦虑

这是本次更新最贴心的功能。ACE-Step 1.5 现在具备运行时显存检测能力

  • 自动适配:系统会根据当前 GPU 的显存大小,自动选择最优的模型精度(如 FP16, INT8)和批处理大小。
  • 动态优化:在显存紧张时,自动启用优化策略,防止因显存溢出(OOM)导致的崩溃。
  • 广泛兼容:无论是高端 RTX 4090,还是显存较小的消费级显卡,甚至是部分 Apple Silicon 设备,都能找到最适合的运行配置。

2. 丝滑的一键启动体验

针对用户反馈的“启动难、环境配置繁琐”问题,团队对启动脚本进行了彻底重构:

  • 流程简化:整合了原本分散的步骤,真正实现了“一键启动”。
  • 依赖自愈:自动检查并修复常见的环境依赖问题。
  • UI 模块化:将 Gradio 前端界面迁移至独立的 ui/gradio 模块,移除了旧的兼容垫片,代码结构更清晰,加载速度更快。

3. 开启微调时代:LoRA & LyCORIS 支持

对于希望定制音乐风格的开发者,v0.1.0 带来了梦寐以求的训练功能:

  • LoRA 训练教程:官方发布了详细的 LoRA 训练指南,手把手教你训练专属风格模型。
  • LyCORIS (LoKr) 支持:不仅支持标准 LoRA,还引入了更高效、参数量更小的 LyCORIS (LoKr) 算法,加载与训练 API 已全面开放。
  • Side-Step 高级文档:链接了 Side-Step 高级训练文档,为深度研究者提供理论支持。

架构重构:为未来奠基

除了用户可见的功能,开发团队在底层架构上也做了大量“看不见但很重要”的工作,确保项目的长期可维护性:

  • 生成逻辑解耦:将原本庞大的 generate_music 编排逻辑分解为独立的请求处理模块,提升了代码的可读性和扩展性,并增加了文件上传功能的灵活性。
  • VAE 编解码重构:对 VAE(变分自编码器)的编码和解码流程进行了深度优化,提升了音频重建的质量和速度。
  • 模型目录标准化
    • 将 mlx_dit 和 mlx_vae 统一迁移至 models/mlx 目录,更好地支持 Apple Metal 加速。
    • 将评分模块整合至 acestep/core/scoring/,便于后续引入更复杂的评估算法。
  • Bug 修复:解决了清单路径双重嵌套导致训练样本无法识别的关键问题,确保训练流程顺畅。

更新日志摘要

类别更新内容
✨ 新特性• 添加显存检测与自动模型选择/优化
• 支持 LoRA 训练及官方教程
• 支持 LyCORIS (LoKr) 加载与 API
• 更广泛的硬件支持(含 Apple Silicon 优化)
🔄 重构优化• 分解 generate_music 编排逻辑,支持上传流
• 重构 VAE 编码与解码流程
• 移动 Gradio UI 至独立模块,移除旧垫片
• 整合 MLX 模型与评分模块目录结构
🐛 问题修复• 修复启动脚本的稳定性问题
• 修复训练时因清单路径嵌套导致的样本丢失问题
• 各类小改进与错误修复
📚 文档更新• 链接 LoRA 训练教程
• 链接 Side-Step 高级训练文档

暂无评论

none
暂无评论...