ComfyUI-AceMusic：多语言AI音乐生成节点，19种语言写歌+完整歌曲结构控制

45 0

ComfyUI-AceMusic 是基于 ACE-Step 1.5 开发的 ComfyUI 自定义节点，专注实现多语言带歌词完整歌曲生成，支持 19 种语言（含中文、英语、日语、韩语等），将 ACE-Step 1.5 核心能力完整封装为节点化工作流，适配本地部署与生产级音乐创作场景。

完整 ACE-Step 1.5 集成：全球首个将 ACE-Step 1.5 全功能落地为 ComfyUI 节点的套件，共 15 个功能节点，覆盖生成、编辑、微调全流程。
模块化节点架构：拆分 Settings、Lyrics、Caption 独立节点，无组件顺序依赖，工作流逻辑清晰、可读性强，便于复用与二次修改。
跨平台高兼容：替换 torchaudio 为 soundfile/scipy 后端，完美支持 Windows 系统及 Python 3.13+ 版本，解决跨环境兼容性问题。
生产级稳定性：内置输入验证、参数自动回退机制，避免运行时报错；支持批量生成与异常容错，适配长期稳定运行。
生态互通：与 HeartMuLa 节点无缝衔接，可组合构建混合 AI 音乐工作流，兼容主流音乐生成插件生态。

支持 19 种语言生成带人声的完整歌曲，核心语言品质分级：

通过标准段落标记定义歌曲结构，支持完整歌曲范式：

风格标签体系：支持流派、人声、情绪、节奏、乐器多维度标签组合，精准控制音乐风格。
- 流派：pop、rock、electronic、jazz、c-pop、mandopop 等；
- 人声：female vocal、male vocal、duet、choir、instrumental；
- 情绪：energetic、melancholic、romantic、dreamy 等；
- 乐器：piano、guitar、drums、erhu、pipa 等。
  示例标签组合：mandopop, female vocal, romantic, piano, emotional ballad。
时长与参数：支持最长 240 秒（4 分钟）连续音频生成，可自定义 BPM、采样步数、语言等核心参数。

覆盖从生成到二次修改的全流程，支持 5 大核心编辑功能：

克隆项目仓库：

git clone https://github.com/hiroki-abe-58/ComfyUI-AceMusic.git

安装节点依赖：

cd ComfyUI-AceMusic
pip install -r requirements.txt

安装 ACE-Step 1.5 核心库：

pip install git+https://github.com/ace-step/ACE-Step.git

首次使用节点时，模型会自动从 Hugging Face 下载至本地缓存目录，无需手动操作；若下载失败，可手动下载模型文件放入 ~/.cache/ace-step/checkpoints/。

输入歌词：添加 AceMusic Lyrics Input 节点，输入带段落标记的歌词，示例：

[Verse]
走在空旷的街道上
想着你和我的过往

[Chorus]
我们属于彼此
从现在到永远

设置风格：添加 AceMusic Caption Input 节点，输入风格标签，如 pop, female vocal, energetic；
连接生成：将 Model Loader、Settings、Lyrics Input、Caption Input 节点连接至 AceMusic Generator；
预览输出：Generator 输出端连接 Preview Audio 节点，点击运行，生成完成后可直接播放音频。