ComfyUI-HiggsAudio:在 ComfyUI 中接入 Higgs Audio v2 文本生成音频能力

插件4个月前发布 小马良
165 0

ComfyUI-HiggsAudio 是之前介绍的TTS模型Higgs Audio v2的第三方ComfyUI节点插件,用户可以在 ComfyUI 的可视化工作流中直接调用 Higgs Audio v2,实现音频生成与多模态流程的无缝集成,适用于音效设计、AI 配音、交互式叙事等场景。

Boson AI 发布 Higgs Audio V2:首个开源的多说话者情感语音生成模型

ComfyUI-HiggsAudio:在 ComfyUI 中接入 Higgs Audio v2 文本生成音频能力

✅ 安装步骤

请确保您已完成以下前置准备:

  • 已安装 ComfyUI 并可正常运行;
  • Python 环境已配置,pip 可用。

1. 克隆插件到 custom_nodes 目录

cd ComfyUI/custom_nodes
git clone https://github.com/Yuan-ManX/ComfyUI-HiggsAudio.git

2. 安装依赖项

进入插件目录并安装所需依赖:

cd ComfyUI-HiggsAudio
pip install -r requirements.txt
pip install -e .

💡 说明:

  • requirements.txt 包含运行 Higgs Audio 所需的核心库(如 torch、transformers 等);
  • -e . 实现可编辑模式安装,便于后续更新与调试。

📦 模型下载

Higgs Audio v2 的预训练权重需单独下载,目前未包含在仓库中。

© 版权声明

相关文章

暂无评论

none
暂无评论...