LongCat-AudioDiT

共 2 篇文章

排序

发布更新浏览点赞

ComfyUI-LongCat-AudioDiT-TTS：在节点流中实现广播级零样本语音克隆

新ComfyUI-LongCat-AudioDiT-TTS：在节点流中实现广播级零样本语音克隆

ComfyUI-LongCat-AudioDiT-TTS 是将美团最新开源的 LongCat-AudioDiT 模型原生集成到 ComfyUI 的自定义节点插件。它利用基于扩散变换器（DiT）的架构和...

插件 # ComfyUI-LongCat-AudioDiT-TTS # LongCat-AudioDiT

5小时前

040

LongCat-AudioDiT：美团开源的端到端语音合成模型，直接在波形潜空间生成高保真语音

新LongCat-AudioDiT：美团开源的端到端语音合成模型，直接在波形潜空间生成高保真语音

美团 LongCat 团队推出了 LongCat-AudioDiT，这是一种基于扩散模型的最新文本转语音（TTS）系统。该模型的核心创新在于摒弃了传统的中间声学特征（如梅尔频谱图），直接在波形潜空间...

语音模型 # LongCat-AudioDiT # TTS # 美团

5小时前

040