Amphion 是一款开源音频、音乐和语音生成工具包,由香港中文大学(深圳)吴志正教授领导的团队开发,该工具包是与 OpenMMLab 合作开发的。此工具包支持文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)、文本转音乐(TTM),最吸引人关注的就是歌声转换(SVC)工具,可以将一首歌的声音换成另一个歌手的声音,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如 FastSpeech2、VITS、Vall-E、NaturalSpeech2 等,用于不同的音频生成任务。
- GitHub 地址:https://github.com/open-mmlab/Amphion
- 论文地址:arxiv.org/abs/2312.09911
- HuggingFace 地址:https://huggingface.co/amphion

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...




![ComfyUI已支持 FLUX.2 [klein]:4B 模型实现 1.2 秒本地图像生成与编辑](https://pic.sd114.wiki/wp-content/uploads/2026/01/1768500082-1768500082-FLUX.2-klein-4.webp~tplv-o4t1hxlaqv-image.image)
![黑森林实验室发布 FLUX.2 [klein]:统一生成与编辑的最快开源模型](https://pic.sd114.wiki/wp-content/uploads/2026/01/1768500030-1768500030-FLUX.2-klein-2.webp~tplv-o4t1hxlaqv-image.image)









