Amphion：开源音频、音乐和语音生成工具包

工具2年前发布小马良

498 0

Amphion 是一款开源音频、音乐和语音生成工具包，由香港中文大学（深圳）吴志正教授领导的团队开发，该工具包是与 OpenMMLab 合作开发的。此工具包支持文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）、文本转音乐（TTM），最吸引人关注的就是歌声转换（SVC）工具，可以将一首歌的声音换成另一个歌手的声音，歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构，如 FastSpeech2、VITS、Vall-E、NaturalSpeech2 等，用于不同的音频生成任务。

GitHub 地址：https://github.com/open-mmlab/Amphion
论文地址：arxiv.org/abs/2312.09911
HuggingFace 地址：https://huggingface.co/amphion

工具 # Amphion

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Anthropic 开源新一代电路追踪工具：揭开大语言模型“黑箱”的关键一步

Anthropic 开源新一代电路追踪工具：揭开大语言模型“黑箱”的关键一步

工具 # Anthropic # Circuit Tracing

10个月前

04590

海螺视频推出图生视频功能，将静态图像转化为动态视频内容

海螺视频推出图生视频功能，将静态图像转化为动态视频内容

工具 # MiniMax # 海螺AI # 海螺视频

1年前

01,2860

开放评估平台GenAI Arena：用于评估不同的图像和视频生成模型，用户可以积极参与这些模型的评估过程

开放评估平台GenAI Arena：用于评估不同的图像和视频生成模型，用户可以积极参与这些模型的评估过程

工具 # GenAI Arena # 竞技场

2年前

06890

Stable Diffusion视频生成项目Deforum推出网页版

Stable Diffusion视频生成项目Deforum推出网页版

工具 # AI视频生成 # Deforum # Stable Diffusion

2年前

06840

暂无评论

none

暂无评论...