字节跳动与浙大联合发布轻量高效TTS模型MegaTTS3

字节跳动浙江大学的研究人员推出的一款轻量级TTS模型MegaTTS3,0.45B,高质量语音克隆,支持中英文以及中英文混合,支持口音强度控制,后面会支持更细粒度的发音和时长调整。

字节跳动与浙大联合发布轻量高效TTS模型MegaTTS3

主要特点

🚀轻量高效:TTS扩散变换器的骨干网络仅有4.5亿个参数。

👍超高质量语音克隆:请观看下面的演示视频!我们还在下表中报告了最近的TTS模型在Seed测试集上的结果。

🌍双语支持:支持中文和英文,以及代码切换。

✍️可控性:支持口音强度控制

✅和细粒度发音/时长调整(即将推出)。

© 版权声明

相关文章

暂无评论

none
暂无评论...