字节跳动和浙江大学的研究人员推出的一款轻量级TTS模型:MegaTTS3,0.45B,高质量语音克隆,支持中英文以及中英文混合,支持口音强度控制,后面会支持更细粒度的发音和时长调整。
🚀轻量高效:TTS扩散变换器的骨干网络仅有4.5亿个参数。
👍超高质量语音克隆:请观看下面的演示视频!我们还在下表中报告了最近的TTS模型在Seed测试集上的结果。
🌍双语支持:支持中文和英文,以及代码切换。
✍️可控性:支持口音强度控制
✅和细粒度发音/时长调整(即将推出)。