Audiblez:基于TTS模型Kokoro的Python 3应用,轻松地将电子书转换为有声书

Kokoro是一款最近发布的文本转语音(TTS)模型,尽管其参数量仅为8200万,但它能够生成极其自然的语音输出。该模型基于Apache许可证发布,并且仅使用了不到100小时的音频数据进行训练。尽管规模较小,它支持美式英语、英式英语、法语、韩语、日语和普通话等多种语言,并提供了多种高质量的语音选择。(相关:文本转语音模型Kokoro-82M

Audiblez应用:将电子书转化为有声书

开发者Claudio Santini利用Kokoro的强大功能开发了一款名为Audiblez的Python 3应用程序。这款应用旨在帮助用户在本地环境中轻松地将电子书转换为有声书,极大地提升了内容消费的便捷性。

实际测试表现

根据实际测试,在开发者配备M2芯片的MacBook Pro上,Audiblez只需2小时即可将包含10万单词的理查德·道金斯的经典著作《自私基因》转化为完整的有声书。这不仅展示了Kokoro v0.19处理大规模文本的效率,也证明了其在实际应用中的可行性和高效性。

0

评论0

没有账号?注册  忘记密码?