
Zonos
Zonos模型基于约 20 万小时的语音数据进行训练,涵盖中性和富有表现力的语音模式。虽然主要数据集为英语内容,但也包含大量中文、日语、法语、西班牙语和德语的语音数据,从而支持多语言合成。
Supertonic 是一款专为设备端部署优化的文本转语音(TTS)系统,主打极致速度、超低资源占用和完全本地运行。基于 ONNX Runtime 构建,所有语音合成过程均在用户设备上完成——无需网络、无需 API、不上传任何数据,从根本上保障隐私与响应速度。

Supertonic 提供跨生态系统的即用型推理示例,覆盖主流开发环境:
| 平台/语言 | 路径 | 说明 |
|---|---|---|
| Python | py/ | 基于 ONNX Runtime |
| Node.js | nodejs/ | 服务端 JavaScript |
| 浏览器 | web/ | 支持 WebGPU / WASM |
| Java | java/ | JVM 跨平台 |
| C++ | cpp/ | 高性能原生实现 |
| C# | csharp/ | .NET 生态 |
| Go | go/ | 轻量级服务部署 |
| Swift | swift/ | macOS 原生应用 |
| iOS | ios/ | 原生 iOS 集成 |
| Rust | rust/ | 内存安全系统编程 |
| Flutter | flutter/ | 跨平台移动应用 |
每个目录均包含 README.md,提供详细构建与运行指南。







