CosyVoice Desktop - 最新版
CosyVoice Desktop 是一个完全本地运行的桌面端有声内容生成工具,基于 CosyVoice3-0.5B 大模型构建,无需联网、无需订阅,打开即用,支持多角色配音、语音修补、跨语言合成,并提供完整的项目管理与音频导出流程。
拼音打字 1 分钟,LazyTyper 语音仅需 8 秒。
这款仅 11.3MB 的桌面应用,集成了 12 个专业语音识别模型(含 5 个本地离线模型),中文识别准确率超 90%,支持中英日混输、AI 润色、代码变量识别,且永久免费、无广告、不收集数据。

无论是写代码、记笔记、回邮件,还是与 AI 助手对话,LazyTyper 都能让你“想到即说,说到即写”,真正实现思考直达文本。
效率提升并非夸张——而是基于真实输入行为的自然结果。
| 模型 | 特点 | 是否本地 |
|---|---|---|
| 豆包语音 | 中文识别准确率最高(>90%) | ✅ 是 |
| ElevenLabs | 代码变量名、技术术语识别极佳 | ❌ 否 |
| Groq Whisper | 转写速度快、稳定性高 | ❌ 否 |
| Mistral / AssemblyAI | 备用选项,支持多语言 | ❌ 否 |
| 5 个本地引擎 | 无网可用,保障隐私 | ✅ 是 |
所有模型可在设置中一键切换,适应不同场景需求。
camelCase、snake_case 等命名格式无需手动切换输入法,以下内容可直接说出并准确转写:
“这个
designPattern非常 cool,但ユーザーエクスペリエンス还需优化。”
userService 的函数”Q:真的完全免费吗?
A:是的。所有核心功能(包括高速转写、多语言、AI 润色)均免费开放,无隐藏收费。
Q:和系统自带语音输入比如何?
A:显著更优。豆包语音中文准确率更高,ElevenL Labs 对代码变量支持更好,且支持多模型灵活切换。
Q:支持 Linux 吗?
A:支持。GitHub Releases 提供多种打包格式,开箱即用。
Q:适合哪些人?
A:学生(课堂笔记)、作家(长文创作)、程序员(口述代码)、职场人士(邮件/报告)、任何想减少打字负担的用户。
Q:如何开始使用?
A:官网下载 → 安装 → 选择模型 → 开始说话。无需注册,30 秒上手。