
Qwen3-ASR-Toolkit
Qwen3-ASR-Toolkit是一种高级、高性能的 Python 命令行工具包,用于使用 Qwen-ASR API(前身为 Qwen3-ASR-Flash)。此实现通过智能地将长音频/视频文件分割并并行处理,克服了 API 的 3 分钟音频长度限制,从而实现数小时内容的快速转录。
如果你正在寻找一个高质量、支持中文、还能克隆自己声音的语音合成工具,可以试试 Audio.Z.AI —— 这是智谱 AI 基于其开源 TTS 系统 GLM-TTS 推出的在线服务,目前完全免费。


Audio.Z.AI 的核心引擎是 GLM-TTS,一款由智谱 AI 开发的开源文本到语音系统。它采用创新的 两阶段架构:
这一设计带来了多项突破性能力:
在公开中文测试集上,GLM-TTS 的字符错误率(CER)低至 0.89,音质已接近主流商业 TTS 产品,且完全开源。







