闪电说 - 最新版
闪电说是端侧优先的 AI 语音输入法,本地语音模型带来毫秒级响应,是追求极致速度的极佳选择。告别打字,用闪电说 AI 语音输入法快 4 倍,AI 对话、AI 编程、文档写作、聊天回复......全场景都能用,支持所有应用。


SoftWhisper 是一款基于 Whisper.cpp 的高效转录工具,凭借其强大的兼容性和卓越的性能,为用户提供了一种快速、便捷的音频转录解决方案。
7.63MB2 人已下载 手机查看
SoftWhisper 是一款基于 Whisper.cpp 的音频/视频转录工具,能够将音频或视频中的语音内容快速转换为文字。其最大特点是兼容性极强,支持所有主流平台,包括 Windows、Linux 和 macOS。此外,SoftWhisper 的性能也非常出色,官方宣称可以在大约 2-3 分钟内完成 2 小时音频的转录,相比传统的 Whisper API,效率大幅提升。

在开发 SoftWhisper 之前,作者对之前版本的应用程序性能和可访问性感到不满。之前的实现过于依赖 CUDA,导致 AMD 用户需要安装特定的 Pytorch 包,但安装过程复杂且效果不佳。
为了解决这一问题,作者尝试创建了一个 ZLUDA 分支来模拟 CUDA,但遗憾的是,现有的 ZLUDA 实现并不支持 Pytorch。在进一步研究后,作者发现了 Whisper.cpp,这是一个用纯 C++ 重新实现 OpenAI Whisper API 的项目,依赖项极少。它可以通过 Vulkan 结合 CPU 和 GPU 加速,并且在 Linux 上可以轻松编译。经过测试,Whisper.cpp 在作者的硬件上表现优异:仅需 2-3 分钟即可完成 2 小时音频的转录,而传统的多进程 Whisper API 转录 20-30 分钟的音频需要约 40 分钟。
Windows 系统
SoftWhisper.bat 文件。pip install -r requirements.txt
尽管 SoftWhisper 的性能非常出色,但当前版本仍存在一些问题: