Buzz - 最新版
Buzz 是一款功能强大且灵活的转录应用,特别适合需要在本地离线环境中处理音频和视频转录的用户。它支持多种模型和格式,提供了丰富的功能特性,能够满足不同场景下的转录需求。
LOADING
SoftWhisper 是一款基于 Whisper.cpp 的高效转录工具,凭借其强大的兼容性和卓越的性能,为用户提供了一种快速、便捷的音频转录解决方案。
7.63MB0 人已下载 手机查看
SoftWhisper 是一款基于 Whisper.cpp 的音频/视频转录工具,能够将音频或视频中的语音内容快速转换为文字。其最大特点是兼容性极强,支持所有主流平台,包括 Windows、Linux 和 macOS。此外,SoftWhisper 的性能也非常出色,官方宣称可以在大约 2-3 分钟内完成 2 小时音频的转录,相比传统的 Whisper API,效率大幅提升。
在开发 SoftWhisper 之前,作者对之前版本的应用程序性能和可访问性感到不满。之前的实现过于依赖 CUDA,导致 AMD 用户需要安装特定的 Pytorch 包,但安装过程复杂且效果不佳。
为了解决这一问题,作者尝试创建了一个 ZLUDA 分支来模拟 CUDA,但遗憾的是,现有的 ZLUDA 实现并不支持 Pytorch。在进一步研究后,作者发现了 Whisper.cpp,这是一个用纯 C++ 重新实现 OpenAI Whisper API 的项目,依赖项极少。它可以通过 Vulkan 结合 CPU 和 GPU 加速,并且在 Linux 上可以轻松编译。经过测试,Whisper.cpp 在作者的硬件上表现优异:仅需 2-3 分钟即可完成 2 小时音频的转录,而传统的多进程 Whisper API 转录 20-30 分钟的音频需要约 40 分钟。
Windows 系统
SoftWhisper.bat
文件。pip install -r requirements.txt
尽管 SoftWhisper 的性能非常出色,但当前版本仍存在一些问题: