卡卡字幕助手(VideoCaptioner) - 最新版
VideoCaptioner是一款功能强大且易于使用的视频字幕处理工具。它不仅支持语音识别、字幕优化和翻译全流程处理,还提供了丰富的配置选项,满足不同用户的需求。


SoftWhisper 是一款基于 Whisper.cpp 的高效转录工具,凭借其强大的兼容性和卓越的性能,为用户提供了一种快速、便捷的音频转录解决方案。
7.63MB2 人已下载 手机查看
SoftWhisper 是一款基于 Whisper.cpp 的音频/视频转录工具,能够将音频或视频中的语音内容快速转换为文字。其最大特点是兼容性极强,支持所有主流平台,包括 Windows、Linux 和 macOS。此外,SoftWhisper 的性能也非常出色,官方宣称可以在大约 2-3 分钟内完成 2 小时音频的转录,相比传统的 Whisper API,效率大幅提升。

在开发 SoftWhisper 之前,作者对之前版本的应用程序性能和可访问性感到不满。之前的实现过于依赖 CUDA,导致 AMD 用户需要安装特定的 Pytorch 包,但安装过程复杂且效果不佳。
为了解决这一问题,作者尝试创建了一个 ZLUDA 分支来模拟 CUDA,但遗憾的是,现有的 ZLUDA 实现并不支持 Pytorch。在进一步研究后,作者发现了 Whisper.cpp,这是一个用纯 C++ 重新实现 OpenAI Whisper API 的项目,依赖项极少。它可以通过 Vulkan 结合 CPU 和 GPU 加速,并且在 Linux 上可以轻松编译。经过测试,Whisper.cpp 在作者的硬件上表现优异:仅需 2-3 分钟即可完成 2 小时音频的转录,而传统的多进程 Whisper API 转录 20-30 分钟的音频需要约 40 分钟。
Windows 系统
SoftWhisper.bat 文件。pip install -r requirements.txt
尽管 SoftWhisper 的性能非常出色,但当前版本仍存在一些问题: