JJYB_AI 智剪 - 最新版
JJYB_AI 智剪是一款离线配音 + AI解说 + 自动混剪一体化工具,支持原创解说、混剪、配音,无需联网依赖
Voice-Pro 是一个功能完整的开源网页应用,专为需要语音识别(ASR)、多语言翻译、文本转语音(TTS)和配音的用户设计。它将 YouTube 下载、音频分离、字幕生成、语音克隆等能力集成在一个界面中,无需依赖云端服务即可在本地运行。

无论是制作播客、翻译教学视频,还是为多语言内容生成配音,Voice-Pro 都提供了一套免费、可审计、可离线的解决方案。
支持多种 Whisper 变体,满足不同精度与速度需求:
支持 100+ 语言的语音转文字,并可输出 SRT、ASS 等标准字幕格式。
无需训练数据,直接用一段语音样本生成相似声音:
内置多位中文名人声音样本(如迪丽热巴、蔡依林、赵丽颖等),可用于创意内容制作。
可对字幕或转录文本进行实时翻译,支持 100+ 语言互译。
yt-dlp 提取音视频
| 标签页 | 功能 |
|---|---|
| 配音工作室 | 从 YouTube 到最终配音的完整流水线 |
| Whisper 字幕 | 专注字幕生成,支持单词级高亮、时间轴编辑 |
| 翻译 | 批量翻译字幕文件(SRT/ASS/SSA)或实时文本 |
| 语音生成 | 选择 TTS 引擎、调节语速/音量/音调,试听并导出 |
所有操作均在浏览器中完成,后端服务运行于本地,数据不出设备。
⚠️ 官方暂未支持 Linux/macOS(尽管部分用户社区已尝试移植)
git clone https://github.com/abus-aikorea/voice-pro.git
cd voice-pro
configure.bat(安装 ffmpeg、CUDA 工具链等,耗时约 1 小时)start.bat(启动 WebUI,默认地址 http://127.0.0.1:7870)💡 若浏览器未自动打开,请手动访问命令行中显示的 URL。
int8 而非 float16installer_files 文件夹,重新运行 configure.bat + start.batupdate.bat(仅刷新 Python 环境)