VideoSOS - 最新版
VideoSOS是一款强大的、基于浏览器的 AI 视频编辑器,专为创作者打造。使用 100+ 个 AI 模型和高级时间线编辑功能,创建令人惊叹的视频。


VideoLingo 是一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享。
历史版本(2)16 人已下载 手机查看
VideoLingo 是一个功能强大的视频翻译、本地化与配音解决方案,致力于生成Netflix 级别的高质量字幕和配音。它不仅解决了传统机器翻译生硬、多行字幕影响观感的问题,还集成了多种 AI 工具链,实现从视频下载到最终输出的全流程自动化。

| 功能 | 描述 |
|---|---|
| 🎥 视频下载 | 支持通过 yt-dlp 一键下载 YouTube 视频 |
| 🗣️ 字幕识别 | 使用 WhisperX 实现单词级精度识别,降低幻觉率 |
| 📝 字幕处理 | 基于 NLP 和 AI 的智能分割机制,确保语义完整 |
| 📚 术语管理 | 支持自定义 + AI 自动生成术语库,提升翻译一致性 |
| 🔁 翻译流程 | 三步翻译策略(直译 → 反思 → 意译),实现影视级质量 |
| ✅ 单行字幕 | 严格遵循 Netflix 标准,杜绝双行字幕干扰 |
| 🗣️ 多样化配音 | 支持 GPT-SoVITS、Azure TTS、OpenAI TTS 等多种方案 |
| ⚡ 快速启动 | 借助 Streamlit 实现一键运行,快速出片 |
| 🌍 多语言 UI | 支持多语言界面,便于国际用户使用 |
| 📄 日志追踪 | 完整记录操作日志,支持中断后继续处理 |
| 语言 | 状态 |
|---|---|
| 英语 | 🤩 |
| 俄语 | 😊 |
| 法语 | 🤩 |
| 德语 | 🤩 |
| 意大利语 | 🤩 |
| 西班牙语 | 🤩 |
| 日语 | 😐 |
| 中文* | 😊 |
中文使用增强版标点模型 Whisper,效果更佳稳定
C:\Program Files\NVIDIA\CUDNN\v9.3\bin\12.6 添加至系统环境变量 PATHchoco install ffmpegbrew install ffmpegsudo apt install ffmpeggit clone https://github.com/Huanshere/VideoLingo.git
cd VideoLingo
conda create -n videolingo python=3.10.0 -y
conda activate videolingo
python install.py
streamlit run st.py
docker build -t videolingo .
docker run -d -p 8501:8501 --gpus all videolingo
VideoLingo 支持 OpenAI-like 格式的 API 调用,灵活接入以下服务:
claude-3-5-sonnetgpt-4.1deepseek-v3gemini-2.0-flash(慎用 gemini-2.5-flash)azure-ttsopenai-ttssiliconflow-fishttsfish-ttsGPT-SoVITSedge-tts*custom-tts(可自定义,修改 custom_tts.py)📌 注意:
VideoLingo 已集成 302.ai 平台,一个 API KEY 即可调用 LLM、WhisperX 与 TTS 服务。你也可以完全本地部署,使用 Ollama + Edge-TTS 实现零 API 成本运行。
| 问题 | 说明 |
|---|---|
| 背景噪音影响 | WhisperX 对背景音乐敏感,建议开启人声分离增强 |
| 数字结尾截断 | wav2vac 模型无法映射数字字符(如 "1" → "one") |
| 模型响应错误 | 弱模型可能因 JSON 格式问题报错,建议删除 output 文件夹重试 |
| 多角色配音限制 | 目前不支持分别配音,WhisperX 的说话人区分能力有限 |