VideoLingo 最新版

官方版无广告166

VideoLingo 是一站式视频翻译本地化配音工具，能够一键生成 Netflix 级别的高质量字幕，告别生硬机翻，告别多行字幕，还能加上高质量的克隆配音，让全世界的知识能够跨越语言的障碍共享。

更新日期：

2025年7月1日

分类标签：

视频剪辑VideoLingo视频翻译

语言：

中文

平台：

没限制

历史版本(2)16 人已下载手机查看

VideoLingo 是一个功能强大的视频翻译、本地化与配音解决方案，致力于生成Netflix 级别的高质量字幕和配音。它不仅解决了传统机器翻译生硬、多行字幕影响观感的问题，还集成了多种 AI 工具链，实现从视频下载到最终输出的全流程自动化。

核心功能亮点

功能	描述
🎥 视频下载	支持通过 `yt-dlp` 一键下载 YouTube 视频
🗣️ 字幕识别	使用 WhisperX 实现单词级精度识别，降低幻觉率
📝 字幕处理	基于 NLP 和 AI 的智能分割机制，确保语义完整
📚 术语管理	支持自定义 + AI 自动生成术语库，提升翻译一致性
🔁 翻译流程	三步翻译策略（直译 → 反思 → 意译），实现影视级质量
✅ 单行字幕	严格遵循 Netflix 标准，杜绝双行字幕干扰
🗣️ 多样化配音	支持 GPT-SoVITS、Azure TTS、OpenAI TTS 等多种方案
⚡ 快速启动	借助 Streamlit 实现一键运行，快速出片
🌍 多语言 UI	支持多语言界面，便于国际用户使用
📄 日志追踪	完整记录操作日志，支持中断后继续处理

语言支持一览

输入语言支持（持续扩展中）

语言	状态
英语	🤩
俄语	😊
法语	🤩
德语	🤩
意大利语	🤩
西班牙语	🤩
日语	😐
中文*	😊

中文使用增强版标点模型 Whisper，效果更佳稳定

输出与配音支持

翻译语言：支持所有主流语言
配音语言：取决于所选 TTS 接口（如 Azure、GPT-SoVITS 等）

安装与部署指南

Windows 用户（英伟达显卡加速）

安装 CUDA Toolkit 12.6
安装 CUDNN 9.3.0
将路径 C:\Program Files\NVIDIA\CUDNN\v9.3\bin\12.6 添加至系统环境变量 PATH
重启电脑

所有平台通用步骤

安装 FFmpeg（必备）

Windows：choco install ffmpeg
macOS：brew install ffmpeg
Linux：sudo apt install ffmpeg

克隆项目并进入目录

git clone https://github.com/Huanshere/VideoLingo.git
cd VideoLingo

创建 Python 环境（要求 Python 3.10）

conda create -n videolingo python=3.10.0 -y
conda activate videolingo
python install.py

启动应用

streamlit run st.py

Docker 部署（需 CUDA 12.4 + NVIDIA Driver >550）

docker build -t videolingo .
docker run -d -p 8501:8501 --gpus all videolingo

💬 API 接口与服务集成

VideoLingo 支持 OpenAI-like 格式的 API 调用，灵活接入以下服务：

LLM 支持（按推荐顺序）

claude-3-5-sonnet
gpt-4.1
deepseek-v3
gemini-2.0-flash（慎用 gemini-2.5-flash）

WhisperX 转录方式

本地运行 WhisperX（推荐 large-v3）
或使用 302.ai 提供的统一 API

TTS 配音接口

azure-tts
openai-tts
siliconflow-fishtts
fish-tts
GPT-SoVITS
edge-tts
*custom-tts（可自定义，修改 custom_tts.py）

📌 注意：
VideoLingo 已集成 302.ai 平台，一个 API KEY 即可调用 LLM、WhisperX 与 TTS 服务。你也可以完全本地部署，使用 Ollama + Edge-TTS 实现零 API 成本运行。

⚠️ 当前限制与注意事项

问题	说明
背景噪音影响	WhisperX 对背景音乐敏感，建议开启人声分离增强
数字结尾截断	wav2vac 模型无法映射数字字符（如 "1" → "one"）
模型响应错误	弱模型可能因 JSON 格式问题报错，建议删除 `output` 文件夹重试
多角色配音限制	目前不支持分别配音，WhisperX 的说话人区分能力有限

去官方网站了解更多

历史版本

版本

日期

大小

状态

语言

下载

NarratoAI - 最新版

NarratoAI 是一个自动化影视解说工具，基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程，助力高效内容创作。

视频剪辑 # NarratoAI # 影视解说 # 短剧混剪

0400 2

Shotcut - 最新版

Shotcut 是一款免费、开源、跨平台的视频编辑器，支持 Windows、Mac 和 Linux。主要功能包括支持广泛的格式；无需导入，即原生时间线编辑；Blackmagic Design 支持输入和预览监控；以及分辨率支持至 4K。

视频剪辑 # Shotcut # 视频剪辑 # 视频编辑

0240 0

CapCut Mate API - 最新版

CapCut Mate API 是一款完全开源免费、基于 FastAPI构建的剪映草稿自动化助手，支持独立部署。本项目专注于为大模型赋能基础视频编辑能力，提供开箱即用的视频剪辑 Skills，已将剪映核心功能全流程自动化。可直接对接大模型实现多样化智能视频剪辑，让普通用户也能快速制作出专业高级的视频作品。

视频剪辑 # CapCut Mate API # 剪映

060 0

查看完整榜单