VideoLingo
VideoLingo

VideoLingo 最新版

官方版无广告147

VideoLingo 是一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享。

更新日期:
2025年7月1日
语言:
中文
平台:
没限制

历史版本(2)16 人已下载 手机查看

VideoLingo 是一个功能强大的视频翻译、本地化与配音解决方案,致力于生成Netflix 级别的高质量字幕和配音。它不仅解决了传统机器翻译生硬、多行字幕影响观感的问题,还集成了多种 AI 工具链,实现从视频下载到最终输出的全流程自动化。

核心功能亮点

功能描述
🎥 视频下载支持通过 yt-dlp 一键下载 YouTube 视频
🗣️ 字幕识别使用 WhisperX 实现单词级精度识别,降低幻觉率
📝 字幕处理基于 NLP 和 AI 的智能分割机制,确保语义完整
📚 术语管理支持自定义 + AI 自动生成术语库,提升翻译一致性
🔁 翻译流程三步翻译策略(直译 → 反思 → 意译),实现影视级质量
✅ 单行字幕严格遵循 Netflix 标准,杜绝双行字幕干扰
🗣️ 多样化配音支持 GPT-SoVITS、Azure TTS、OpenAI TTS 等多种方案
⚡ 快速启动借助 Streamlit 实现一键运行,快速出片
🌍 多语言 UI支持多语言界面,便于国际用户使用
📄 日志追踪完整记录操作日志,支持中断后继续处理

语言支持一览

输入语言支持(持续扩展中)

语言状态
英语🤩
俄语😊
法语🤩
德语🤩
意大利语🤩
西班牙语🤩
日语😐
中文*😊

中文使用增强版标点模型 Whisper,效果更佳稳定

输出与配音支持

  • 翻译语言:支持所有主流语言
  • 配音语言:取决于所选 TTS 接口(如 Azure、GPT-SoVITS 等)

安装与部署指南

Windows 用户(英伟达显卡加速)

  1. 安装 CUDA Toolkit 12.6
  2. 安装 CUDNN 9.3.0
  3. 将路径 C:\Program Files\NVIDIA\CUDNN\v9.3\bin\12.6 添加至系统环境变量 PATH
  4. 重启电脑

所有平台通用步骤

安装 FFmpeg(必备)

  • Windowschoco install ffmpeg
  • macOSbrew install ffmpeg
  • Linuxsudo apt install ffmpeg

克隆项目并进入目录

git clone https://github.com/Huanshere/VideoLingo.git
cd VideoLingo

创建 Python 环境(要求 Python 3.10)

conda create -n videolingo python=3.10.0 -y
conda activate videolingo
python install.py

启动应用

streamlit run st.py

Docker 部署(需 CUDA 12.4 + NVIDIA Driver >550)

docker build -t videolingo .
docker run -d -p 8501:8501 --gpus all videolingo

💬 API 接口与服务集成

VideoLingo 支持 OpenAI-like 格式的 API 调用,灵活接入以下服务:

LLM 支持(按推荐顺序)

  • claude-3-5-sonnet
  • gpt-4.1
  • deepseek-v3
  • gemini-2.0-flash(慎用 gemini-2.5-flash)

WhisperX 转录方式

  • 本地运行 WhisperX(推荐 large-v3)
  • 或使用 302.ai 提供的统一 API

TTS 配音接口

  • azure-tts
  • openai-tts
  • siliconflow-fishtts
  • fish-tts
  • GPT-SoVITS
  • edge-tts
  • *custom-tts(可自定义,修改 custom_tts.py

📌 注意
VideoLingo 已集成 302.ai 平台,一个 API KEY 即可调用 LLM、WhisperX 与 TTS 服务。你也可以完全本地部署,使用 Ollama + Edge-TTS 实现零 API 成本运行。

⚠️ 当前限制与注意事项

问题说明
背景噪音影响WhisperX 对背景音乐敏感,建议开启人声分离增强
数字结尾截断wav2vac 模型无法映射数字字符(如 "1" → "one")
模型响应错误弱模型可能因 JSON 格式问题报错,建议删除 output 文件夹重试
多角色配音限制目前不支持分别配音,WhisperX 的说话人区分能力有限

历史版本

版本
日期
大小
状态
语言
下载
最新版最新
2025年7月1日
官方版
中文
2025年7月1日
官方版
中文

相关软件

短视频工厂(AI Short Video Factory)

短视频工厂(AI Short Video Factory) - 最新版

短视频工厂是一个开源的桌面端应用,通过 AI 技术简化短视频的制作流程。用户可以通过简单的提示词文本+视频分镜素材,快速且自动的剪辑出高质量的产品营销和泛内容短视频。该项目集成了 AI 驱动的文案生成、语音合成、视频剪辑、字幕特效等功能,旨在为用户提供开箱即用的短视频制作体验。

暂无评论

none
暂无评论...