Video Caption Suite

Video Caption Suite

Video Caption Suite最新版

官方版无广告24

Video Caption Suite是一款使用 Qwen3-VL-8B 视觉语言模型进行批量视频字幕生成的应用。选择目录，处理视频，字幕将保存至视频旁。

更新日期：

2026年1月22日

分类标签：

视频剪辑Video Caption Suite字幕

语言：

中文

平台：

1.47MB0 人已下载手机查看

还在手动为视频加字幕？Video Caption Suite 是一个开源工具，基于通义千问最新视觉语言模型 Qwen3-VL-8B-Instruct，可自动分析视频内容并生成精准字幕。只需选择一个文件夹，它就能批量处理所有视频，并将 .txt 字幕文件保存在原视频旁。

Video Caption Suite

整个过程无需联网，所有计算在本地完成，保障隐私与效率。

核心特性

批量处理：一次处理整个文件夹的视频
Qwen3-VL-8B 驱动：利用 8B 参数视觉语言模型理解画面与语音上下文
本地输出：字幕以 .txt 文件形式保存在视频同目录
多 GPU 并行：自动检测多卡环境，提升处理速度
图形化界面：通过浏览器操作，无需命令行

系统要求

组件	要求
操作系统	Windows / Linux / macOS
Python	3.10+
GPU	CUDA 兼容显卡（单卡建议 ≥8GB 显存）
Node.js	18+（用于前端构建）

多 GPU 场景下，每个 GPU 需约 16GB 显存 加载 Qwen3-VL-8B 模型。

快速开始

安装

# Windows
install.bat

# Linux / macOS
chmod +x install.sh && ./install.sh

脚本将自动创建虚拟环境并安装依赖。

启动

# Windows
start.bat

# Linux / macOS
./start.sh

然后在浏览器中打开 http://localhost:8000。

使用流程

点击 Settings → 选择工作目录
系统自动扫描该目录下的所有视频
勾选需要处理的视频 → 点击 Process
等待处理完成，字幕文件（如 video.mp4.txt）将出现在原视频旁

高级配置

编辑 config.py 可调整模型行为：

参数	默认值	说明
`MODEL_ID`	`Qwen/Qwen3-VL-8B-Instruct`	HuggingFace 模型 ID
`MAX_FRAMES_PER_VIDEO`	128	每视频采样帧数（影响精度与速度）
`FRAME_SIZE`	336	输入帧分辨率（像素）
`MAX_TOKENS`	512	单次字幕最大长度
`TEMPERATURE`	0.3	生成随机性（越低越确定）

多 GPU 支持

当系统检测到多个 CUDA GPU 时：

自动启用并行处理
每个 GPU 独立加载模型副本
Settings → Optimization 中会出现“批处理大小”滑块（默认 = GPU 数量，最多 8）
显著缩短大批量视频的处理时间

注意：多 GPU 模式对显存要求较高，建议每卡 ≥16GB。

适用场景

自媒体创作者：快速为短视频生成字幕草稿
教育工作者：为课程视频添加文字记录
研究人员：批量分析视频内容
个人归档：为家庭录像生成可搜索文本

去官方网站了解更多

相关软件

NarratoAI

NarratoAI - 最新版

NarratoAI 是一个自动化影视解说工具，基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程，助力高效内容创作。

视频剪辑 # NarratoAI # 影视解说 # 短剧混剪

0400 2

MoneyPrinterTurbo

MoneyPrinterTurbo - 最新版

只需提供一个视频主题或关键词，就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐，然后合成一个高清的短视频。

视频剪辑 # MoneyPrinterTurbo # 短视频生成

02220 1

Shotcut

Shotcut - 最新版

Shotcut 是一款免费、开源、跨平台的视频编辑器，支持 Windows、Mac 和 Linux。主要功能包括支持广泛的格式；无需导入，即原生时间线编辑；Blackmagic Design 支持输入和预览监控；以及分辨率支持至 4K。

视频剪辑 # Shotcut # 视频剪辑 # 视频编辑

0240 0

暂无评论

none

暂无评论...

日榜周榜月榜

Cherry Studio

Cherry Studio - 最新版

Cherry Studio 作为一款全能 AI 助手平台，凭借其广泛的模型兼容性、丰富的功能、高度自定义能力和强大的数据安全保障，成为提升工作效率和激发创造力的理想工具。

1,449 40

MagicMirror

MagicMirror - 最新版

MagicMirror 以其便捷性、安全性和轻量级设计，为用户提供了一个简单易用的 AI 换脸工具。无论是新手还是专业人士，都能通过它轻松探索更美的自己。

478 0

卡卡字幕助手（VideoCaptioner）

卡卡字幕助手（VideoCaptioner） - 最新版

VideoCaptioner是一款功能强大且易于使用的视频字幕处理工具。它不仅支持语音识别、字幕优化和翻译全流程处理，还提供了丰富的配置选项，满足不同用户的需求。

966 35

Goodnotes

Goodnotes - 最新版

Goodnotes 助你轻松捕捉和表达自己的想法，还可以在网页、平板电脑、电脑跨平台整理笔记。

335 1

Calibre

Calibre - 最新版

Calibre 是一款强大且易用的电子书管理软件，用户评价它是“神级必备”。它几乎能满足你对电子书的所有需求，功能远超普通电子书软件，而且完全免费、完全开源，无论你是普通读者还是技术达人，都能轻松上手。

37 0

GoNavi

GoNavi - 最新版

GoNavi 是基于 Wails (Go) 与 React 构建的跨平台数据库管理工具，强调原生性能、低资源占用与多数据源统一工作流。相比常见 Electron 客户端，GoNavi 在体积、启动速度和内存占用上更轻量。

25 2

查看完整榜单