Videocut

5天前发布 8 00

Videocut 是一套专为口播类视频(Spoken-word content)打造的 AI 编辑能力集。它由 7 个独立的 CLI 工具组成,既可单独调用解决特定问题,也能串联成全自动化的生产流水线。

所在地:
中国
收录时间:
2026-04-04
VideocutVideocut

Videocut 是一套专为口播类视频(Spoken-word content)打造的 AI 编辑能力集。它由 7 个独立的 CLI 工具组成,既可单独调用解决特定问题,也能串联成全自动化的生产流水线。

从原始录制素材到最终的精剪视频、字幕、金句切片、封面卡片及章节短视频,Videocut 能一键搞定。其核心设计理念是"零 npm 依赖"(仅依赖系统级 Node.js, FFmpeg, Whisper, Chrome),克隆即用,极致轻量,且具备完善的 AI Fallback 机制,确保在 AI 服务不可用时仍能完成基础剪辑。

核心亮点

  • 模块化设计:7 大能力(转录、粗剪、字幕、金句、切片、封面、变速)独立可用,灵活组合。
  • 自动化流水线:支持 pipeline 模式,一键执行“粗剪→变速→字幕→金句→封面”全流程。
  • 零 npm 依赖:仅使用 Node.js 内置模块进行编排,无需 npm install,避免依赖地狱。
  • 健壮性优先:内置多级 Fallback 链。若 Claude AI 调用失败,自动降级为静音检测、均分切片或全文提取,保证任务不中断。
  • 批量处理:原生支持目录输入(Batch Mode),自动处理文件夹内所有视频。
  • Agent 友好:每个能力配有 SKILL.md,定义清晰的输入输出契约,完美适配 AI Agent 调用。

七大核心能力

能力命令功能描述输出示例
Transcribetranscribe本地 Whisper 语音转文字,生成 JSON/TXT/SRT。内置缓存机制。transcript.jsontranscript.srt
AutoCutautocutAI 分析口误/语气词 + 静音检测,自动粗剪。支持自定义规则。cut.mp4cut_feedback.json
Subtitlesubtitle检测硬字幕;若无则转录并烧录软字幕(白字黑边)。cut_subtitled.mp4
HookhookAI 提取金句,精准定位时间轴,切割成短视频片段。hooks.json3_hook.mp4
ClipclipAI 分析语义章节,将长视频拆分为 2-5 分钟的短视频。chapters.jsonclips/*.mp4
Covercover基于金句或文本,利用 Chrome Headless 生成 1080x1080 封面卡片。4_card_1.png
Speedspeed无损变速(1.0x-1.2x),音高不变,提升观看节奏。speed.mp4

快速开始

1. 环境准备

只需安装系统级依赖,无需配置 Node 环境:

# macOS
brew install ffmpeg node
pip install openai-whisper
# 确保已安装 Chrome 和 Claude CLI (可选,用于 AI 增强)

2. 克隆与运行

git clone https://github.com/zinan92/videocut.git
cd videocut

# 场景 A:最常用流程(粗剪 + 加字幕)
node cli.js pipeline input.mp4 --steps autocut,subtitle -o output/ --no-review

# 场景 B:提取 4 个金句片段
node cli.js hook input.mp4 -o output/ --count 4

# 场景 C:批量处理整个目录
node cli.js pipeline ~/videos/ --steps autocut,subtitle -o output/

智能流水线 (Pipeline)

通过 pipeline 命令,可将多个步骤串联,共享中间结果(如转录文件),避免重复计算。

推荐执行顺序
autocut (粗剪) → speed (变速) → subtitle (字幕) → hook (金句) → clip (章节) → cover (封面)

示例

# 完整生产流程:粗剪 -> 变速 1.1x -> 字幕 -> 金句 -> 封面
node cli.js pipeline input.mp4 \
  --steps autocut,speed,subtitle,hook,cover \
  -o output/

🛡️ 强大的 Fallback 机制

Videocut 的核心优势在于其永不崩溃的设计。当 AI 服务(Claude)不可用或未认证时,系统会自动降级执行:

能力AI 成功路径AI 失败 Fallback 路径
AutoCutClaude 标记口误/语气词仅使用静音检测切除停顿
HookAI 选金句 → SRT 匹配AI 失败→全文做金句;SRT 匹配失败→取前 10 秒
ClipAI 语义章节分析均分切割为 ~120 秒片段
Cover读取 hooks.json 生成Pipeline 模式下自动提取转录前 200 字

这种设计确保了即使在离线或无 API Key 的环境下,用户依然能获得基础的剪辑能力。

面向 AI Agent 的集成

Videocut 专为 Agent 协作设计,每个能力都有独立的 SKILL.md 文档,定义了严格的输入输出契约。

Agent 调用示例 (Python)

import subprocess

# 任务:口播视频自动化处理
subprocess.run([
    "node", "cli.js", "pipeline", "lecture.mp4",
    "--steps", "autocut,subtitle,hook",
    "-o", "./processed/",
    "--no-review"
], cwd="/path/to/videocut")

能力契约摘要

  • Input: 视频文件路径 或 视频目录。
  • Output: 编辑后的视频、字幕文件、金句 JSON、封面图片等。
  • Error Handling: 明确的退出码(exit 1)和错误提示(文件缺失、依赖未安装等)。

典型应用场景

  1. 网课/讲座处理:批量导入录制视频,自动切除废话停顿,加速播放,添加字幕,并按章节切分成短视频上传平台。
  2. 播客/访谈剪辑:自动提取精彩金句(Hooks)作为宣传短片,生成带金句的封面图用于社交媒体传播。
  3. 短视频创作者:一键将长视频转化为符合 TikTok/Reels 格式的竖屏切片,自动添加吸睛字幕和封面。
  4. 企业内训视频:快速清洗内部培训录像,统一风格,生成可检索的字幕文件,便于员工复习。

数据统计

相关导航

暂无评论

none
暂无评论...