
Flow
Flow是一款专为创意人士打造的AI电影制作工具,它结合了谷歌DeepMind最先进的模型,包括Veo、Imagen和Gemini,能够无缝创建电影片段、场景和故事。用户可以通过自然语言向Flow描述镜头,并在一个便捷的平台上管理故事元素,如角色、地点、物体和风格,进而将叙事编织成精美的场景。
CutClaw 是由 北京交通大学、大湾区大学 GVC 实验室 和 腾讯 ARC 实验室 联合推出的智能长视频剪辑系统。它改变了传统视频剪辑的工作流,让用户只需输入一句自然语言指令,就能将数小时的原始素材自动剪辑成节奏精准、叙事流畅、符合创意的电影级蒙太奇。
无论是制作快节奏的人物高光混剪,还是慢节奏的情感叙事短片,CutClaw 都能通过其独特的 多智能体协作流水线,完美理解音乐节奏与用户意图,实现真正的“所想即所得”。

CutClaw 并非单一模型,而是一个由多个 AI 智能体组成的专家团队:
CutClaw 的工作流分为三个核心阶段:
git clone https://github.com/GVCLab/CutClaw.git
cd CutClaw
conda create -n CutClaw python=3.12
conda activate CutClaw
pip install -r requirements.txt
💡 性能提示:强烈建议安装支持 GPU 加速 (NVDEC) 的
decord版本,以大幅提升视频解码速度。
将文件放入 resource/ 目录:
resource/
├── video/ # 放入 .mp4 / .mkv 视频
├── audio/ # 放入 .mp3 / .wav 音乐
└── subtitle/ # (可选) .srt 字幕,可跳过 ASR 步骤
streamlit run app.py
在浏览器访问 http://localhost:8501,可视化选择文件、输入指令并监控进度。

python local_run.py \
--Video_Path "resource/video/my_video.mp4" \
--Audio_Path "resource/audio/my_music.mp3" \
--Instruction "Make a high-energy action montage of the main character." \
--config.MAIN_CHARACTER_NAME "Batman" \
--config.AUDIO_TOTAL_SHOTS 50
系统通过 LiteLLM 统一调用各类模型,建议在配置文件或环境变量中设置:
gemini-2.0-flash, qwen2.5-vl, gpt-4ogemini-2.0-flash (支持音频输入), whisper-large-v3minimax-abab6.5, kimi-plus, claude-3.5-sonnet| 参数 | 默认值 | 说明 | 调优建议 |
|---|---|---|---|
VIDEO_FPS | 2 | 预处理采样帧率 | 降低可加快解析速度,提高可增加细节捕捉 |
AUDIO_MIN/MAX_SEGMENT | 3.0 / 5.0 | 节拍片段时长范围 | 快节奏音乐可调小 (2-4s),慢节奏调大 (5-8s) |
MAIN_CHARACTER_NAME | - | 主角名称 | 指定后可聚焦该角色的镜头,提升叙事集中度 |
PARALLEL_SHOT_MAX_WORKERS | 4 | 并行线程数 | 根据 API 并发限制调整,避免触发速率限制 |
crop-ratio | - | 输出画幅比 | 支持 9:16 (竖屏), 16:9 (横屏), 1:1 (方形) |
libx264 编码,兼容性最佳。AUDIO_DETECTION_METHODS,尝试组合 downbeat (强拍), pitch (音高变化), mel_energy (旋律能量)。






