JJYB_AI智剪 v2.0最新版

官方版无广告49

JJYB_AI 智剪是一款离线配音 + AI解说 + 自动混剪一体化工具，支持原创解说、混剪、配音，无需联网依赖

更新日期：

2025年12月29日

分类标签：

视频剪辑JJYB_AI 智剪视频剪辑

语言：

中文

平台：

380MB9 人已下载手机查看

JJYB_AI 智剪是一款离线配音 + AI解说 + 自动混剪一体化工具，支持原创解说、混剪、配音，无需联网依赖。

快速上手（仅需 3 步）

1️⃣ 检查系统环境

python check_system.py

脚本会自动检测 Python 版本、依赖项、FFmpeg 是否就绪。

2️⃣ 启动应用

图形方式：双击 启动应用.bat
命令行方式：
```
python frontend/app.py
```

3️⃣ 访问界面

打开浏览器，输入：

http://localhost:5000

首次启动后会自动打开配置页面。

三大核心功能

视频编辑器

完整播放控制 + 多轨道时间线
音画/字画/字音三重同步，误差 <100ms
支持特效、滤镜、转场等专业级操作
访问地址：http://localhost:5000/

AI配音（TTS）

支持 4 种语音合成引擎：
- Edge-TTS（免费，23+ 音色）
- Google TTS (gTTS)（免费，100+ 语言）
- Azure TTS（专业级，需付费）
- Voice Clone（本地语音克隆）
内置 pyttsx3 离线回退机制，网络异常时仍可配音
访问地址：http://localhost:5000/voiceover

原创解说（全自动流程）

上传视频 → 2. 视觉模型分析画面 → 3. LLM 生成解说文案 → 4. TTS 配音 → 5. 合成成品

支持 精确时间轴对齐
访问地址：http://localhost:5000/commentary

AI 模型支持一览

大语言模型（9 种）

✅ 通义千问（阿里，推荐）
✅ 文心一言（百度）
✅ ChatGLM（智谱AI）
✅ DeepSeek（性价比高）
✅ GPT-4 / GPT-3.5（OpenAI，专业版）
✅ Claude 3（Anthropic，高级推理）
✅ Gemini（Google，多模态）
✅ Kimi（月之暗面，长文本）
✅ 讯飞星火（科大讯飞）

视觉分析模型（6 种）

✅ 通义千问VL（推荐）
✅ 百度视觉
✅ 腾讯云视觉
✅ GPT-4V（OpenAI Vision）
✅ Gemini Vision
✅ Claude Vision

技术栈详情

模块	技术选型
Web 框架	Flask 3.0+，Flask-SocketIO 5.3+，SQLite
桌面集成	PyWebView 4.4+
深度学习	PyTorch 2.0+，Ultralytics (YOLOv8)
音频处理	Librosa, SoundFile, Pydub
语音识别	Whisper / faster-whisper
语音合成	Edge-TTS, gTTS, Azure TTS, Voice Clone
视频处理	FFmpeg（自动安装），MoviePy 1.0+，OpenCV 4.8+
图像/字幕	Pillow 10.0+，ImageIO，pysrt

使用流程指南

第一步：配置 API（首次使用必做）

访问：http://localhost:5000/api_settings

必填项：至少配置 1 个大语言模型（推荐通义千问或 DeepSeek）
可选项：
- 视觉分析模型（推荐通义千问VL）
- 专业 TTS 引擎（如 Azure）
- 本地语音克隆（需额外模型）

所有 API 均支持“测试连接”按钮，确保密钥有效。

第二步：选择功能模块

🎙️ 原创解说模式

自动从画面生成文案 → 配音 → 合成
52 项可调参数，涵盖：
- 多模态特征提取（6项）
- 时间轴优化（4项）
- 性能调优（4项）
- 跨平台适配（6项）

✂️ 混剪模式（两种）

大众混剪：AI识别精彩片段，自动加转场/特效，支持风格选择（燃向/治愈/搞笑等）
音乐卡点混剪：上传音乐 → 自动节奏分析（4种算法）→ 卡点策略（4种）→ 智能排序

两种模式共提供 34 项配置参数

🔊 AI配音

输入文本 → 选择引擎/音色 → 调节语速/音调/音量
38 项高级配置，包括：
- 声学模型（5种）
- 声码器（5种）
- 韵律预测（8参数）
- 情感 TTS（12参数）
- 说话人嵌入（8参数）

常见问题排查

问题	解决方案
Python 未安装	下载 Python 3.9–3.11，安装时务必勾选 Add to PATH
端口 5000 被占用	启动时输入 `[Y]` 自动释放，或手动执行： `netstat -ano \| findstr ":5000"` → `taskkill /F /PID [ID]`
依赖包缺失	运行 `安装AI依赖.bat`，或： `pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/`
AI功能不可用	检查 `http://localhost:5000/api_settings`，确保 API 密钥有效且已测试通过
页面无法加载	尝试 `http://127.0.0.1:5000`，关闭防火墙或杀毒软件临时测试

系统要求

最低配置

OS：Windows 10/11（64位）
Python：3.9 – 3.11（必须）
内存：8GB
硬盘：10GB 可用空间
网络：安装依赖和调用 API 时需要

依赖包体积

基础依赖：~500MB
PyTorch（CPU版）：~200MB
AI模型：~1GB
总计约 2GB

项目统计（v2.0）

类别	数量
功能配置项	143（原创解说 52 + 混剪 34 + 配音 38 + API 19）
支持模型/算法	29（LLM 9 + 视觉 6 + TTS 4 + 声学 5 + 声码器 5）
技术文档	16（含核心、配置、总结文档）

版本历史

v2.0（2025-11-10）
✅ 统一启动脚本（智能环境检测）
✅ 19个 AI 模型统一配置
✅ 原创解说、混剪、配音三大功能完整上线
✅ 16份技术文档同步发布
v1.0（2024）
基础视频编辑 + 简易 AI 配音

去官方网站了解更多

VideoSOS - 最新版

VideoSOS - 开源AI视频编辑器，集成100+模型，在您的浏览器中用AI创作专业视频。免费、开源的视频编辑器，集成 Google Veo 3.1、FLUX、Gemini 2.5 Flash、Imagen 4 等 100 多个顶尖 AI 模型，支持文生视频、图生视频、文生图、图像编辑、音乐创作和画外音生成。无需上传，完全隐私，提供高级时间线编辑功能。