JJYB_AI智剪 v2.0
 JJYB_AI智剪 v2.0

JJYB_AI智剪 v2.0最新版

官方版无广告30

JJYB_AI 智剪是一款离线配音 + AI解说 + 自动混剪一体化工具,支持原创解说、混剪、配音,无需联网依赖

更新日期:
2025年12月29日
语言:
中文
平台:

380MB4 人已下载 手机查看

JJYB_AI 智剪是一款离线配音 + AI解说 + 自动混剪一体化工具,支持原创解说、混剪、配音,无需联网依赖。

快速上手(仅需 3 步)

1️⃣ 检查系统环境

python check_system.py

脚本会自动检测 Python 版本、依赖项、FFmpeg 是否就绪。

2️⃣ 启动应用

  • 图形方式:双击 启动应用.bat
  • 命令行方式
    python frontend/app.py
    

3️⃣ 访问界面

打开浏览器,输入:

http://localhost:5000

首次启动后会自动打开配置页面。

三大核心功能

视频编辑器

  • 完整播放控制 + 多轨道时间线
  • 音画/字画/字音三重同步,误差 <100ms
  • 支持特效、滤镜、转场等专业级操作
  • 访问地址:http://localhost:5000/

AI配音(TTS)

  • 支持 4 种语音合成引擎
    • Edge-TTS(免费,23+ 音色)
    • Google TTS (gTTS)(免费,100+ 语言)
    • Azure TTS(专业级,需付费)
    • Voice Clone(本地语音克隆)
  • 内置 pyttsx3 离线回退机制,网络异常时仍可配音
  • 访问地址:http://localhost:5000/voiceover

原创解说(全自动流程)

  1. 上传视频 → 2. 视觉模型分析画面 → 3. LLM 生成解说文案 → 4. TTS 配音 → 5. 合成成品
  • 支持 精确时间轴对齐
  • 访问地址:http://localhost:5000/commentary

AI 模型支持一览

大语言模型(9 种)

  • ✅ 通义千问(阿里,推荐)
  • ✅ 文心一言(百度)
  • ✅ ChatGLM智谱AI)
  • ✅ DeepSeek(性价比高)
  • ✅ GPT-4 / GPT-3.5(OpenAI,专业版)
  • ✅ Claude 3(Anthropic,高级推理)
  • ✅ Gemini(Google,多模态)
  • ✅ Kimi(月之暗面,长文本)
  • ✅ 讯飞星火(科大讯飞)

视觉分析模型(6 种)

  • ✅ 通义千问VL(推荐)
  • ✅ 百度视觉
  • ✅ 腾讯云视觉
  • ✅ GPT-4V(OpenAI Vision)
  • ✅ Gemini Vision
  • ✅ Claude Vision

技术栈详情

模块技术选型
Web 框架Flask 3.0+,Flask-SocketIO 5.3+,SQLite
桌面集成PyWebView 4.4+
深度学习PyTorch 2.0+,Ultralytics (YOLOv8)
音频处理Librosa, SoundFile, Pydub
语音识别Whisper / faster-whisper
语音合成Edge-TTS, gTTS, Azure TTS, Voice Clone
视频处理FFmpeg(自动安装),MoviePy 1.0+,OpenCV 4.8+
图像/字幕Pillow 10.0+,ImageIO,pysrt

使用流程指南

第一步:配置 API(首次使用必做)

访问:http://localhost:5000/api_settings

  • 必填项:至少配置 1 个大语言模型(推荐通义千问或 DeepSeek)
  • 可选项
    • 视觉分析模型(推荐通义千问VL)
    • 专业 TTS 引擎(如 Azure)
    • 本地语音克隆(需额外模型)

所有 API 均支持“测试连接”按钮,确保密钥有效。

第二步:选择功能模块

🎙️ 原创解说模式

  • 自动从画面生成文案 → 配音 → 合成
  • 52 项可调参数,涵盖:
    • 多模态特征提取(6项)
    • 时间轴优化(4项)
    • 性能调优(4项)
    • 跨平台适配(6项)

✂️ 混剪模式(两种)

  1. 大众混剪:AI识别精彩片段,自动加转场/特效,支持风格选择(燃向/治愈/搞笑等)
  2. 音乐卡点混剪:上传音乐 → 自动节奏分析(4种算法)→ 卡点策略(4种)→ 智能排序

两种模式共提供 34 项配置参数

🔊 AI配音

  • 输入文本 → 选择引擎/音色 → 调节语速/音调/音量
  • 38 项高级配置,包括:
    • 声学模型(5种)
    • 声码器(5种)
    • 韵律预测(8参数)
    • 情感 TTS(12参数)
    • 说话人嵌入(8参数)

常见问题排查

问题解决方案
Python 未安装下载 Python 3.9–3.11,安装时务必勾选 Add to PATH
端口 5000 被占用启动时输入 [Y] 自动释放,或手动执行:
netstat -ano | findstr ":5000" → taskkill /F /PID [ID]
依赖包缺失运行 安装AI依赖.bat,或:
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
AI功能不可用检查 http://localhost:5000/api_settings,确保 API 密钥有效且已测试通过
页面无法加载尝试 http://127.0.0.1:5000,关闭防火墙或杀毒软件临时测试

系统要求

最低配置

  • OS:Windows 10/11(64位)
  • Python:3.9 – 3.11(必须)
  • 内存:8GB
  • 硬盘:10GB 可用空间
  • 网络:安装依赖和调用 API 时需要

推荐配置

  • OS:Windows 11
  • Python:3.10(最佳兼容性)
  • 内存:16GB
  • 硬盘:20GB+ SSD
  • CPU:4核+
  • GPU:NVIDIA(可选,加速 AI 推理)

依赖包体积

  • 基础依赖:~500MB
  • PyTorch(CPU版):~200MB
  • AI模型:~1GB
  • 总计约 2GB

项目统计(v2.0)

类别数量
功能配置项143(原创解说 52 + 混剪 34 + 配音 38 + API 19)
支持模型/算法29(LLM 9 + 视觉 6 + TTS 4 + 声学 5 + 声码器 5)
技术文档16(含核心、配置、总结文档)

版本历史

  • v2.0(2025-11-10)
    ✅ 统一启动脚本(智能环境检测)
    ✅ 19个 AI 模型统一配置
    ✅ 原创解说、混剪、配音三大功能完整上线
    ✅ 16份技术文档同步发布
  • v1.0(2024)
    基础视频编辑 + 简易 AI 配音

相关软件

暂无评论

none
暂无评论...