Video Material GEN Workstation

1周前发布 24 00

Video Material GEN Workstation 是一个面向短视频创作者的 本地化 AI 内容生成与项目管理工具。它将内容策划、AI 文案生成、TTS 配音、AI 图片合成、字幕提取和自由创作整合到一个界面中,帮助用户高效管理每期视频项目,减少重复劳动。

所在地:
中国
收录时间:
2025-11-26
Video Material GEN WorkstationVideo Material GEN Workstation

Video Material GEN Workstation 是一个面向短视频创作者的 本地化 AI 内容生成与项目管理工具。它将内容策划、AI 文案生成、TTS 配音、AI 图片合成、字幕提取和自由创作整合到一个界面中,帮助用户高效管理每期视频项目,减少重复劳动。

Video Material GEN Workstation

核心功能一览

  • 按模板批量生成视频项目:一次配置,自动生成脚本、AI 图片、配音和字幕文件。
  • Gemini + TTS 联动:AI 不仅能改写文案,还能根据情感提示生成带语气的语音。
  • 图文分轨管理:在前端可随时替换图片、音频或字幕,并实时预览合成效果。
  • 素材集中管理:角色设定、场景描述、提示词模板统一维护,支持一键复制复用。
  • 字幕自动提取:通过 ASR(语音识别)从生成的语音中提取字幕,适配剪辑流程。

快速部署指南

  1. 配置环境
    复制 env.example.yaml 为 env.yaml,填入你的:

    • Gemini API Key 与 Base URL
    • TTS 服务密钥(如 ElevenLabs、Azure 等)
    • 默认项目根目录(可选,用于存放生成文件)
  2. 安装与启动
    npm install
    npm start
    

    或直接双击 start.bat(Windows),服务默认运行在 http://localhost:8765

Video Material GEN Workstation

功能模块说明

  • 项目总览
    以卡片形式展示所有视频项目,显示输出路径、创建时间,支持一键删除,便于整理。
  • AI 文案生成
    结构化展示分镜脚本,左侧勾选场景,右侧自动加载对应提示词,支持复制整段或单条文案。
  • TTS 配音合成
    支持单条与批量语音生成,可指定情感风格(如“兴奋”“沉稳”),输出音频文件自动归档。
  • AI 图片生成
    基于 NanoBanana(本地部署的 AI 绘图模型),通过反向代理调用 AI Studio 接口。支持:

    • 角色/背景提示词管理
    • 参考图上传
    • 分辨率与宽高比设置
    • 历史生成记录回溯
  • 字幕生成(ASR)
    在 TTS 界面点击“字幕生成”,调用配套工具自动从语音生成 .srt 字幕文件。该功能依赖外部 ASR 服务(如 Whisper),代码已集成开源实现。
  • 自由创作与提示词库
    内置常用提示词收藏夹,可一键复制;同时提供自由绘图面板,适合手动调整素材。

使用注意事项

  • 文案生成依赖 n8n(可选)
    原作者提到早期版本通过 n8n 自动化流程调用 Gemini,但相关配置文件已遗失。当前版本可直接在界面输入提示词生成文案,n8n 非必需。
  • 字幕提取需配合外部服务
    推荐搭配作者开源的 n8n-http-tools 或其他 ASR 工具使用。B 站高播放视频的字幕也可作为学习参考。
  • 定位是“辅助管理”,非全自动爆款机
    项目核心价值在于提升内容生产效率,而非替代创作。脚本逻辑、选题策略、节奏把控仍需人工主导。如作者所言:“视频能否爆,还得靠自己动脑子。”

适合谁用?

  • 需要批量制作短视频的自媒体运营者
  • 想本地化部署 AI 工具链的技术型创作者
  • 希望统一管理脚本、配音、素材的独立视频团队

数据统计

相关导航

暂无评论

none
暂无评论...