AI 视频图文创作助手(AI-Media2Doc)

2个月前发布 42 00

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。

所在地:
中国
收录时间:
2025-10-19
AI 视频图文创作助手(AI-Media2Doc)AI 视频图文创作助手(AI-Media2Doc)

AI 视频图文创作助手是一个开源的 Web 工具,能将视频或音频内容一键转化为多种风格的结构化文档——比如小红书笔记、微信公众号文章、知识卡片、思维导图或内容摘要。整个过程无需注册登录,支持前后端本地部署,数据完全留在你自己的设备上。

AI 视频图文创作助手(AI-Media2Doc)

为什么做这个工具?

开发者最初只是想把感兴趣的视频内容转成文字,方便阅读、思考和做笔记。但市面上的工具大多要求注册、付费,或需上传内容到第三方平台,既不方便也不安全。于是,他动手做了这个 MIT 协议开源的小应用,让每个人都能以极低的成本、在本地完成音视频到图文的转换。

核心功能

  • 完全开源,MIT 协议:可自由使用、修改和部署
  • 无需登录注册:所有任务记录保存在本地浏览器,无账户体系
  • 前端处理音视频:基于 ffmpeg.wasm,无需本地安装 ffmpeg
  • 多风格输出:支持小红书、公众号、知识笔记、思维导图、内容总结等格式
  • AI 二次问答:针对视频内容提问,获取进一步解释
  • 智能图文排版:根据字幕时间戳自动截图并插入文档,实现“真正的图文并茂”(无需视觉大模型)
  • 字幕导出:结果可一键导出为 SRT 等字幕文件
  • 自定义 Prompt:在前端灵活调整 AI 生成逻辑
  • Docker 一键部署:后端服务可通过单条命令快速启动
  • 访问密码保护:可为本地服务设置密码,防止未授权访问
AI 视频图文创作助手(AI-Media2Doc)

本地部署步骤(Docker)

  1. 安装 Docker
    Windows 用户建议通过 WSL 运行。
  2. 构建镜像
    在项目根目录执行:

    make docker-image
    
  3. 配置环境变量
    复制 variables_template.env 为 variables.env,并按需填写 API 密钥等配置(如使用本地 Whisper 模型,可不依赖云端服务)。
  4. 启动服务
    make run
    

服务启动后,打开浏览器即可使用,所有音视频处理均在本地完成。

未来计划

  • 集成 Fast-Whisper 本地语音识别模型,进一步降低对云端 API 的依赖,提升隐私性和成本效益。

数据统计

相关导航

暂无评论

none
暂无评论...