AI 视频图文创作助手（AI-Media2Doc）

5个月前发布 81 00

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务。

所在地：

中国

收录时间：

2025-10-19

打开网站手机查看

AI小应用 # AI 视频图文创作助手 # AI-Media2Doc

AI 视频图文创作助手（AI-Media2Doc）

打开网站

AI 视频图文创作助手是一个开源的 Web 工具，能将视频或音频内容一键转化为多种风格的结构化文档——比如小红书笔记、微信公众号文章、知识卡片、思维导图或内容摘要。整个过程无需注册登录，支持前后端本地部署，数据完全留在你自己的设备上。

为什么做这个工具？

开发者最初只是想把感兴趣的视频内容转成文字，方便阅读、思考和做笔记。但市面上的工具大多要求注册、付费，或需上传内容到第三方平台，既不方便也不安全。于是，他动手做了这个 MIT 协议开源的小应用，让每个人都能以极低的成本、在本地完成音视频到图文的转换。

核心功能

完全开源，MIT 协议：可自由使用、修改和部署
无需登录注册：所有任务记录保存在本地浏览器，无账户体系
前端处理音视频：基于 ffmpeg.wasm，无需本地安装 ffmpeg
多风格输出：支持小红书、公众号、知识笔记、思维导图、内容总结等格式
AI 二次问答：针对视频内容提问，获取进一步解释
智能图文排版：根据字幕时间戳自动截图并插入文档，实现“真正的图文并茂”（无需视觉大模型）
字幕导出：结果可一键导出为 SRT 等字幕文件
自定义 Prompt：在前端灵活调整 AI 生成逻辑
Docker 一键部署：后端服务可通过单条命令快速启动
访问密码保护：可为本地服务设置密码，防止未授权访问

本地部署步骤（Docker）

安装 Docker
Windows 用户建议通过 WSL 运行。
构建镜像
在项目根目录执行：
```
make docker-image
```
配置环境变量
复制 variables_template.env 为 variables.env，并按需填写 API 密钥等配置（如使用本地 Whisper 模型，可不依赖云端服务）。
启动服务
```
make run
```

服务启动后，打开浏览器即可使用，所有音视频处理均在本地完成。

未来计划

集成 Fast-Whisper 本地语音识别模型，进一步降低对云端 API 的依赖，提升隐私性和成本效益。

数据统计

暂无评论

暂无评论...

AI 视频图文创作助手（AI-Media2Doc）

为什么做这个工具？

核心功能

本地部署步骤（Docker）

未来计划

数据统计

相关导航

PromptSniffer

AI Baby Monitor

AI自动答题助手

PDF2Audio

双色球AI预测

Nano PDF Editor

Models.dev

红墨 - 小红书AI图文生成器

暂无评论

网址

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work

AI 视频图文创作助手（AI-Media2Doc）

为什么做这个工具？

核心功能

本地部署步骤（Docker）

未来计划

数据统计

相关导航

PromptSniffer

AI Baby Monitor

AI自动答题助手

PDF2Audio

双色球AI预测

Nano PDF Editor

Models.dev

红墨 - 小红书AI图文生成器

暂无评论

网址

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work

标签云

网址

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work