在视频创作领域,制作一部电影感十足的纪录片通常意味着庞大的团队、昂贵的设备和漫长的周期。但现在,ContentMachine 正在打破这一壁垒。
这是一个全能的 AI 工作流,只需输入一个主题,它就能自动完成从历史研究、剧本创作、分镜规划,到图像生成、视频合成、配音配乐,乃至 YouTube 元数据和缩略图制作的全过程。最终,它将所有素材打包成一个干净的 ZIP 文件,让你能直接导入剪辑软件进行最后打磨。
专为独立创作者、纪录片制作人、教育工作者打造,ContentMachine 让“单人剧组”成为现实。

核心工作流:六步打造电影级叙事
ContentMachine 并非简单的“文生视频”,而是一个结构严谨的六步引导式工作流,确保每一步都可控、可调整:
- 📜 故事生成 (Story Generation)
- LLM 基于你的主题,挖掘 4 个真实、有据可查的历史故事,并评估其电影潜力。
- 人机协作:你从中选择一个最感兴趣的故事,确保创作方向符合预期。
- 🎥 场景规划 (Scene Planning)
- LLM 构建完整的电影镜头列表,包含智能节奏控制。
- 模型自适应:根据你选择的视频生成模型(如 LTX-2, Kling),自动调整每个镜头的时长和节奏,避免生成无效片段。
- 🖼️ 图像生成 (Image Generation)
- 为每个场景生成 4 个变体(全景、亲密特写、细节、氛围),涵盖不同视角。
- 精选机制:你可以手动选择最佳的一张,所有生成的图像(包括未选中的)都会以高清 PNG/JPG 格式保存在最终包中。
- 风格统一:默认采用无缝光滑瓷器人体模型风格(无关节、无支架、照片级真实环境),也可通过自定义提示词锁定任何角色风格。
- 🎞️ 视频生成 (Video Generation)
- 基于选定的图像,进行图生视频 (Image-to-Video) 处理。
- 批量与对比:一次生成 2 个场景,支持多种模型(LTX-2, Kling 等)。你可以使用 ← → 箭头浏览同一场景的不同版本,选择最佳片段。
- 🔊 音频合成 (Audio - 可选)
- 集成 ElevenLabs 生成情感丰富的旁白配音。
- 自动为每个场景匹配音效,增强沉浸感。也支持本地 TTS(如 QWEN TTS)以实现零成本。
- 📦 终极导出 (Export)
- 生成完整的 YouTube 项目包:
- 视频文件:所有生成及选中的片段。
- 图像资产:选中图、所有变体图、历史版本图。
- 音频与脚本:旁白、音效、完整剧本。
- 元数据:4 个标题选项、SEO 描述、标签、章节时间戳、多选缩略图。
- project.json:完全可恢复的项目状态文件。
🛠️ 技术亮点:灵活、稳健、可定制
ContentMachine 不仅仅是一个黑盒工具,它为高级用户提供了极高的控制权:
- 多模型支持:
- LLM:支持 Gemini 3 Flash (推荐), Claude 3.5 Sonnet 等。
- 图像:支持 Flux Pro, Nano Banana Pro, Ideogram V3 等。
- 视频:支持 LTX-2 Pro/Fast, Kling v3/v2.5 等,适应不同时长和质量需求。
- 音频:ElevenLabs 或本地 TTS。
- 断点续传与版本管理:
- 随时暂停/恢复:可在任何批处理中途安全停止,之后继续,无需重头再来。
- 历史回溯:所有图像、视频、缩略图的重新生成版本均被保存。你可以随时通过 ← → 箭头查看历史,并选择任意旧版本作为最终素材。
- 角色一致性锁定:
- 上传角色基础图像(参考图),AI 将在所有场景中保持该角色的外貌特征(肤色、发型、体型),同时根据剧情自动更换符合时代的服装。
- 自动会话保存:
- 每完成一个步骤,系统自动将真实文件(非 Base64)保存至本地
output/ 目录。即使浏览器崩溃,也能通过“会话浏览器”瞬间恢复进度。
- 成本透明与控制:
- 实测制作一个 4 分 30 秒 的纪录片成本约为 $28。
- 提供多种省钱技巧:如使用
gemini-2.5-flash 替代预览版,使用 Flux Schnell 生成图像,或使用本地 TTS。
💻 快速上手指南
ContentMachine 设计为本地运行,保护隐私且无云端限制。
前提条件:
- Node.js 18+
- 至少一个 LLM 和一个图像/视频提供商的 API 密钥(如 Replicate, Gemini, fal.ai)。
安装与运行:
# 1. 克隆仓库
git clone https://github.com/Saganaki22/ContentMachine
cd ContentMachine
# 2. 安装依赖
npm install
# 3. 启动开发服务器(前后端同时运行)
npm run dev
访问 http://localhost:5173 即可开始创作。API 密钥可在应用内的设置面板直接配置,并保存在本地浏览器存储中,无需修改 .env 文件。
生产环境部署:
npm run build
npm run start
视觉风格与自定义
- 默认美学:采用独特的“光滑瓷器人体模型”风格,人物穿着符合时代的全套服装(含鞋履细节),无可见关节或支撑物,背景为照片级真实的光线追踪环境。这种风格既美观又避免了真实人物肖像权的争议。
- 完全可定制:在起始页面展开 “高级 - 自定义系统提示”,你可以编辑从故事选择到缩略图生成的每一个环节的 Prompt 规则,打造专属的视觉风格。