H1111 - 最新版
H1111 不是一个“一键生成”的玩具,而是一个面向专业用户的视频生成工作站。它将 musubi-tuner 的强大能力封装为图形界面,同时通过 RamTorch、FP8、Block Swapping 等技术,让高质量视频生成在消费级显卡上成为可能。
NarratoAI 是一个面向影视解说、短剧混剪等内容创作者的开源自动化工具。它基于大语言模型(LLM)和多模态技术,实现从剧情理解、文案撰写、视频剪辑、配音生成到字幕同步的完整流程,旨在降低视频内容生产的门槛,提升创作效率。

项目目前仅供学习与研究使用,禁止商用。所有处理均在本地或通过用户自定义 API 完成,支持主流云服务商与开源模型。
项目计划发布 Windows 整合包(含依赖与运行时),降低部署门槛。
| 日期 | 版本 | 主要更新 |
|---|---|---|
| 2025-11-20 | v0.7.5 | 新增 IndexTTS2 语音克隆 支持 |
| 2025-10-15 | v0.7.3 | 引入 LiteLLM,统一管理 OpenAI、DeepSeek、Qwen 等模型供应商 |
| 2025-09-10 | v0.7.2 | 集成 腾讯云 TTS,提升中文语音自然度 |
| 2025-08-18 | v0.7.1 | 支持 语音克隆 与最新多模态大模型 |
| 2025-05-11 | v0.6.0 | 正式支持 短剧解说,优化剪辑逻辑与节奏控制 |
| 2025-03-06 | v0.5.2 | 支持 DeepSeek R1 / V3 模型用于短剧混剪 |
| 2024-12-16 | v0.3.9 | 首次集成 阿里 Qwen2-VL 视频理解模型,支持短剧混剪 |