Lightricks 今日宣布同步推出两项里程碑式产品:LTX-2.3,一个经过实战打磨、架构全面升级的视频生成模型;以及 LTX Desktop,一款直接构建于该引擎之上的生产级本地视频编辑器。
这不仅是一次版本更新,更是一个信号:高质量、可控、完全本地的 AI 视频工作流已经成熟。 最重要的是,这一切对绝大多数用户而言——免费且开源。
- API:https://console.ltx.video
- GitHub:https://github.com/Lightricks/LTX-2
- 模型:https://huggingface.co/Lightricks/LTX-2.3
核心发布一:LTX-2.3 模型架构进化
LTX-2.3 并非简单的参数微调,而是针对上一代用户反馈最强烈的痛点进行的底层重构。它在细节、理解力、运动控制和多模态支持上实现了质的飞跃。
1. 🎨 极致细节:重建潜空间与 VAE
- 痛点解决:旧版本在毛发、边缘和精细纹理上略显柔和,往往需要后期锐化。
- 全新架构:重建了 VAE(变分自编码器)并在更高质量数据上训练。新的潜空间能生成更锐利、更清晰的图像,完美保留纹理细节。
- 价值:无论分辨率高低,直出即精品,大幅减少后期放大的需求。
2. 🧠 超强理解:更大容量的文本连接器
- 痛点解决:复杂提示词(多主体、空间关系、特定风格)容易导致生成偏差。
- 能力升级:扩大了文本连接器(Text Connector)容量,优化了其与生成模型的连接架构。
- 价值:模型现在能精准解读长难句和复杂指令。你不再需要为了“讨好”模型而简化提示词,可以尽情描述你的创意细节。
3. 🏃 动态升级:图像转视频(Img2Vid)的重大突破
- 痛点解决:此前 Img2Vid 常出现画面冻结、缓慢平移(Ken Burns 效应)或意外切换。
- 重新训练:专门针对运动一致性进行优化,消除静态视频,减少意外跳转。
- 价值:输入一张图,就能得到真正“动起来”的视频,且视觉连贯性大幅提升,显著降低废片率。
4. 🔊 纯净音频:新声码器与数据清洗
- 全面净化:过滤了训练集中的静音、噪音和伪影,推出全新声码器。
- 价值:无论是文生视频还是音生视频,生成的音频更可靠、对齐更紧密,随机杂音和意外中断成为历史。
5. 📱 原生竖屏:拥抱移动端创作
- 首次支持:原生支持高达 1080x1920 的竖屏分辨率。
- 训练策略:直接使用竖屏数据训练,而非横屏裁剪。
- 价值:完美适配 TikTok、Instagram Reels、YouTube Shorts 等短视频平台,无需二次构图,一键生成移动端爆款内容。
核心发布二:LTX Desktop —— 您的本地视频工作站
如果说 LTX-2.3 是心脏,那么 LTX Desktop 就是四肢。这是 Lightricks 首次发布的官方界面应用,直接证明了其引擎的生产力。
🌟 为什么 LTX Desktop 如此重要?
- 🔒 100% 本地运行:
- 设置完成后,无需联网即可生成视频。
- 零生成成本:不用按秒付费,不用担心额度耗尽。
- 数据隐私:所有素材和生成内容完全留在您的机器上。
- 🛠️ 生产级编辑器:
- 不仅仅是生成,更提供时间轴、预览、参数调整等专业编辑功能。
- 内置 ComfyUI 工作流支持,可无缝衔接社区生态。
- 🆓 免费且开源:
- 个人/小团队免费:年收入低于 1000 万美元的公司及个人用户,完全免费使用。
- 开源精神:代码开放,社区可共同维护和改进。
- 商业许可:仅对年收超 1000 万的大企业收取商业授权费。
💡 灵活部署:
既可以在本地显卡上全速运行,也可以配置为调用云端 API 作为后端,兼顾性能与便利。
🤝 社区力量:从 500 万下载量到生态繁荣
自 LTX-2 发布以来,社区展现了惊人的创造力:
- 速度飞跃:EasyCache 插件实现了 2.3 倍 的推理加速。
- 硬件兼容:社区推出了针对各种非官方测试硬件的量化版本。
- 风格扩展:无数 LoRA 模型涌现,覆盖了官方未曾设想的风格、运动模式和应用场景。
- 节点生态:丰富的 ComfyUI 节点库,将 LTX 的能力延伸到了无限可能。
Lightricks 特别致谢 Banodoco 社区及所有贡献者,是他们的探索推动了技术的边界。
📦 今日发布资源清单
所有资源现已上线 Hugging Face 及官方渠道:
- ✅ LTX-2.3 基础检查点 (Base Checkpoint)
- ✅ LTX-2.3 蒸馏检查点 & LoRA (Distilled & LoRA)
- ✅ LTX-2.3 潜空间放大器 (Latent Upscaler)
- ✅ LTX Desktop Beta 版 (免费下载,开源代码)
- ✅ 完整工具链:包含训练框架、基准测试、多模态流程(文生视频、图生视频、视频生视频、音频条件、深度控制等)
- ✅ ComfyUI 参考工作流:开箱即用,即刻上手
通过 LTX-2.3 的硬核升级和 LTX Desktop 的开源免费策略,他们不仅提供了一个强大的模型,更交付了一套完整、可控、低成本的生产力解决方案。对于创作者、独立开发者和中小企业而言,这无疑是最好的时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...














