Lightricks 双重重磅发布:LTX-2.3 模型进化与 LTX Desktop 开源编辑器,本地视频生成时代正式来临

早报4小时前更新 小马良
7 0

Lightricks 今日宣布同步推出两项里程碑式产品:LTX-2.3,一个经过实战打磨、架构全面升级的视频生成模型;以及 LTX Desktop,一款直接构建于该引擎之上的生产级本地视频编辑器。

这不仅是一次版本更新,更是一个信号:高质量、可控、完全本地的 AI 视频工作流已经成熟。 最重要的是,这一切对绝大多数用户而言——免费且开源

  • API:https://console.ltx.video
  • GitHub:https://github.com/Lightricks/LTX-2
  • 模型:https://huggingface.co/Lightricks/LTX-2.3

核心发布一:LTX-2.3 模型架构进化

LTX-2.3 并非简单的参数微调,而是针对上一代用户反馈最强烈的痛点进行的底层重构。它在细节、理解力、运动控制和多模态支持上实现了质的飞跃。

1. 🎨 极致细节:重建潜空间与 VAE

  • 痛点解决:旧版本在毛发、边缘和精细纹理上略显柔和,往往需要后期锐化。
  • 全新架构:重建了 VAE(变分自编码器)并在更高质量数据上训练。新的潜空间能生成更锐利、更清晰的图像,完美保留纹理细节。
  • 价值:无论分辨率高低,直出即精品,大幅减少后期放大的需求。

2. 🧠 超强理解:更大容量的文本连接器

  • 痛点解决:复杂提示词(多主体、空间关系、特定风格)容易导致生成偏差。
  • 能力升级:扩大了文本连接器(Text Connector)容量,优化了其与生成模型的连接架构。
  • 价值:模型现在能精准解读长难句复杂指令。你不再需要为了“讨好”模型而简化提示词,可以尽情描述你的创意细节。

3. 🏃 动态升级:图像转视频(Img2Vid)的重大突破

  • 痛点解决:此前 Img2Vid 常出现画面冻结、缓慢平移(Ken Burns 效应)或意外切换。
  • 重新训练:专门针对运动一致性进行优化,消除静态视频,减少意外跳转。
  • 价值:输入一张图,就能得到真正“动起来”的视频,且视觉连贯性大幅提升,显著降低废片率。

4. 🔊 纯净音频:新声码器与数据清洗

  • 全面净化:过滤了训练集中的静音、噪音和伪影,推出全新声码器。
  • 价值:无论是文生视频还是音生视频,生成的音频更可靠、对齐更紧密,随机杂音和意外中断成为历史。

5. 📱 原生竖屏:拥抱移动端创作

  • 首次支持:原生支持高达 1080x1920 的竖屏分辨率。
  • 训练策略:直接使用竖屏数据训练,而非横屏裁剪。
  • 价值:完美适配 TikTok、Instagram Reels、YouTube Shorts 等短视频平台,无需二次构图,一键生成移动端爆款内容。

核心发布二:LTX Desktop —— 您的本地视频工作站

如果说 LTX-2.3 是心脏,那么 LTX Desktop 就是四肢。这是 Lightricks 首次发布的官方界面应用,直接证明了其引擎的生产力。

🌟 为什么 LTX Desktop 如此重要?

  • 🔒 100% 本地运行
    • 设置完成后,无需联网即可生成视频。
    • 零生成成本:不用按秒付费,不用担心额度耗尽。
    • 数据隐私:所有素材和生成内容完全留在您的机器上。
  • 🛠️ 生产级编辑器
    • 不仅仅是生成,更提供时间轴、预览、参数调整等专业编辑功能。
    • 内置 ComfyUI 工作流支持,可无缝衔接社区生态。
  • 🆓 免费且开源
    • 个人/小团队免费:年收入低于 1000 万美元的公司及个人用户,完全免费使用。
    • 开源精神:代码开放,社区可共同维护和改进。
    • 商业许可:仅对年收超 1000 万的大企业收取商业授权费。

💡 灵活部署
既可以在本地显卡上全速运行,也可以配置为调用云端 API 作为后端,兼顾性能与便利。

🤝 社区力量:从 500 万下载量到生态繁荣

自 LTX-2 发布以来,社区展现了惊人的创造力:

  • 速度飞跃:EasyCache 插件实现了 2.3 倍 的推理加速。
  • 硬件兼容:社区推出了针对各种非官方测试硬件的量化版本。
  • 风格扩展:无数 LoRA 模型涌现,覆盖了官方未曾设想的风格、运动模式和应用场景。
  • 节点生态:丰富的 ComfyUI 节点库,将 LTX 的能力延伸到了无限可能。

Lightricks 特别致谢 Banodoco 社区及所有贡献者,是他们的探索推动了技术的边界。

📦 今日发布资源清单

所有资源现已上线 Hugging Face 及官方渠道:

  • ✅ LTX-2.3 基础检查点 (Base Checkpoint)
  • ✅ LTX-2.3 蒸馏检查点 & LoRA (Distilled & LoRA)
  • ✅ LTX-2.3 潜空间放大器 (Latent Upscaler)
  • ✅ LTX Desktop Beta 版 (免费下载,开源代码)
  • ✅ 完整工具链:包含训练框架、基准测试、多模态流程(文生视频、图生视频、视频生视频、音频条件、深度控制等)
  • ✅ ComfyUI 参考工作流:开箱即用,即刻上手

通过 LTX-2.3 的硬核升级和 LTX Desktop 的开源免费策略,他们不仅提供了一个强大的模型,更交付了一套完整、可控、低成本的生产力解决方案。对于创作者、独立开发者和中小企业而言,这无疑是最好的时代。

© 版权声明

相关文章

暂无评论

none
暂无评论...