ComfyUI 原生支持 LTX-2.3:开源音视频生成的画质新标杆

工作流4小时前发布 小马良
5 0

ComfyUI 官方正式宣布:Lightricks 最新开源模型 LTX-2.3 现已获得原生支持!

ComfyUI 原生支持 LTX-2.3:开源音视频生成的画质新标杆

这意味着全球数百万 ComfyUI 用户现在可以直接在工作流中调用这一经过全面进化的音视频生成引擎。从更锐利的纹理细节到原生的竖屏视频,从流畅的运动控制到清晰的音频同步,LTX-2.3 正在重新定义本地 AI 视频生成的质量上限。

  • Hugging Face:https://huggingface.co/Lightricks/LTX-2.3
  • GGUF版本:https://huggingface.co/unsloth/LTX-2.3-GGUF

LTX-2.3 六大核心升级

作为基于 DiT (Diffusion Transformer) 架构的音视频基础模型,LTX-2.3 在单一模型内实现了视频与音频的完美同步。相比前代,它在以下六个维度实现了质的飞跃:

1. 🎨 极致细节:重建潜空间与 VAE

  • 升级点:全新的变分自编码器 (VAE) 与重构的潜空间。
  • 效果:纹理更锐利,边缘更清晰,彻底解决了旧版本中毛发和细微物体模糊的问题。直出画面即可达到出版级质感。

2. 📱 原生竖屏 (9:16) 支持

  • 升级点:专门针对竖屏数据进行训练,而非简单的横屏裁剪。
  • 效果:完美适配 TikTok、Reels、Shorts 等移动端平台。人像构图更自然,不再出现头部裁剪或肢体变形。

3. 🔊 纯净音频体验

  • 升级点:清洗后的训练集 + 全新声码器。
  • 效果:显著降低背景底噪,人声对话更清晰,音乐与环境音效层次分明。音画同步率大幅提升。

4. 🏃 流畅运动控制 (Img2Vid)

  • 升级点:针对“图像转视频”场景的深度优化。
  • 效果:大幅减少画面冻结(Freezing)和机械式平移(Ken Burns 效应)。角色动作更自然,镜头语言更丰富。

5. 🧠 智能提示理解

  • 升级点:更大容量的文本连接器 (Text Connector)。
  • 效果:能精准解析包含多主体、复杂空间关系及特定风格指令的长提示词,减少“答非所问”的情况。

6. 📝 清晰的文本渲染

  • 升级点:增强的字符生成能力。
  • 效果:视频中出现的招牌、字幕、字母拼写更加准确,乱码率显著降低。

🚀 快速开始指南

只需四步,即可在 ComfyUI 中体验 LTX-2.3 的强大能力:

  1. 更新 ComfyUI
    确保您的 ComfyUI 版本已升级至 0.16.1 或更高版本。

    git pull
    # 或通过管理器更新
    
  2. 获取工作流
    打开 ComfyUI,进入 模板库 (Templates) → 搜索 (Search) → 输入 LTX-2.3
    官方已提供多种预设工作流(文生视频、图生视频、高清修复等)。
  3. 下载模型检查点
    根据工作流提示,自动或手动下载所需模型文件至 models/checkpoints/ 目录。
  4. 开始创作
    加载工作流,输入您的创意提示词或上传参考图,点击 Queue Prompt 即可生成。
ComfyUI 原生支持 LTX-2.3:开源音视频生成的画质新标杆

📦 模型检查点全家福

LTX-2.3 提供了丰富的模型变体,以适应不同的算力需求和创作场景:

模型名称类型说明适用场景
ltx-2.3-22b-dev完整模型原始开发版,支持 bf16 精度训练追求极致画质,拥有高显存 (>24GB) 的用户
ltx-2.3-22b-distilled蒸馏模型8 步采样,CFG=1,速度极快快速迭代创意,显存有限或追求效率的用户
ltx-2.3-22b-distilled-lora-384LoRA 微调基于蒸馏模型的 LoRA 版本特定风格微调,节省显存
ltx-2.3-spatial-upscaler-x2空间放大2 倍潜空间放大器高分辨率工作流,多阶段生成
ltx-2.3-spatial-upscaler-x1.5空间放大1.5 倍潜空间放大器中等分辨率提升,平衡速度与画质
ltx-2.3-temporal-upscaler-x2时间放大2 倍帧率放大器高帧率 (High FPS) 工作流,让视频更丝滑

💡 专家建议
对于大多数用户,推荐从 Distilled (蒸馏版) 开始测试,配合 Spatial Upscaler 进行两阶段生成,可在保证画质的同时大幅缩短等待时间。

💡 为什么选择 ComfyUI + LTX-2.3?

  • 完全本地化:无需订阅云端服务,数据隐私绝对安全。
  • 无限自由度:通过 ComfyUI 的节点系统,您可以自由组合 LTX-2.3 与其他模型(如 ControlNet, IPAdapter),创造独一无二的工作流。
  • 成本为零:除了电费,生成多少视频都无需额外付费。
  • 社区生态:依托 ComfyUI 庞大的社区,您将源源不断地获得新的节点、工作流和优化技巧。
© 版权声明

相关文章

暂无评论

none
暂无评论...