DecartAI

8个月前发布 225 00

MirageLSD是首个实现无限、实时视频生成且零延迟的系统。它基于我们定制的直播扩散（LSD）模型，支持逐帧生成，同时保持时间一致性。与以往方法不同，LSD支持完全交互式的视频合成——允许在视频生成过程中进行持续的提示、转换和编辑。

所在地：

美国

收录时间：

2025-07-18

打开网站手机查看

AI视频 # DecartAI # MirageLSD # 直播扩散视频模型

DecartAI

DecartAI

DecartAI正式发布了MirageLSD——全球首个直播扩散（Live Streaming Diffusion）视频模型，实现了实时、无限、零延迟的视频生成能力。这项技术不仅突破了当前AI视频生成的瓶颈，也为未来的视频交互体验打开了新的可能性。

什么是MirageLSD？

MirageLSD是DecartAI继Oasis之后推出的第二代核心模型。它基于一种全新的“直播扩散”机制，能够在每帧仅需40毫秒的响应时间内，生成无限长度的高质量视频流。

与传统视频生成模型不同，MirageLSD不依赖于预设的视频片段，也不需要离线处理。它采用因果自回归结构，逐帧生成视频，并在生成过程中持续接收用户输入，从而实现真正的实时交互。

为什么说MirageLSD是突破？

1. 实时性：真正“零延迟”的视频生成

目前主流的视频生成模型存在明显延迟，通常需要数秒甚至数十秒才能生成几秒钟的视频内容。而MirageLSD的响应时间控制在40毫秒以内，这意味着它可以在24帧/秒的速率下实时生成视频，几乎与用户的输入同步。

2. 无限生成：不再受限于视频长度

以往的AI视频模型在生成几十秒后会出现明显的质量下降，甚至完全崩溃。MirageLSD通过引入扩散强制（Diffusion Forcing）和历史增强训练，有效缓解了“错误累积”问题，使得视频生成过程稳定且可持续，理论上可以无限运行。

3. 可交互性：边生成边控制

MirageLSD支持在生成过程中动态修改提示（prompt），甚至可以对当前帧进行局部编辑。这种交互能力为实时视频创作、直播特效、游戏互动等场景提供了前所未有的可能性。

技术实现：如何做到“实时无限生成”？

核心机制：因果自回归 + 扩散强制

MirageLSD采用因果自回归结构，即每一帧的生成仅基于之前的帧和当前输入。为了防止错误累积，团队引入了扩散强制技术，让模型在训练中学会逐帧去噪，而不是一次性生成整个视频。

系统优化：GPU级加速 + 快捷蒸馏

为了实现毫秒级响应，团队进行了多项底层优化：

Hopper优化的超级内核（CUDA Super Kernel）：减少模型推理的计算开销。
架构感知剪枝：根据GPU硬件特性优化模型结构，减少运算量。
快捷蒸馏（Shortcut Distillation）：训练轻量模型快速复现高质量输出，大幅缩短生成步骤。

这些技术共同作用，使得MirageLSD的响应速度比现有模型提升了16倍。

应用场景：不只是视频生成

MirageLSD的强大能力不仅限于生成视频片段，它正在重新定义多个领域的交互方式：

直播与视频通话：实时添加特效、背景替换、风格转换。
游戏与虚拟现实：动态生成场景、角色、动作，提升沉浸感。
影视后期与创意工具：提供实时编辑、风格迁移、AI辅助剪辑等能力。
远程协作与虚拟会议：智能美化、环境替换、实时提示控制。

未来展望：构建多感官交互平台

DecartAI表示，MirageLSD只是其多感官交互平台的第一步。接下来，团队将陆续推出：

音频生成与语音控制
情感识别与反馈机制
音乐与节奏同步生成
更精细的物体与空间控制

整个夏季，团队将持续发布模型升级与功能更新，包括：

面部一致性增强
语音指令控制
对象级编辑功能
流媒体直播支持
跨平台视频通话整合

用户现在即可通过官网体验MirageLSD，iOS与Android应用将在下周上线。

数据统计

相关导航

绘想

百度发布的“绘想”平台与“MuseSteamer”模型，标志着其在AI视频生成领域的正式布局。尽管目前模型在动态表现与帧率方面仍有提升空间，但其对企业用户的支持能力、生成效率及成本优势，已展现出良好的应用前景。

OpenMuse

OpenMuse 是一个开源网页应用程序，专为管理与展示为开源视频生成模型（如Wan、LTXV和Hunyuan）创建的LoRA资产而设计。

梵高免费视频生成器

“梵高”是一款面向大众的AI视频生成工具，旨在让任何人都能轻松地将文本描述或静态图片转化为富有艺术感的动态视频。它无需专业技能，通过简洁的交互界面，即可在几分钟内完成从创意到成片的全过程。

MovieFlo.AI

MovieFloAI是一个由AI驱动的平台，帮助任何人通过轻松生成各种风格的角色、剧本、故事板和视频来创作视觉故事。MovieFlo.AI 的目标很明确：降低影视创作门槛，让每个人都能成为故事讲述者。

Pika

Pika 是一款由 AI 驱动的视频制作工具，自 2023 年 4 月成立以来，迅速在视频创作领域崭露头角。其创始人郭文景（Demi Guo）和 Chenlin Meng 均为斯坦福博士，凭借深厚的技术背景和创新能力，Pika 不断为用户带来令人惊喜的功能和体验。

Boba Anime Studio

Boba Anime Studio

Boba Anime Studio 是一个 AI 驱动的动漫视频生成平台，主要通过 Boba Anime 1.3 模型从文本提示生成动漫视频和图像，支持对话、音效和唇同步（Beta 版），适合动漫爱好者和创作者快速制作短视频内容。

Gaga AI

GAGA-1 的价值不在于“取代演员”，而在于降低高质量数字人视频的创作门槛。它把原本需要配音、动画、合成多个环节的工作，压缩为一次生成。对内容生产者而言，这意味着更快的迭代速度、更低的试错成本，以及更自然的观众体验。

Edit Mind

Edit Mind 是一款跨平台桌面应用，充当编辑的第二大脑，使用 AI 索引视频（物体检测、人脸识别、情绪分析），支持自然语言查询的语义搜索，并生成粗剪。

暂无评论

none

暂无评论...