SLA

共 1 篇文章

排序

发布更新浏览点赞

SLA：清华与伯克利联合提出可训练稀疏线性注意力，加速DiT视频生成

SLA：清华与伯克利联合提出可训练稀疏线性注意力，加速DiT视频生成

在高分辨率、长时序视频生成任务中，扩散变换器（Diffusion Transformer, DiT）已成为主流架构。然而，其核心组件——自注意力机制——面临着一个根本性瓶颈：计算复杂度随序列长度呈平方...

视频模型 # SLA # 可训练混合注意力机制

6个月前

01750