Enhance-A-Video:利用时间注意力温度调整提升DiT架构模型的视频生成质量尽管基于DiT架构模型的视频生成技术取得了显著进展,现有模型在捕捉关键细节方面仍面临挑战。为了提高视频质量,视频增强成为一种直观的方法,其主要目标是: 保持帧间一致性:确保相邻帧之间的视觉和语义一致性...新技术# CogVideoX-2B# DiT架构模型# Enhance-A-Video12个月前03900
SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5,这是一款高效的DiT架构模型,通过创新的训练和推理策略,实现文本到图像生成任务中的高...图像模型# DiT架构模型# SANA 1.5# 文生图模型9个月前02860
首尔大学研究团队提出推理加速框架 RALU:无需训练的混合分辨率采样,加速DIT架构模型推理最高达7倍DIT架构模型凭借其卓越的可扩展性,正逐步取代传统的 U-Net 架构,成为高保真图像与视频生成的主流模型。然而,其高昂的计算成本严重制约了在移动端、实时应用和大规模部署中的实用性。 为解决这一瓶颈...新技术# DiT架构模型# RALU# 首尔大学5个月前01040