在图像生成领域,DiT(Diffusion Transformer)架构凭借其卓越的表现成为前沿技术...
4周前 96
自回归模型在视觉生成领域表现出色,但其逐个预测token的顺序过程导致...
4周前 82
南京大学计算机软件新技术国家重点实验室的研究人员介绍了一种名为“DFASRR(Deep F...
4周前 86
尽管基于DiT架构模型的视频生成技术取得了显著进展,现有模型在捕捉关键细节方面仍...
2024-12-22 96
莱斯大学和Snap的研究人员推出统一框架AV-Link,用于跨模态音频-视频生成。AV-Link...
2024-12-22 94
阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人...
2024-12-22 105
现有的基于指令的图像编辑方法通常依赖于监督学习,需要包含输入图像、编辑图像和...
2024-12-22 100
图像合成是计算机视觉中的一个常见任务,涉及将前景对象无缝集成到背景场景中。传...
2024-12-22 82
扩散模型及其泛化(如流匹配)在媒体生成领域取得了显著进展,尤其是在跨模态任务...
2024-12-22 86
在图像到视频合成领域,基于拖动交互的方法因其直观性和易用性而受到广泛关注。然...
2024-12-22 82
Genesis 是一个为通用机器人、具身AI和物理AI应用设计的综合性物理仿真平台。它结...
2024-12-19 96
微软研究院、上海交通大学和北京大学的研究人员推出视频分词器VidTok,它是一个多...
2024-12-19 90