校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能...
5天前 36
多模态音乐生成旨在从多种输入模态(如文本、视频和图像)中生成音乐。尽管现有方...
5天前 34
对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由...
5天前 34
视觉扩散模型(Diffusion Models)在图像和视频生成领域取得了显著进展,但由于缺...
5天前 30
近年来,文本到视频生成技术取得了显著进展,但现有的视频字幕生成方法仍然存在一...
5天前 34
理解、导航和探索三维物理现实世界一直是人工智能(AI)领域的一个核心挑战。传统...
5天前 32
佐治亚理工学院和伊利诺伊大学厄巴纳-香槟分校的研究人员推出新型Transformer框架...
5天前 34
浙江大学、斯坦福大学和香港科技大学的研究人员发布论文,主题是关于如何高效地表...
5天前 38
Meta Motivo 是一个创新的行为基础模型,旨在通过一种新的无监督强化学习(RL)算...
7天前 36
尽管带有蒸馏的校正流(ReFlows)为快速采样提供了一种有前景的方法,但其...
1周前 48
南洋理工大学(NTU)S-Lab提出了一种新的图像超分辨率(Super-Resolution, SR)技...
1周前 42
近年来,文本到图像定制技术的进步使得个性化图像的高保真、内容丰富的生成成为可...
1周前 36