中国科学院深圳先进技术研究院、中国科学院大学、上海人工智能实验室和上海交通大...
2024-10-21 130

无分类器引导(CFG)是提高视觉生成模型样本质量的关键技术。然而,在自回归(AR)...
2024-10-21 134

东京大学和Cyber​​Agent 人工智能实验室的研究人员推出了一个用于生成同步语音体态...
2024-10-21 126

在视觉领域,自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探...
2024-10-20 134

多模态属性图(MMAGs)作为一种强大的数据结构,能够以图的形式表示实体之间的关系...
2024-10-13 190

罗格斯大学、麻省理工学院-IBM Watson AI 实验室、谷歌 DeepMind、NEC 美国实验室...
2024-10-12 184

韩国科学技术院、世宗大学和汉阳大学的研究人员推出FSC-CLIP,提升预训练视觉和语...
2024-10-12 180

石溪大学和Adob​​e 研究中心的研究人员推出长视频生成新方法PA-VDM,它能够生成高...
2024-10-12 212

苹果和香港中文大学的研究人员推出新型图像生成模型DART,这个模型的目标是让计算...
2024-10-12 188

上海交通大学、中国科学技术大学、香港中文大学和上海人工智能实验室的研究人员推...
2024-10-11 310

韩国科学技术研究院推出视频插值方法ViBiDSampler,这种方法专门用于在两个关键帧...
2024-10-11 158

KRAFTON和韩国科学技术研究院AI研究生院的研究人员推出一种在推理阶段组合定制扩散...
2024-10-11 158
没有账号?注册  忘记密码?