MIT和斯坦福的研究人员联合推出了WonderWorld,这是一个用于交互式3D场景生成的创...
2024-12-05 72

卡内基梅隆大学、Adob​​e 研究和加州大学伯克利分校的研究人员发布论文,论文的主...
2024-12-04 78

人类是社会性动物,赋予3D自主角色类似的社会智能,使其能够感知、理解和与人类互...
2024-12-03 82

拉瓦尔大学、Depix Technologies和芝加哥丰田技术学院的研究人员推出SPOTLIGHT,它...
2024-12-03 94

扩散模型(DMs)作为视频生成的基本骨干,因其顺序去噪的性质而面临低推理速度的挑...
2024-12-03 94

扩散模型(DMs)近年来在生成高质量图像、视频和3D内容方面取得了显著进展。然而,...
2024-12-03 90

随着大型基础模型的发展和合成训练数据的广泛应用,单图像深度估计技术取得了显著...
2024-12-03 88

滑铁卢大学、矢量研究所和零一万物的研究人员推出VISTA框架,旨在通过视频时空增强...
2024-12-03 78

DeepBrain和韩国科学技术院人工智能研究生院的研究人员推出新型音频驱动的肖像视频...
2024-12-03 78

扩散模型(DMs)在照片真实感图像生成、图像编辑和逆问题解决方面取得了显著进展,...
2024-12-03 78

随着大语言模型(LLMs)在自然语言处理领域的广泛应用,基于LLMs的自动回归视觉语...
2024-12-03 80

随着视频对象分割(VOS)和跟踪任务的日益复杂,现有的强大工具如SAM 2虽然在准确...
2024-12-03 84
没有账号?注册  忘记密码?