在音频驱动的视觉配音中,合成准确的口型同步同时保持和突出说话者的“个性”是一个...
17小时前 16
视频生成是当前 AI 领域的一个热点研究方向,特别是基于扩散模型的方法。然而,这...
17小时前 20
浙江大学计算机科学与技术学院的研究团队推出一个名为CAMI2V(Camera-Controlled I...
1天前 32
香港中文大学和卡内基梅隆大学的研究人员提出了一个名为Stable Consistency Tuning...
3天前 38
帧插值是生成两个图像之间平滑过渡帧的技术,广泛应用于视频处理、动画制作和内容...
3天前 54
视频对象分割是一项具有挑战性的任务,每个像素必须被准确标记,并且这些标签必须...
3天前 48
直接偏好优化(DPO)已成为一种强大的方法,用于将文本到图像(T2I)模型与人类反...
5天前 54
生成式AI的快速发展为内容创作带来了巨大便利,但同时也使得图像篡改变得更加容易...
5天前 52
来自香港中文大学(深圳)、NVIDIA 和加州大学默塞德分校的研究人员开发了 Tex4D,...
6天前 54
来自香港科技大学(广州)、香港科技大学和趣玩的研究人员开发了一个名为FlexGen的...
6天前 56
场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对...
6天前 50
浙江大学CAD与CG国家重点实验室推出一种新技术,用于从多视角点光源输入图像中实时...
6天前 56