新型视频生成技术“CVD(协作视频扩散)”:生成从多个不同摄像机轨迹视角下观察同一场景的一致性视频
斯坦福大学和香港中文大学的研究人员推出新型视频生成技术“协作视频扩散”(Collabo...
清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频
清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人...
谷歌推出贪婪生长方法(Greedy Growing):用来训练大规模、高分辨率的基于像素的图像扩散模型
谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Grow...
谷歌推出新采样方法EM Distillation(EMD):用于提高扩散模型(diffusion models)的采样效率
谷歌推出新采样方法EM Distillation(EMD),用于提高扩散模型(diffusion models...
新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置
清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉...
谷歌推出CamViG:控制视频生成过程中的相机视角,从而生成具有精确相机运动的视频
Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根...
新型图像生成模型Diffusion Mamba(DiM):通过结合Mamba序列模型的效率和扩散模型的表现力,来高效生成高分辨率的图像
来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图...