高通AI研究院推出一个专为移动设备优化的视频编辑模型MoViE,能够在手机上实现每秒...
2024-12-13 84
高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(Mob...
2024-12-13 86
图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图...
2024-12-13 74
清华大学和字节跳动的研究人员推出ACDIT,它是一种介于自回归模型和扩散模型之间的...
2024-12-13 88
苹果公司介绍了一个名为STIV(Scalable Text and Image Conditioned Video Generat...
2024-12-13 88
Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到...
2024-12-13 80
华为诺亚方舟实验室发布多模态大语言模型ILLUME,旨在无缝集成图像和文本的理解与...
2024-12-12 88
香港中文大学、快手科技和浙江大学的研究人员介绍了3DTrajMaster,一个用于多实体3...
2024-12-12 80
近年来,人像动画生成模型在图像和视频领域取得了显著进展,但它们在身份一致性(I...
2024-12-11 84
近年来,扩散模型在图像和视频生成领域取得了显著进展,但在运动迁移任务中,如何...
2024-12-11 90
近年来,3D生成模型在图像和视频领域取得了显著进展,但它们通常依赖于有限规模的3...
2024-12-11 82
近年来,大语言模型(LLMs)在图像理解和生成方面取得了显著进展,尤其是在将图像...
2024-12-11 94