通用的多模态运动生成模型LMM:统一并简化动画和视频制作中的多种运动生成任务,如文本生成运动、音乐生成舞蹈等
南洋理工大学和商汤科技的研究团队近期推出了一项革命性的技术——大运动模型(LMM)...
无需图像数据的方法Diff-Instruct*(DI*):用于构建符合人类偏好的一步式文生图模型,同时保持生成高度逼真图像的能力
北京大学、小红书和卡内基梅隆大学的研究人员推出一种无需图像数据的方法Diff-Inst...
3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象
近年来,文本到3D生成器和3D扫描仪技术取得了显著进展,能够生成高质量的3D资产。...
新型视频建模架构TRecViT:结合了时间序列处理和空间特征提取的优势,以提高视频理解任务的性能
Google DeepMind发布一种新型的视频建模架构TRecViT(Temporal Recurrent Video Tr...