通用的多模态运动生成模型LMM:统一并简化动画和视频制作中的多种运动生成任务,如文本生成运动、音乐生成舞蹈等

南洋理工大学和商汤科技的研究团队近期推出了一项革命性的技术——大运动模型(LMM),这是一个通用的多模态运动生成模型。LMM旨在统一并简化动画和视频制作中的多种运动生成任务,如文本生成运动、音乐生成舞...
2个月前
01200

无需图像数据的方法Diff-Instruct*(DI*):用于构建符合人类偏好的一步式文生图模型,同时保持生成高度逼真图像的能力

北京大学、小红书和卡内基梅隆大学的研究人员推出一种无需图像数据的方法Diff-Instruct*(DI*),用于构建符合人类偏好的一步式文本到图像生成模型,同时保持生成高度逼真图像的能力。研究团队将人...
2个月前
01340