Media2Face:集成多种媒体输入(音频、图像和文本)生成同步的面部动画和头部姿势 来自上海科技大学、影眸科技、香港大学和叠境数字科技的研究人员提出一个基于扩散的生成模型Media2Face,它能够根据语音信号和多模态条件(如文本、图像)生成同步的面部动画和头部姿势。 项目主页 Me... 新技术# Media2Face 1年前04470