用于音频驱动的多人对话视频生成的新框架 MultiTalk:根据多路音频输入和提示生成包含互动的视频,同时确保唇部动作与音频同步

用于音频驱动的多人对话视频生成的新框架 MultiTalk:根据多路音频输入和提示生成包含互动的视频,同时确保唇部动作与音频同步

中山大学深圳校区、美团和香港科技大学的研究人员推出用于音频驱动的多人对话视频生成的新框架 MultiTalk,该框架能够根据多路音频输入和提示生成包含互动的视频,同时确保唇部动作与音频同步。 项目主页...
5天前
0170