阿里EMO 模型上线通义千问APP,用照片 + 音频生成唱歌视频 阿里巴巴在今年2月份就公开了创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。你只需要提供一张静态的照片和一段语音,EMO就能创造出一个视频,视频中的人物头像会根据语音的内容和情感变化... 工具# EMO 模型# 通义千问 10个月前01,0350