阿里开源 Wan2.2-S2V-14B:输入一张图 + 一段音频,生成电影级数字人视频阿里Wan团队正式开源音频驱动视频生成模型Wan2.2-S2V-14B。这款模型打破了传统视频生成对复杂输入的依赖——用户仅需提供一张静态图像与一条音频,即可生成面部表情自然、口型精准同步、肢体动作流...视频模型# Wan2.2-S2V-14B# 数字人# 阿里3个月前04370
一站式 AI 数字人生成软件AigcPanel:基于阿里开源语音生成模型CosyVoice和腾讯开源视频生成模型的MusePose打造AigcPanel 是一个基于阿里开源的语音生成模型CosyVoice和腾讯开源视频生成模型MusePose的一站式 AI 数字人生成软件,支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入...工具# AigcPanel# CosyVoice# MusePose1年前04320