阿里EMO 模型上线通义千问APP,用照片 + 音频生成唱歌视频 阿里巴巴在今年2月份就公开了创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。你只需要提供一张静态的照片和一段语音,EMO就能创造出一个视频,视频中的人物头像会根据语音的内容和情感变化... 工具# EMO 模型# 通义千问 10个月前01,0340
通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max 阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测... 新技术# Qwen-VL-Max# Qwen-VL-Plus# 视觉理解模型 1年前04320