参照音频-视觉分割RefAVS:依据融合了多模态提示(包括音频和视觉描述)的自然语言表达,对视觉场景中的目标物进行分割
中国人民大学、北京邮电大学和上海人工智能实验室的研究人员推出RefAVS(参照音频-...
针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作
韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该...
视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变
大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声...
视频驱动人脸识别动画系统LivePortrait:将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力
快手科技、中国科学技术大学和复旦大学的研究人员推出视频驱动人脸识别动画系统Liv...