RefAVS

共 1 篇文章

排序

发布更新浏览点赞

参照音频-视觉分割RefAVS：依据融合了多模态提示（包括音频和视觉描述）的自然语言表达，对视觉场景中的目标物进行分割

参照音频-视觉分割RefAVS：依据融合了多模态提示（包括音频和视觉描述）的自然语言表达，对视觉场景中的目标物进行分割

中国人民大学、北京邮电大学和上海人工智能实验室的研究人员推出RefAVS（参照音频-视觉分割），依据融合了多模态提示（包括音频和视觉描述）的自然语言表达，对视觉场景中的目标物进行分割。研究团队还创建了...

新技术 # RefAVS # 参照音频-视觉分割

2年前

06450