新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务
华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM,EVF-SAM的...
用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制
北京大学、腾讯PCG ARC实验室、南洋理工大学、 清华大学、澳门大学和深圳先进技术...
分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容
新加坡国立大学的研究人员推出Video-Infinity系统,它是一个分布式的长视频生成框...