图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA,即模态不变图像匹配。这项研究旨在解决多模态感知中的图像匹配问题,特别是在跨视图和跨模态的情况下。例如,在自动驾驶中,需要将可见光...新技术# MINIMA# 图像匹配框架11个月前04370
新型网络架构PIIP:提高视觉感知和多模态理解任务中的计算效率和性能上海交通大学、清华大学、上海人工智能实验室、香港中文大学和商汤科技的研究人员推出新型网络架构PIIP,旨在提高视觉感知和多模态理解任务中的计算效率和性能。PIIP通过将不同分辨率的图像与不同参数规模的...新技术# PIIP11个月前02010
视频生成框架RepVideo:通过重新思考跨层表示来提高文生视频模型的性能南洋理工大学和上海人工智能实验室的研究人员推出视频生成框架RepVideo,旨在通过重新思考跨层表示来提高文本到视频(Text-to-Video, T2V)扩散模型的性能。该框架通过积累邻近层的特征来...新技术# RepVideo# 视频生成框架11个月前02350
新型视频去噪框架Ouroboros-Diffusion:提高无调优(tuning-free)长视频生成中的结构和内容(主体)一致性罗切斯特大学和智象未来的研究人员推出新型视频去噪框架Ouroboros-Diffusion,旨在提高无调优(tuning-free)长视频生成中的结构和内容(主体)一致性。该框架通过引入新的潜在采样技...新技术# Ouroboros-Diffusion# 视频去噪11个月前02240
SynthLight:基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明在数字影像处理领域,耶鲁大学和Adobe研究中心联合推出了一项创新技术——SynthLight。这项技术基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明,从而达到令人惊叹的视觉效果。该方法...新技术# SynthLight11个月前02230
AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像阿里巴巴通义实验室推出一个用于文本到图像生成的统一单主体和多主体个性化框架AnyStory,旨在生成具有特定主体的高保真个性化图像,无论是单个主体还是多个主体,都能在不牺牲主体保真度的情况下实现个性化...新技术# AnyStory11个月前02070
交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力哈尔滨工业大学和华为诺亚方舟实验室的研究人员推出交互式图像编辑工具FramePainter,它利用视频扩散先验(video diffusion priors)来增强图像编辑的能力。FramePaint...新技术# FramePainter# 交互式图像编辑11个月前02370
腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐在 AI 生成内容的领域中,音乐创作一直未能跟上视觉和文本内容的步伐。如今,腾讯推出的 XMusic 框架有望改变这一现状,通过情感可控、高质量的音乐创作,为创意应用带来新的可能性。 项目主页:htt...新技术# XMusic11个月前02070
通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题厦门大学多媒体可信感知与高效计算教育部重点实验室和腾讯优图实验室的研究人员推出人脸恢复统一框架SVFR,用于解决视频中的人脸恢复问题。人脸恢复(Face Restoration, FR)是图像和视频处...新技术# SVFR# 人脸恢复11个月前02340
VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架清华大学和智谱AI的研究人员推出VisionReward,这是一个用于图像和视频生成的细粒度多维度人类偏好学习框架。VisionReward通过构建一个细粒度且多维度的奖励模型,将人类对图像和视频的偏...新技术# VisionReward11个月前03090
Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作昆仑万维的研究人员推出一个强大的框架 Ingredients,通过将多个特定身份(ID)的照片与视频扩散变换器(Video Diffusion Transformers)结合,实现定制化的视频创作。该...新技术# Ingredients11个月前02470
单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计中国科学技术大学和vivo移动通信有限公司的研究人员推出一种单步扩散模型 DepthMaster,,旨在将扩散模型应用于单目深度估计(Monocular Depth Estimation, MDE...新技术# DepthMaster# 单目深度11个月前02510