清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人类视频的4D扩散变换器(4D Diffusion Transformer)。这项技术可以从单张图片生成逼真的人类动...新技术# Human4DiT# 新畅元科技# 清华大学2年前08090
谷歌推出贪婪生长方法(Greedy Growing):用来训练大规模、高分辨率的基于像素的图像扩散模型谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Growing)的方法来训练大规模、高分辨率的基于像素的图像扩散模型,且无需级联超分辨率组件。简单来说,就是科学家们找...新技术# Greedy Growing# 谷歌# 贪婪生长2年前06220
谷歌推出新采样方法EM Distillation(EMD):用于提高扩散模型(diffusion models)的采样效率谷歌推出新采样方法EM Distillation(EMD),用于提高扩散模型(diffusion models)的采样效率。扩散模型是一种强大的生成模型,能够学习复杂的数据分布并生成高质量的图像、视频...新技术# EM Distillation# EMD# 采样方法2年前06760
英伟达推出新型大语言模型嵌入模型NV-Embed:专门设计用于提高文本嵌入任务的性能英伟达推出新型大语言模型嵌入模型NV-Embed,NV-Embed专门设计用于提高文本嵌入任务的性能,它在多种文本嵌入任务上的表现开始超越了基于BERT或T5的嵌入模型,包括基于密集向量的检索。NV...新技术# NV-Embed# 嵌入模型2年前09550
新型视频重建模型Vidu4D:能够从单个生成的视频创建高保真的4D重建清华大学、生数科技和同济大学的研究人员推出新型视频重建模型Vidu4D,它能够从单个生成的视频创建高保真的4D重建(即连续的3D表示)。这项技术的核心是处理非刚性物体的动态变化和视频帧的失真问题,这对...新技术# Vidu4D# 视频重建模型2年前05570
新颖HDR视图合成技术HDR-GS:高效地生成新的HDR视角图像,并依据用户指定的曝光时间重建LDR图像约翰·霍普金斯大学、香港科技大学(广州)、清华大学和上海交通大学的研究人员推出一种新型的高动态范围(HDR)图像的新颖视图合成技术HDR-GS(High Dynamic Range Gaussian ...新技术# HDR-GS2年前04960
阿里推出新型大型多模态模型ConvLLaVA:专门设计用于处理高分辨率的视觉数据清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA,它专门设计用于处理高分辨率的视觉数据。多模态模型能够理解和处理多种类型的数据,比如文本、图像和视频,这使得它们在各种应用场景中都非...新技术# ConvLLaVA# 多模态模型# 阿里巴巴2年前07010
新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉领域的一个重要任务,它的目的是识别出图像中的对象,并确定它们的位置。例如,你在玩一个视频游戏,需要快速识别并射击屏幕...新技术# YOLOv10# 清华大学# 目标检测2年前01,0630
谷歌推出CamViG:控制视频生成过程中的相机视角,从而生成具有精确相机运动的视频Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于,它能够...新技术# CamViG# 相机运动# 谷歌2年前07160
新型视频编辑技术ReVideo:在视频中对特定区域进行精确的内容和运动控制编辑北京大学深圳研究生院 、ARC实验室,腾讯 PCG和东京大学的研究人员推出新型视频编辑技术ReVideo,ReVideo的核心能力是在视频中对特定区域进行精确的内容和运动控制编辑。这意味着用户可以随心...新技术# ReVideo# 视频编辑2年前08580
新型图像生成模型Diffusion Mamba(DiM):通过结合Mamba序列模型的效率和扩散模型的表现力,来高效生成高分辨率的图像来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图像生成模型Diffusion Mamba(简称DiM),它融合了基于状态空间模型(SSM)的高效序列模型——Mamba,与扩...新技术# Diffusion Mamba# DiM# 图像生成2年前01,2720
新型自编码器LiteVAE:用于提高图像生成模型中的效率和性能来自苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出新型自编码器LiteVAE,它被设计用于提高图像生成模型中的效率和性能。自编码器是一类神经网络,它们通过学习数据的压缩表示来重构数据。在图像处理中...新技术# LiteVAE# 自编码器2年前07950