新型图像到3D框架Unique3D:从单视图图像高效生成高质量的3D网格模型清华大学和AVAR的研究人员推出新型图像到3D框架Unique3D,它能够从单视图图像高效生成高质量的3D网格模型。Unique3D的核心优势在于它能够在短时间内生成高保真度、细节丰富且具有强泛化能力...新技术# 3D网格模型# Unique3D2年前01,1400
视频编辑方法I2VEdit:利用了图生视频模型,通过用户编辑视频的第一帧来引导整个视频的生成南洋理工大学、商汤科技和上海人工智能实验室的研究人员推出视频编辑方法I2VEdit,它利用了图像到视频的扩散模型,通过用户编辑视频的第一帧来引导整个视频的生成。这种方法的创新之处在于,它能够根据用户对...百科# I2VEdit# 视频编辑2年前01,1340
新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉领域的一个重要任务,它的目的是识别出图像中的对象,并确定它们的位置。例如,你在玩一个视频游戏,需要快速识别并射击屏幕...新技术# YOLOv10# 清华大学# 目标检测2年前01,1340
NovelAI Diffusion V4.5 完整版发布,图像质量全面提升NovelAI 近日正式发布了NovelAI Diffusion V4.5 完整版模型(Full Version),将此前广受好评的 V4.5 Curated 版本中的增强功能带入完整模型中,进一步提...早报# NovelAI# NovelAI Diffusion V4.510个月前01,1290
新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat,它能够在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重...新技术# 3D场景# InstantSplat2年前01,1210
基于大语言模型的框架GenAgent:用于自动生成复杂的工作流程,以构建协作式人工智能系统上海人工智能实验室推出一个基于大语言模型的框架GenAgent,用于自动生成复杂的工作流程,以构建协作式人工智能(AI)系统,相比单一的大型模型,GenAgent提供了更大的灵活性和可扩展性。这种系统...新技术# GenAgent2年前01,1070
实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景来自上海人工智能实验室、同济大学、中国科学技术大学和香港中文大学的研究团队推出Octree-GS(八叉树-高斯球体),这是一种用于实时渲染三维场景的方法,特别适用于处理大型和复杂场景。 项目主页 Gi...新技术# Octree-GS# 三维场景# 实时渲染2年前01,1050
影眸科技推出新型大型3D生成模型CLAY:帮助人们将脑海中的创意轻松转化为精细的三维数字结构上海科技大学、影眸科技和华中科技大学的研究人员推出新型大型3D生成模型CLAY,它的主要任务是帮助人们将脑海中的创意轻松转化为精细的三维数字结构。就像孩子们用黏土塑造出各种形状的物体一样,CLAY能够...新技术# 3D生成模型# CLAY# 影眸科技2年前01,0980
attribute-control:对文生图模型生成的图像中的特定属性进行精细控制来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...新技术# attribute-control# 文生图模型# 精细控制2年前01,0940
基于人类与场景互动数据集Trumans开发的动作生成模型来自北京大学人工智能研究院、BIGAI通用人工智能国家重点实验室、北京大学CFCS计算机学院和北京理工大学的研究团队创建一个详细的人类与场景互动数据集trumans,并开发出一种先进的动作生成模型,为...新技术# Trumans# 动作生成模型2年前01,0760
大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能...新技术# DPG-Bench# ELLA# TSC2年前01,0670
零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...新技术# DiffIR2VR-Zero# 视频恢复2年前01,0650