MaPa:根据文本描述为3D模型生成逼真的材质 来自浙江大学、蚂蚁集团和深圳大学的研究人员推出MaPa,它能够根据文本描述为3D模型生成逼真的材质。与传统的纹理贴图不同,MaPa通过生成程序化的材质图(material graphs)来表示3D模型... 新技术# 3D模型# MaPa 10个月前06690
多模态框架MotionLLM:理解和解释人类行为,特别是通过分析人体动作和视频 清华大学、香港中文大学(深圳)、国际数字经济学院和香港科技大学的研究人员推出人工智能系统MotionLLM,它的主要任务是理解和解释人类行为,特别是通过分析人体动作和视频。例如,你有一台智能相机,它不... 新技术# MotionLLM# 多模态框架 9个月前06670
新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置 清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉领域的一个重要任务,它的目的是识别出图像中的对象,并确定它们的位置。例如,你在玩一个视频游戏,需要快速识别并射击屏幕... 新技术# YOLOv10# 清华大学# 目标检测 9个月前06660
新型图像到3D框架Unique3D:从单视图图像高效生成高质量的3D网格模型 清华大学和AVAR的研究人员推出新型图像到3D框架Unique3D,它能够从单视图图像高效生成高质量的3D网格模型。Unique3D的核心优势在于它能够在短时间内生成高保真度、细节丰富且具有强泛化能力... 新技术# 3D网格模型# Unique3D 7个月前06650
独特视角SDXL Lora:Head POV Head POV是一个视角SDXL Lora,这一视角的独特之处在于,它是以动物的后脑勺为观察点。尽管初版模型训练数据相对较少,可能导致生成的图片并不完美,但作者已经计划扩充数据集,并对图像位置信息进... 百科# Head POV# SDXL Lora# 视角 12个月前06630
影眸科技推出新型大型3D生成模型CLAY:帮助人们将脑海中的创意轻松转化为精细的三维数字结构 上海科技大学、影眸科技和华中科技大学的研究人员推出新型大型3D生成模型CLAY,它的主要任务是帮助人们将脑海中的创意轻松转化为精细的三维数字结构。就像孩子们用黏土塑造出各种形状的物体一样,CLAY能够... 新技术# 3D生成模型# CLAY# 影眸科技 7个月前06590
高效灵活的对象检测工具YOLO-World 来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测框架YOLO-World,旨在通过视觉语言模型和大规模数据集的预训练,增强YOLO(You Only Look Once... 新技术# YOLO-World# 对象检测工具# 腾讯AI实验室 1年前06590
腾讯音乐娱乐推出开源虚拟人视频生成框架MusePose 腾讯音乐娱乐旗下天琴实验室推出开源虚拟人视频生成框架MusePose,MusePose 是 Muse 开源系列的最后一个组件,与 MuseV 和 MuseTalk 一起,标志着向构建端到端虚拟人物生成... 新技术# MusePose# 虚拟人 9个月前06540
韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行 韩国研究人员提出了一种高效的潜在扩散模型KOALA,该模型可以用于文本到图像的生成,研究人员构建了T2I模型KOALA-1B和KOALA-700M,减小了模型大小,降低了模型对硬件的需求,提高了模型运... 新技术# KOALA# 文生图大模型# 韩国 12个月前06530
ConsistentID:生成个性化人像图像时保持高度的面部身份(ID)一致性 来自 中山大学深圳校区、中山大学珠海校区、联想研究院和阿联酋起源人工智能研究院推出ConsistentID,它能够在生成个性化人像图像时保持高度的面部身份(ID)一致性。ConsistentID的核心... 新技术# ConsistentID# 个性化人像 10个月前06490
【3月4日·SD早报】多款ComfyUI插件发布,欧美漫画风模型 软件及插件更新汇总 1、FastSD CPU 1.0.0 beta 26发布 FastSD CPU是专为在CPU环境下运行Stable Diffusion模型设计的工具,它充分利用OpenVINO技术... 早报# ComfyUI SUPIR# DeforumationQT# FastSD CPU 12个月前06490
视频编辑方法I2VEdit:利用了图生视频模型,通过用户编辑视频的第一帧来引导整个视频的生成 南洋理工大学、商汤科技和上海人工智能实验室的研究人员推出视频编辑方法I2VEdit,它利用了图像到视频的扩散模型,通过用户编辑视频的第一帧来引导整个视频的生成。这种方法的创新之处在于,它能够根据用户对... 百科# I2VEdit# 视频编辑 9个月前06470