新型框架Isotropic3D:根据单张参考图片的CLIP嵌入生成多视角一致且高质量的3D模型来自复旦、清华、同济的研究人员推出新型框架Isotropic3D,它能够根据单张参考图片的CLIP嵌入(embedding)生成多视角一致且高质量的3D内容。CLIP嵌入是一种能够捕捉图像语义信息的技...新技术# 3D模型# Isotropic3D2年前06420
微软发布复现Sora的开源项目:新型多智能体框架Mora来自理海大学和微软研究院的研究团队推出新型多智能体框架Mora,它是为了实现大规模的通用视频生成而设计的。Mora的设计灵感来自于OpenAI在2024年2月推出的Sora模型,Sora是一个能够将文...新技术# Mora# Sora# 微软2年前06130
Adobe推出Magic Fixup:用于图像编辑的生成模型来自Adobe和马里兰大学的研究团队推出用于图像编辑的生成模型Magic Fixup,该模型能够根据粗略编辑的图像,合成遵循特定布局的逼真输出。该模型能够转移原始图像的精细细节,同时保留其各部分特...新技术# Magic Fixup# 图像编辑2年前05480
Compress3D:从单张图片生成三维模型来自西安交通大学的研究团队推出Compress3D,它是一种从单张图片生成三维模型的方法。想象一下,你有一张你最喜欢的动漫角色的图片,你想在虚拟现实游戏中使用这个角色的三维模型。传统上,这需要3D艺术...新技术# Compress3D# 三维模型2年前04530
文生视频模型VSTAR:解决现有开源T2V模型难以生成内容动态变化和较长视频的问题来自博世人工智能中心、曼海姆大学、马克斯·普朗克信息学研究所和图宾根大学的研究团队推出VSTAR,这是一种用于生成动态视频的文本到视频(T2V)合成技术。VSTAR的目标是解决现有开源T2V模型难以生...新技术# VSTAR# 文生视频模型2年前07500
视频扩画方法MOTIA:根据视频内容自动学习并生成新的内容,适用于多种视频处理和创作的场景来自香港中文大学、Avolution AI、上海人工智能实验室和商汤科技研究院的研究团队推出视频扩画方法MOTIA(Mastering Video Outpainting Through Input...新技术# MOTIA# 视频扩画2年前01,2110
深度模型DepthFM:从单张图像中快速估算深度信息来自慕尼黑大学的研究团队推出深度模型DepthFM,它是一个用于从单目(单个摄像头)图像中快速估算深度信息的系统。简单来说,DepthFM能够通过一张照片,推断出物体与摄像头之间的距离,这对于三维场景...新技术# DepthFM# 深度模型2年前07270
新型单视图3D重建方法FDGaussian:能够从2D输入中提取出3D几何特征,从而生成一致的多视图图像来自复旦大学的研究团队推出新型单视图3D重建方法FDGaussian,它采用正交平面分解机制,能够从2D输入中提取出3D几何特征,从而生成一致的多视图图像。 项目主页 论文地址 想象一下,你只有一张物...新技术# 3D重建# FDGaussian2年前06050
LightIt:实现图像生成过程中的显式光照控制来自慕尼黑大学和Adobe Research的研究人员推出LightIt,它能够对由扩散模型生成的图像进行明确的照明控制。研究人员提出了将生成过程与阴影和法线图相结合的新思路。在光照建模方面,采用了单...新技术# LightIt# 光照控制2年前05730
新型个性化图像生成方法Infinite-ID:保持特定身份特征的同时,根据用户的文本描述生成高质量的图像来自中国科学技术大学和悉尼大学的研究人员推出新型个性化图像生成方法Infinite-ID,它能够在保持特定身份特征的同时,根据用户的文本描述生成高质量的图像。这是一个全新的ID-语义解耦范式,专门用于...新技术# Infinite-ID# 个性化图像生成2年前05030
新型3D生成模型LN3Diff:快速生成高质量的3D对象来自南洋理工大学、北京大学和上海人工智能实验室推出新型3D生成模型LN3Diff,它是一个基于潜在空间的神经辐射场扩散模型,用于快速生成高质量的3D对象。 项目主页 GitHub 想象一下,你有一张2...新技术# 3D生成模型# LN3Diff2年前09100
MVEdit:用于3D对象合成和编辑的通用3D扩散适配器来自斯坦福大学、加州大学圣地亚哥分校和Apparate Labs的研究人员推出MVEdit,这是一个用于3D对象合成和编辑的通用3D扩散适配器。 项目主页 Demo GitHub MVEdit的核心功...新技术# 3D# MVEdit2年前09050