前馈单图像人体重建框架IDOL:能够从单张图片中快速创建出高保真度、可动画化的3D全身人物形象

南京大学、中国科学院深圳先进技术研究院、清华大学、腾讯和深圳理工大学的研究人员共同推出了IDOL(Image-based Detailed and Optimized Avatar),这是一个具有快速、高保真和通用化特点的前馈单图像人体重建框架,它能够从单张图片中快速创建出高保真度、可动画化的3D全身人物形象。IDOL利用一个包含100,000个多视角主体的大规模数据集,展示了其在处理多样人体形态、跨域数据、严重视角变化和遮挡方面的卓越性能。通过统一的结构化表示,IDOL生成的虚拟形象不仅可以直接进行动画处理,还能轻松编辑,为图形学、视觉等领域提供了显著的进步。

例如,你是一名游戏设计师,需要根据玩家上传的个人照片,快速在游戏中生成一个3D角色模型。使用IDOL技术,只需上传玩家的照片,系统就能在不到一秒的时间内创建出一个3D人物模型,这个模型不仅外观逼真,还能根据游戏中的动作捕捉技术进行动态的动画制作。

主要功能:

  • 快速重建:从单张图片中迅速生成3D人物模型。
  • 高保真度:生成的3D模型具有逼真的纹理和准确的几何形状。
  • 可动画化:生成的3D人物模型可以直接用于动画制作,无需后处理。

主要特点:

  1. 高效率:模型能在不到一秒的时间内完成重建,适合实时应用。
  2. 通用性:能够处理多样化的人形姿态和外观,包括跨领域数据、严重视角和遮挡情况。
  3. 统一结构表示:使用3D高斯表示和SMPL-X模型,便于动画制作和编辑。
  4. 大规模数据集:利用了超过100K个多样化、高保真度的人物图像数据集HuGe100K,提高了模型的泛化能力。

框架概述

IDOL的架构是一个完全可微分的基于变压器的框架,专门设计用于从单张图像中重建出可以动画化的3D人体模型。该模型的关键组成部分包括:

  • 高分辨率编码器:用于捕捉输入图像中的细节。
  • UV-Alignment Transformer:将图像令牌与可学习的UV令牌融合,确保图像特征准确映射到3D人体模型上。
  • UV解码器:预测高斯属性图作为中间表示,这些图在由SMPL-X模型定义的2D UV空间中捕捉人体的几何和外观。
  • 线性混合蒙皮(LBS):结合高斯属性图与SMPL-X模型,表示规范空间中的3D人体虚拟形象,并允许对其进行动画处理。

通过使用多视角图像对模型进行优化,IDOL能够学习解耦姿势、外观和形状,从而实现更加逼真和灵活的人体重建。

数据集:HuGe100K

为了支持这一强大的框架,研究人员还引入了名为HuGe100K的数据集,它包含了超过100,000个照片级真实感的多视角主体,旨在促进非商业研究目的的稳健3D重建任务。这个数据集对于提升人体建模研究的质量和深度起到了关键作用。

0

评论0

没有账号?注册  忘记密码?