基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在解决视觉捕捉方法在隐私保护、遮挡敏感性和对复杂光照条件下的局限性。

与依赖摄像头的方法不同,IMUs不需要拍摄视频,通过捕捉微小面部动作,来捕捉表情,所以更能保护个人隐私。即使在脸部部分被遮挡的情况下,它也能有效工作。

主要功能:

  • 使用特制的微型IMUs捕捉面部运动。
  • 提供与视觉信号同步的IMU数据集(IMU-ARKit),用于训练和验证面部表情捕捉模型。
  • 通过Transformer扩散模型,从IMU信号中准确预测面部混合形状参数。

主要特点:

  • 设计了微型IMUs,适合面部应用,强调小型化,以减少对自然面部运动的干扰。
  • 提出了一种基于解剖学驱动的IMU放置方案,以确保捕捉到关键面部肌肉群的运动。
  • 开发了IMU-ARKit数据集,包含了丰富的面部表情和表演的IMU/视觉信号配对。
  • 使用了两阶段训练策略,先使用模拟数据进行预训练,然后使用真实IMU数据进行微调。

工作原理:

  1. 硬件设计:设计了微型IMUs,将其放置在面部的关键区域,如颧骨、颊肌和额肌等,以捕捉面部表情。
  2. 数据采集:通过IMUs收集面部运动数据,同时使用ARKit记录视觉信号,创建IMU-ARKit数据集。
  3. 数据同步与校准:确保所有IMUs的信号同步,并校准以消除头部运动对数据的影响。
  4. 面部运动恢复:利用收集到的IMU数据,通过神经网络模型(Transformer扩散模型)预测面部混合形状参数,从而重建面部表情。

应用场景:

  • 隐私保护面部捕捉:在虚拟YouTuber(VTubers)领域,IMUSIC可以用于在不暴露真实身份的情况下捕捉和动画化数字角色的面部表情。
  • 混合捕捉:在录音棚等环境中,当面部被麦克风遮挡时,IMUSIC可以补充ARKit捕捉不到的面部运动,确保音频与面部动画同步。
  • 微小面部运动捕捉:IMUSIC能够捕捉到视觉摄像头难以捕捉的微小面部运动,如轻微的脸颊鼓起,为情感分析提供更丰富的数据。

IMUSIC是一个创新的面部捕捉技术,它通过IMUs提供了一种新的、隐私友好的方式来捕捉和分析面部表情,适用于多种场景,尤其是在视觉捕捉受限的情况下。

0

评论0

没有账号?注册  忘记密码?