多视角视频生成新技术SynCamMaster：能够从不同的视点生成同步的、一致性高的动态场景视频

新技术1年前发布小马良

379 0

浙江大学、快手科技、清华大学和香港中文大学的研究人员推出一种用于多视角视频生成的技术SynCamMaster，能够从不同的视点生成同步的、一致性高的动态场景视频。这项技术特别适用于虚拟拍摄等应用，它通过利用现有的文本到视频的扩散模型，增强了模型在多摄像机视频生成方面的能力，确保了不同视点间的内容一致性。

项目主页：https://jianhongbai.github.io/SynCamMaster
GitHub：https://github.com/KwaiVGI/SynCamMaster
数据集：https://huggingface.co/datasets/KwaiVGI/SynCamVideo-Dataset

例如，我们有一个场景，其中有一个年轻美丽的女孩穿着粉色裙子在弹钢琴。使用SynCamMaster，我们可以从多个不同的摄像机位置生成这个场景的视频，例如，从左侧、右侧、上方或下方视角。这些视频将展现出相同的动态场景，但每个视频的视角和视点都会有所不同，同时保持场景中对象的一致性和几何结构。

主要功能：

多视角视频生成：SynCamMaster能够根据文本提示生成多个视角的视频。
视点间同步：确保不同视点生成的视频在内容和几何结构上保持一致。
无需训练：作为一个即插即用的模块，SynCamMaster可以直接应用于预训练的文本到视频模型，无需额外的训练。

主要特点：

多视图同步模块：通过引入多视图同步模块来保持不同视点间的一致性。
混合数据训练方案：利用多摄像机图像、单目视频和虚幻引擎渲染的多摄像机视频来补充训练数据。
新视角视频合成：支持从新视角重新渲染输入视频的能力。

工作原理：

SynCamMaster的工作流程包括以下几个步骤：

预训练模型：使用一个预训练的文本到视频的扩散模型作为基础。
摄像机编码器：将摄像机的外在参数编码到嵌入空间。
多视图同步模块：在每个变换器块中插入多视图同步模块，以实现视图间的几何和视觉一致性。
混合数据训练：结合多视图图像、单目视频和虚幻引擎渲染的多视图视频进行训练，以提高模型的泛化能力。
新视角视频合成：通过引入参考视频，将SynCamMaster扩展到新视角视频合成任务。

新技术 # SynCamMaster # 多视角视频

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

新型视频去噪框架Ouroboros-Diffusion：提高无调优（tuning-free）长视频生成中的结构和内容（主体）一致性

新型视频去噪框架Ouroboros-Diffusion：提高无调优（tuning-free）长视频生成中的结构和内容（主体）一致性

新技术 # Ouroboros-Diffusion # 视频去噪

1年前

02360

新型视频生成框架VideoGuide：改善视频生成模型在时间连续性方面的性能，同时保持甚至提高生成视频的图像质量

新型视频生成框架VideoGuide：改善视频生成模型在时间连续性方面的性能，同时保持甚至提高生成视频的图像质量

新技术 # VideoGuide # 视频生成框架

1年前

04310

图像编辑框架FlexEdit：用于灵活且可控地编辑图像中的物体

图像编辑框架FlexEdit：用于灵活且可控地编辑图像中的物体

新技术 # FlexEdit # 图像编辑框架

2年前

07920

SSAM 2增强版SAMURAI：专门设计用于视觉物体跟踪

SSAM 2增强版SAMURAI：专门设计用于视觉物体跟踪

新技术 # SAMURAI # SSAM 2

1年前

06450

暂无评论

none

暂无评论...