视频风格化方法StyleMaster：能够对视频进行艺术化生成和风格转换

新技术1年前发布小马良

289 0

香港科技大学和快手的研究人员推出视频风格化方法StyleMaster，它能够对视频进行艺术化生成和风格转换。StyleMaster通过结合全局和局部的风格表示，实现了对视频内容的风格化处理，同时保持了与文本内容的紧密对应和参考图像的风格相似性。

项目主页：https://zixuan-ye.github.io/stylemaster
GitHub：https://github.com/KwaiVGI/StyleMaster

例如，我们有一段视频内容是“一个女孩在美丽的花园里读书”，我们希望将这个视频转换成梵高油画的风格。使用StyleMaster，我们可以生成一个具有梵高绘画风格纹理和色彩的视频，同时保持视频中女孩读书的核心内容不变。

主要功能和特点

风格提取与保持：StyleMaster能够从参考图像中提取风格特征，并将其应用到视频内容中，同时避免内容泄露。
全局与局部风格结合：通过全局风格投影和局部纹理特征的选择，StyleMaster能够捕捉图像的全局风格和细节纹理。
模型幻觉数据集：利用模型幻觉属性生成具有绝对风格一致性的配对数据集，以增强对比学习的效果。
运动适配器：通过在静态视频上训练的运动适配器，StyleMaster能够提升视频的动态质量和风格化程度。
灰色瓷砖ControlNet：使用灰色瓷砖作为内容引导，StyleMaster能够更精确地控制视频内容，实现视频风格转换。

工作原理

StyleMaster的工作原理包括以下几个关键步骤：

对比数据集构建：利用模型幻觉属性生成风格一致的配对图像，用于训练全局风格提取器。
全局风格描述提取：通过MLP层将CLIP的图像嵌入转换为全局风格表示。
局部和全局风格结合：选择与文本提示相似度低的局部补丁作为纹理特征，并与全局风格描述结合，形成完整的风格信息。
运动适配器：在静态视频上训练，用于增强视频的动态范围和风格化效果。
内容控制：使用灰色瓷砖ControlNet进行内容引导，以实现更精确的风格转换。

新技术 # StyleMaster # 视频风格化

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

英伟达联合 MIT 与港大推出 Fast-dLLM：显著提升扩散模型推理效率

英伟达联合 MIT 与港大推出 Fast-dLLM：显著提升扩散模型推理效率

新技术 # Fast-dLLM # 扩散模型

10个月前

01750

新型图像编辑框架PixelMan：基于扩散模型，通过像素操作和生成来实现一致性的对象编辑

新型图像编辑框架PixelMan：基于扩散模型，通过像素操作和生成来实现一致性的对象编辑

新技术 # PixelMan # 图像编辑

1年前

03340

用于视频合成的交互式工具Image Conductor：让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

用于视频合成的交互式工具Image Conductor：让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

新技术 # Image Conductor # 视频合成

2年前

08150

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

新技术 # T2V-Turbo # 文生视频

2年前

07300

暂无评论

none

暂无评论...