无需训练的图像编辑技术Stable Flow：执行各种类型的图像编辑操作，包括非刚性编辑、物体添加、物体替换和全局场景编辑

新技术4个月前发布小马良

183 0

Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow，这是一种无需训练的图像编辑技术，能够执行各种类型的图像编辑操作，包括非刚性编辑、物体添加、物体替换和全局场景编辑。这种方法的核心在于利用扩散模型，特别是基于Diffusion Transformer (DiT) 架构的模型，通过选择性地注入注意力特征来实现一致的图像编辑。

项目主页：https://omriavrahami.com/stable-flow

例如，有一个风景照片，用户想要在照片中添加一只动物，比如一只鹿。使用Stable Flow，用户只需提供一张鹿的参考图片和一个编辑提示，模型就能够在保持风景不变的情况下，在适当的位置添加一只鹿。这种方法不仅能够保持原有场景的真实性，还能够根据需要进行创造性的编辑。

无需训练的图像编辑技术Stable Flow：执行各种类型的图像编辑操作，包括非刚性编辑、物体添加、物体替换和全局场景编辑

主要功能和特点：

无需训练：Stable Flow不需要对模型进行额外的训练，这使得它能够快速应用于各种图像编辑任务。
多样性编辑：能够处理非刚性编辑（如改变物体姿态）、物体添加（如在场景中添加新物体）、物体替换（替换场景中的特定物体）和场景变化（如改变整个背景）。
一致性：通过选择性地在模型的“关键层”注入参考图像的特征，Stable Flow能够确保编辑操作的一致性，只改变指定的部分，而保留图像的其他内容。
自动检测关键层：提出了一种自动方法来检测DiT模型中的“关键层”（vital layers），这些层对图像形成至关重要，有助于控制图像编辑过程。

工作原理：

Stable Flow的工作原理基于以下几个步骤：

关键层识别：通过系统性评估方法确定DiT模型中的关键层，这些层对最终生成的图像内容有显著影响。
特征注入：在生成编辑图像的过程中，只有关键层会接收来自参考图像的注意力特征，这有助于在保持图像其他部分不变的情况下，实现特定部分的编辑。
图像反转：为了编辑真实图像，Stable Flow使用改进的图像反转方法将真实图像转换为模型的潜在空间表示。
编辑执行：通过在关键层中注入参考图像的特征，Stable Flow能够在保持图像其他部分不变的情况下，对指定部分进行编辑。

无需训练的图像编辑技术Stable Flow：执行各种类型的图像编辑操作，包括非刚性编辑、物体添加、物体替换和全局场景编辑

具体应用场景：

内容创作：艺术家和设计师可以使用Stable Flow来编辑图像，添加或替换图像中的元素，以创造新的视觉效果。
照片修复：在旧照片或损坏的图像中，Stable Flow可以用来修复或替换图像的特定部分，如去除划痕或修复褪色区域。
增强现实：在增强现实应用中，Stable Flow可以用来在实时环境中添加虚拟物体，或者修改现实世界中的元素。
数据增强：在机器学习中，Stable Flow可以用来生成训练数据的变体，通过编辑训练图像来增加数据集的多样性。

新技术 # Stable Flow # 图像编辑

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

CoRe：用于文本到图像个性化的上下文正则化文本嵌入学习

CoRe：用于文本到图像个性化的上下文正则化文本嵌入学习

新技术 # CoRe

7个月前

03170

StdGEN：从单张图像生成高质量3D角色

StdGEN：从单张图像生成高质量3D角色

新技术 # 3D # StdGEN

2周前

01890

Face-Adapter：专为预训练扩散模型设计的高效且有效的适配器，用于实现高精度和高保真的面部编辑

Face-Adapter：专为预训练扩散模型设计的高效且有效的适配器，用于实现高精度和高保真的面部编辑

新技术 # Face-Adapter # 适配器 # 面部编辑

11个月前

03800

数据生成管道Gen4Gen：创建高质量的个性化图像和文本描述

数据生成管道Gen4Gen：创建高质量的个性化图像和文本描述

新技术 # Gen4Gen # 数据生成管道

1年前

03260

暂无评论

none

暂无评论...