无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑

Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow,这是一种无需训练的图像编辑技术,能够执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑。这种方法的核心在于利用扩散模型,特别是基于Diffusion Transformer (DiT) 架构的模型,通过选择性地注入注意力特征来实现一致的图像编辑。

例如,有一个风景照片,用户想要在照片中添加一只动物,比如一只鹿。使用Stable Flow,用户只需提供一张鹿的参考图片和一个编辑提示,模型就能够在保持风景不变的情况下,在适当的位置添加一只鹿。这种方法不仅能够保持原有场景的真实性,还能够根据需要进行创造性的编辑。

主要功能和特点:

  1. 无需训练:Stable Flow不需要对模型进行额外的训练,这使得它能够快速应用于各种图像编辑任务。
  2. 多样性编辑:能够处理非刚性编辑(如改变物体姿态)、物体添加(如在场景中添加新物体)、物体替换(替换场景中的特定物体)和场景变化(如改变整个背景)。
  3. 一致性:通过选择性地在模型的“关键层”注入参考图像的特征,Stable Flow能够确保编辑操作的一致性,只改变指定的部分,而保留图像的其他内容。
  4. 自动检测关键层:提出了一种自动方法来检测DiT模型中的“关键层”(vital layers),这些层对图像形成至关重要,有助于控制图像编辑过程。

工作原理: 

Stable Flow的工作原理基于以下几个步骤:

  1. 关键层识别:通过系统性评估方法确定DiT模型中的关键层,这些层对最终生成的图像内容有显著影响。
  2. 特征注入:在生成编辑图像的过程中,只有关键层会接收来自参考图像的注意力特征,这有助于在保持图像其他部分不变的情况下,实现特定部分的编辑。
  3. 图像反转:为了编辑真实图像,Stable Flow使用改进的图像反转方法将真实图像转换为模型的潜在空间表示。
  4. 编辑执行:通过在关键层中注入参考图像的特征,Stable Flow能够在保持图像其他部分不变的情况下,对指定部分进行编辑。

具体应用场景:

  1. 内容创作:艺术家和设计师可以使用Stable Flow来编辑图像,添加或替换图像中的元素,以创造新的视觉效果。
  2. 照片修复:在旧照片或损坏的图像中,Stable Flow可以用来修复或替换图像的特定部分,如去除划痕或修复褪色区域。
  3. 增强现实:在增强现实应用中,Stable Flow可以用来在实时环境中添加虚拟物体,或者修改现实世界中的元素。
  4. 数据增强:在机器学习中,Stable Flow可以用来生成训练数据的变体,通过编辑训练图像来增加数据集的多样性。
0

评论0

没有账号?注册  忘记密码?