图像编辑框架FlexEdit：用于灵活且可控地编辑图像中的物体

新技术11个月前发布小马良

367 0

来自VinAI Research和越南科技大学的研究人员推出图像编辑框架 FlexEdit，它是一个基于扩散模型（Stable Diffusion）的图像编辑框架，专门设计用于灵活且可控地编辑图像中的物体。

项目主页

论文

FlexEdit允许用户通过文本提示来指定想要编辑的物体，然后系统会自动进行编辑，比如更换、添加或移除物体，同时保持图像的其他部分不变。

主要功能和特点：

可控性：用户可以指定编辑物体的大小和位置，使得编辑结果更加符合用户的预期。

灵活性：FlexEdit能够在不需要额外遮罩输入的情况下自然地添加新物体。

高保真：在编辑过程中，系统会尽量保持原始图像的背景信息，确保编辑后的图像看起来自然且与原图保持一致。

工作原理：

FlexEdit的工作原理基于扩散模型，它在去噪过程中逐步优化潜在的表示（latents）。在每一步去噪过程中，系统都会结合两个关键元素：潜在优化（latent optimization）和与自适应二值物体遮罩（adaptive binary object mask）融合。通过这种方式，系统能够在保持编辑语义的同时，保持对源图像的高保真度。

总的来说，FlexEdit是一个强大的图像编辑工具，它通过结合最新的AI技术和用户友好的文本提示，为用户提供了一个简单而直观的方式来编辑图像中的物体。