通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务 阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++,这是之前介绍过的新型多模态生成模型ACE升级版,ACE++ 通过改进的长上下文条件单元(LCU++)和两阶段训练方案,能够高效地利用预训练... 图像模型# ACE# FLUX.1-dev# 图像生成 2周前0670
新型图像编辑框架PixelMan:基于扩散模型,通过像素操作和生成来实现一致性的对象编辑 阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型图像编辑框架PixelMan,它基于扩散模型(Diffusion Models, DMs),通过像素操作和生成来实... 新技术# PixelMan# 图像编辑 2个月前01360
无监督指令驱动图像编辑框架UIP2P:在不需要真实编辑图像数据集的情况下,根据文本指令对图像进行编辑 现有的基于指令的图像编辑方法通常依赖于监督学习,需要包含输入图像、编辑图像和编辑指令的三元组数据集。这些数据集通常通过现有编辑方法或人工标注生成,引入了偏差并限制了模型的泛化能力。为了克服这些挑战,苏... 新技术# UIP2P# 图像编辑 2个月前01330
Madd模型:通过引入“功能性”概念,旨在根据各种位置提示将任何对象无缝插入任何场景中 图像合成是计算机视觉中的一个常见任务,涉及将前景对象无缝集成到背景场景中。传统的图像合成方法通常依赖于人为的编辑或预定义的规则,难以处理前景对象与背景场景之间的复杂相互作用。为了应对这一挑战,哈佛大学... 新技术# Madd模型# 图像编辑 2个月前01110
基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作 图像编辑技术近年来在基于反演(inversion-based)和基于指令(instruction-based)的方法上取得了显著进步。然而,这些方法各自存在局限性: 基于反演的方法:在处理重大修改(如... 图像模型# BrushEdit# 图像编辑 2周前01350
新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑 校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能力。然而,尽管它们在视觉生成中表现出色,校正流模型在图像的解耦编辑方面往往表现不佳。这一限制阻碍了在不影响图像无关部分... 新技术# FLUX# FluxSpace# 图像编辑 2个月前01250
ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成 对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由图像或文本指定的场景中。具体来说: 对象插入:将一个对象无缝地插入到目标场景中,要求合成后的图像在姿态、光照等方面看起来逼真... 新技术# ObjectMate# 图像编辑 2个月前01200
基于预训练流模型的新型文本驱动图像编辑方法FlowEdit:适用于SD3和Flux模型 使用预训练的文本到图像(T2I)扩散或流模型编辑真实图像是一项具有挑战性的任务。传统的方法通常涉及将目标图像反转为对应的噪声图,然后根据新的文本提示重新生成图像。然而,仅靠反转变换往往无法获得满意的结... 新技术# FlowEdit# 图像编辑 2个月前01110
解决图像生成与编辑任务的统一框架UniReal 图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图像修复等。然而,现有的解决方案通常针对特定任务设计,缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea... 新技术# UniReal# 图像生成# 图像编辑 2个月前01060
图像编辑工具SwiftEdit:通过简单的文本提示实现快速的图像编辑 VinAI 研究中心、越南科技大学邮电研究所的研究人员推出图像编辑工具SwiftEdit,它能够通过简单的文本提示实现快速的图像编辑。SwiftEdit的核心优势在于其极速的编辑能力,能够在0.23秒... 新技术# SwiftEdit# 图像编辑 2个月前01230
无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑 Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow,这是一种无需训练的图像编辑技术,能够执行各种类型的图像编辑操作,包括非刚性编辑... 新技术# Stable Flow# 图像编辑 3个月前01480
基于SD1.5模型的智能交互式图像编辑系统MagicQuill 香港科技大学、蚂蚁集团、浙江大学和香港大学的研究人员推出智能交互式图像编辑系统MagicQuill,该系统基于扩散模型(SD1.5模型)构建,允许用户通过三种直观的笔触:添加(add)、减去(subt... 工具# MagicQuill# SD1.5模型# 图像编辑 3个月前02850