SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像编辑

    共 60 篇文章
    排序
    发布更新浏览点赞
    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    OmniGen2 是由北京人工智能研究院推出的统一多模态生成模型,目前已正式适配 ComfyUI 原生环境,支持从文本生成图像、指令级图像编辑到多图融合的一站式创作流程。 作为新一代多功能视觉生成系统...
    工作流# ComfyUI# OmniGen2# 北京人工智能研究院
    8个月前
    03680
    新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑

    新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑

    校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能力。然而,尽管它们在视觉生成中表现出色,校正流模型在图像的解耦编辑方面往往表现不佳。这一限制阻碍了在不影响图像无关部分...
    新技术# FLUX# FluxSpace# 图像编辑
    1年前
    03630
    Madd模型:通过引入“功能性”概念,旨在根据各种位置提示将任何对象无缝插入任何场景中

    Madd模型:通过引入“功能性”概念,旨在根据各种位置提示将任何对象无缝插入任何场景中

    图像合成是计算机视觉中的一个常见任务,涉及将前景对象无缝集成到背景场景中。传统的图像合成方法通常依赖于人为的编辑或预定义的规则,难以处理前景对象与背景场景之间的复杂相互作用。为了应对这一挑战,哈佛大学...
    新技术# Madd模型# 图像编辑
    1年前
    03580
    通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务

    通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务

    阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++,这是之前介绍过的新型多模态生成模型ACE升级版,ACE++ 通过改进的长上下文条件单元(LCU++)和两阶段训练方案,能够高效地利用预训练...
    图像模型# ACE# FLUX.1-dev# 图像生成
    1年前
    03520
    无监督指令驱动图像编辑框架UIP2P:在不需要真实编辑图像数据集的情况下,根据文本指令对图像进行编辑

    无监督指令驱动图像编辑框架UIP2P:在不需要真实编辑图像数据集的情况下,根据文本指令对图像进行编辑

    现有的基于指令的图像编辑方法通常依赖于监督学习,需要包含输入图像、编辑图像和编辑指令的三元组数据集。这些数据集通常通过现有编辑方法或人工标注生成,引入了偏差并限制了模型的泛化能力。为了克服这些挑战,苏...
    新技术# UIP2P# 图像编辑
    1年前
    03510
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    9个月前
    03450
    基于预训练流模型的新型文本驱动图像编辑方法FlowEdit:适用于SD3和Flux模型

    基于预训练流模型的新型文本驱动图像编辑方法FlowEdit:适用于SD3和Flux模型

    使用预训练的文本到图像(T2I)扩散或流模型编辑真实图像是一项具有挑战性的任务。传统的方法通常涉及将目标图像反转为对应的噪声图,然后根据新的文本提示重新生成图像。然而,仅靠反转变换往往无法获得满意的结...
    新技术# FlowEdit# 图像编辑
    1年前
    03450
    基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作

    基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作

    图像编辑技术近年来在基于反演(inversion-based)和基于指令(instruction-based)的方法上取得了显著进步。然而,这些方法各自存在局限性: 基于反演的方法:在处理重大修改(如...
    图像模型# BrushEdit# 图像编辑
    1年前
    03360
    新型图像编辑框架PixelMan:基于扩散模型,通过像素操作和生成来实现一致性的对象编辑

    新型图像编辑框架PixelMan:基于扩散模型,通过像素操作和生成来实现一致性的对象编辑

    阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型图像编辑框架PixelMan,它基于扩散模型(Diffusion Models, DMs),通过像素操作和生成来实...
    新技术# PixelMan# 图像编辑
    1年前
    03340
    FreSca:用于增强扩散模型在图像编辑和图像理解任务中的性能

    FreSca:用于增强扩散模型在图像编辑和图像理解任务中的性能

    罗切斯特大学、Netflix Eyeline Studios和德克萨斯大学达拉斯分校的研究人员推出 FreSca,用于增强扩散模型(Diffusion Models)在图像编辑和图像理解任务中的性能...
    新技术# FreSca# 图像理解# 图像编辑
    1年前
    03160
    图像编辑工具SwiftEdit:通过简单的文本提示实现快速的图像编辑

    图像编辑工具SwiftEdit:通过简单的文本提示实现快速的图像编辑

    VinAI 研究中心、越南科技大学邮电研究所的研究人员推出图像编辑工具SwiftEdit,它能够通过简单的文本提示实现快速的图像编辑。SwiftEdit的核心优势在于其极速的编辑能力,能够在0.23秒...
    新技术# SwiftEdit# 图像编辑
    1年前
    03120
    解决图像生成与编辑任务的统一框架UniReal

    解决图像生成与编辑任务的统一框架UniReal

    图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图像修复等。然而,现有的解决方案通常针对特定任务设计,缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea...
    新技术# UniReal# 图像生成# 图像编辑
    1年前
    03000
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Alaya Code

    Alaya Code

    九章云极正式推出AI编码平台Alaya Code,为企业及开发者提供一站式AI编程与模型调用服务。平台以"普惠+灵活"为核心定位,依托九章云极智算云生态,将算力调度、模型适配封装为开箱即用的开发工具,实现“算力-模型-开发”全链路打通,凭借高调用量、多模型聚合、双SDK兼容等优势,成为AI编程与智能体开发新选择。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    抓虾吧

    抓虾吧

    “抓虾吧”奉行AI社交法则,严禁人类撰写内容,仅限部署了OpenClaw的AI智能体发帖,这也是国内首个纯AI自治贴吧。
    Jellyfish AI短剧工厂

    Jellyfish AI短剧工厂

    Jellyfish AI 短剧工厂 是一款专为 竖屏短剧/微短剧 打造的一站式 AI 生产工具,旨在将原本充满不确定性的 AI 创作,转变为标准化、可控制的 工业化生产流程。
    查看完整榜单