SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    图像编辑

    共 55 篇文章
    排序
    发布更新浏览点赞
    MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    新MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    当前主流的图像编辑模型在处理静态属性(如颜色、纹理、物体替换)时已相当成熟,但在修改图像中主体的动作、姿势或交互行为时仍面临显著挑战。例如,让一个人从“站立”变为“坐下”,或让其“拿起桌上的杯子”,现...
    图像模型# MotionEdit# 图像编辑
    2天前
    050
    基于图像编辑模型的 FE2E:革新单目密集几何预测

    基于图像编辑模型的 FE2E:革新单目密集几何预测

    在单目深度估计、表面法线预测等密集几何预测任务中,如何在有限标注数据下实现高精度的零样本泛化,一直是三维视觉的核心挑战。 近年来,研究者尝试利用文本到图像生成模型(如Stable Diffusion...
    图像模型# FE2E# 图像编辑
    3个月前
    02020
    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。 这一发现来自 Google Labs 实验...
    早报# Gempix# Imagen 4# Whisk
    4个月前
    05040
    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    在图像生成领域,自回归模型长期被视作“文本专家,视觉弱项”——它们擅长逐词生成语言,却难以像扩散模型那样精细构建图像。而如今,阶跃星辰(StepFun)正试图打破这一边界。 GitHub:https...
    图像模型# NextStep-1# 图像生成# 图像编辑
    4个月前
    04860
    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    OmniGen2 是由北京人工智能研究院推出的统一多模态生成模型,目前已正式适配 ComfyUI 原生环境,支持从文本生成图像、指令级图像编辑到多图融合的一站式创作流程。 作为新一代多功能视觉生成系统...
    工作流# ComfyUI# OmniGen2# 北京人工智能研究院
    5个月前
    03180
    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    由新加坡国立大学、浙江大学、罗切斯特理工学院、南京大学、中国科学技术大学、曼苏里大学人工智能学院、上海人工智能实验室和SII联合提出的新方法 LoongX,首次将多模态脑机接口(BCI)信号引入扩散模...
    新技术# LoongX# 图像编辑
    5个月前
    02330
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    5个月前
    02510
    Nunchaku正式支持FLUX.1 Kontext Dev:低显存用户的福音

    Nunchaku正式支持FLUX.1 Kontext Dev:低显存用户的福音

    在6月26日,黑森林实验室(Black Forest Labs)发布了其图像编辑模型FLUX.1 Kontext开源版本 FLUX.1 Kontext [dev]。尽管这一模型在图像编辑质量上表现优异...
    工作流# FLUX.1 Kontext [dev]# Nunchaku# nunchaku-flux.1-kontext-dev
    6个月前
    01,3110
    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    北京大学深圳研究生院、鹏城实验室、兔展AI的研究人员推出统一视觉理解与生成框架UniWorld,它基于强大的视觉-语言模型和对比语义编码器,能够同时处理图像感知和图像操控任务。 GitHub:http...
    图像模型# UniWorld# 图像生成# 图像编辑
    6个月前
    03350
    ComfyUI 新玩法:用 Flux.1 Kontext Pro 和 Max 图像 API 节点轻松实现智能图像编辑

    ComfyUI 新玩法:用 Flux.1 Kontext Pro 和 Max 图像 API 节点轻松实现智能图像编辑

    在图像编辑领域,高效且精准的工具是提升工作效率的关键。今天,我们将深入探讨如何在 ComfyUI 中利用 Flux.1 Kontext Pro Image API 节点来实现强大的图像编辑功能。通过简...
    工作流# ComfyUI# Flux.1 Kontext Pro# 图像编辑
    7个月前
    07280
    基于Flux模型的图像编辑框架Insert Anything:通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中

    基于Flux模型的图像编辑框架Insert Anything:通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中

    来自 浙江大学、哈佛大学 和 南洋理工大学 的研究人员提出了一种名为 Insert Anything 的创新框架,通过用户指定的灵活控制,将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...
    图像模型# Insert Anything# 图像编辑
    7个月前
    01610
    字节跳动推出新型图像编辑方法 SuperEdit :通过改进监督信号来提升基于指令的图像编辑性能

    字节跳动推出新型图像编辑方法 SuperEdit :通过改进监督信号来提升基于指令的图像编辑性能

    字节跳动和佛罗里达中央大学计算机视觉研究中心的研究人员推出新型图像编辑方法 SuperEdit ,通过改进监督信号来提升基于指令的图像编辑性能。 项目主页:https://liming-ai.gith...
    图像模型# SuperEdit# 图像编辑# 字节跳动
    7个月前
    02400
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单