SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    图像编辑

    共 57 篇文章
    排序
    发布更新浏览点赞
    Grok 图像编辑功能被滥用于生成非自愿性化内容,包括未成年人

    Grok 图像编辑功能被滥用于生成非自愿性化内容,包括未成年人

    xAI 旗下 AI 聊天机器人 Grok 近期推出的图像编辑功能,正被大规模滥用于未经同意地对真实人物(包括女性、儿童、政要和名人)生成性化图像——如移除衣物、添加比基尼、摆出暗示性姿势等。 这一功能...
    早报# Grok# 图像编辑
    3天前
    0290
    X 平台上线“AI 图像编辑”功能,创作者掀起新一轮撤离潮

    X 平台上线“AI 图像编辑”功能,创作者掀起新一轮撤离潮

    自 12 月 24 日起,社交平台 X(原 Twitter)在网页版悄悄上线了一项新功能:用户可直接对时间轴中的任意图片——包括他人发布的图像——点击“编辑图片”按钮,通过内建 AI 工具进行修改。 ...
    早报# Aurora# Grok# 图像编辑
    2周前
    0190
    MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    当前主流的图像编辑模型在处理静态属性(如颜色、纹理、物体替换)时已相当成熟,但在修改图像中主体的动作、姿势或交互行为时仍面临显著挑战。例如,让一个人从“站立”变为“坐下”,或让其“拿起桌上的杯子”,现...
    图像模型# MotionEdit# 图像编辑
    4周前
    0320
    基于图像编辑模型的 FE2E:革新单目密集几何预测

    基于图像编辑模型的 FE2E:革新单目密集几何预测

    在单目深度估计、表面法线预测等密集几何预测任务中,如何在有限标注数据下实现高精度的零样本泛化,一直是三维视觉的核心挑战。 近年来,研究者尝试利用文本到图像生成模型(如Stable Diffusion...
    图像模型# FE2E# 图像编辑
    4个月前
    02200
    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。 这一发现来自 Google Labs 实验...
    早报# Gempix# Imagen 4# Whisk
    5个月前
    05690
    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    在图像生成领域,自回归模型长期被视作“文本专家,视觉弱项”——它们擅长逐词生成语言,却难以像扩散模型那样精细构建图像。而如今,阶跃星辰(StepFun)正试图打破这一边界。 GitHub:https...
    图像模型# NextStep-1# 图像生成# 图像编辑
    5个月前
    05050
    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    OmniGen2 是由北京人工智能研究院推出的统一多模态生成模型,目前已正式适配 ComfyUI 原生环境,支持从文本生成图像、指令级图像编辑到多图融合的一站式创作流程。 作为新一代多功能视觉生成系统...
    工作流# ComfyUI# OmniGen2# 北京人工智能研究院
    6个月前
    03310
    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    由新加坡国立大学、浙江大学、罗切斯特理工学院、南京大学、中国科学技术大学、曼苏里大学人工智能学院、上海人工智能实验室和SII联合提出的新方法 LoongX,首次将多模态脑机接口(BCI)信号引入扩散模...
    新技术# LoongX# 图像编辑
    6个月前
    02430
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    6个月前
    02990
    Nunchaku正式支持FLUX.1 Kontext Dev:低显存用户的福音

    Nunchaku正式支持FLUX.1 Kontext Dev:低显存用户的福音

    在6月26日,黑森林实验室(Black Forest Labs)发布了其图像编辑模型FLUX.1 Kontext开源版本 FLUX.1 Kontext [dev]。尽管这一模型在图像编辑质量上表现优异...
    工作流# FLUX.1 Kontext [dev]# Nunchaku# nunchaku-flux.1-kontext-dev
    6个月前
    01,3430
    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    北京大学深圳研究生院、鹏城实验室、兔展AI的研究人员推出统一视觉理解与生成框架UniWorld,它基于强大的视觉-语言模型和对比语义编码器,能够同时处理图像感知和图像操控任务。 GitHub:http...
    图像模型# UniWorld# 图像生成# 图像编辑
    7个月前
    03680
    ComfyUI 新玩法:用 Flux.1 Kontext Pro 和 Max 图像 API 节点轻松实现智能图像编辑

    ComfyUI 新玩法:用 Flux.1 Kontext Pro 和 Max 图像 API 节点轻松实现智能图像编辑

    在图像编辑领域,高效且精准的工具是提升工作效率的关键。今天,我们将深入探讨如何在 ComfyUI 中利用 Flux.1 Kontext Pro Image API 节点来实现强大的图像编辑功能。通过简...
    工作流# ComfyUI# Flux.1 Kontext Pro# 图像编辑
    7个月前
    07750
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    MemU

    MemU

    MemU 是一个开源的 AI 伴侣记忆框架,具有高准确性、快速检索和低成本的特点。它作为一个智能的“记忆文件夹”,能够适应不同的 AI 伴侣应用场景。通过 MemU,你可以构建真正记住你的 AI 伴侣。它们能够学习你的身份、关注点,并在每次互动中与你共同成长。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Midjourney

    Midjourney

    Midjourney是目前最强的AI绘画工具,输入提示词即可通过AI算法生成相对应的图片,只需要不到一分钟。对于新用户,官方提供一段时间的免费试用,用户可以直接通过谷歌账号注册体验。
    查看完整榜单