SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像编辑

    共 60 篇文章
    排序
    发布更新浏览点赞
    ImageCritic:AI 绘图的“细节质检员”,专治 Logo 变形与文字乱码的通用后处理方案

    ImageCritic:AI 绘图的“细节质检员”,专治 Logo 变形与文字乱码的通用后处理方案

    在 AI 绘画飞速发展的今天,我们早已习惯了让模型根据文字描述创造出惊艳的画面,甚至能将特定的商品、宠物或角色无缝植入新场景。然而,一个长期存在的“老大难”问题始终困扰着专业应用:细节一致性。 当你试...
    图像模型# ImageCritic# 图像编辑
    4周前
    0440
    LoRWeB:AI 图像编辑新范式,只需“看一眼”就能学会任何修图技巧

    LoRWeB:AI 图像编辑新范式,只需“看一眼”就能学会任何修图技巧

    想象这样一个场景:你看到朋友的照片戴着一副酷炫的墨镜,效果极佳。你也想给自己的照片加上同款墨镜,但你既不会使用复杂的 Photoshop,也难以用文字精确描述“想要什么样的墨镜、戴在什么位置、光影如何...
    图像模型# LoRWeB# 图像编辑
    1个月前
    0610
    FIBO Edit 上线 ComfyUI:基于授权数据的 JSON 原生图像编辑,商业使用安全

    FIBO Edit 上线 ComfyUI:基于授权数据的 JSON 原生图像编辑,商业使用安全

    ComfyUI 官方宣布,Bria AI 的 FIBO Edit 模型现已通过合作伙伴节点集成至 ComfyUI。这是一款专为生产环境设计的图像编辑模型,其最大亮点在于:完全基于 100% 授权数据训...
    工作流# BRIA AI# FIBO Edit# 图像编辑
    2个月前
    0810
    Grok 图像编辑功能被滥用于生成非自愿性化内容,包括未成年人

    Grok 图像编辑功能被滥用于生成非自愿性化内容,包括未成年人

    xAI 旗下 AI 聊天机器人 Grok 近期推出的图像编辑功能,正被大规模滥用于未经同意地对真实人物(包括女性、儿童、政要和名人)生成性化图像——如移除衣物、添加比基尼、摆出暗示性姿势等。 这一功能...
    早报# Grok# 图像编辑
    3个月前
    0720
    X 平台上线“AI 图像编辑”功能,创作者掀起新一轮撤离潮

    X 平台上线“AI 图像编辑”功能,创作者掀起新一轮撤离潮

    自 12 月 24 日起,社交平台 X(原 Twitter)在网页版悄悄上线了一项新功能:用户可直接对时间轴中的任意图片——包括他人发布的图像——点击“编辑图片”按钮,通过内建 AI 工具进行修改。 ...
    早报# Aurora# Grok# 图像编辑
    3个月前
    01090
    MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    MotionEdit:首个专注动作编辑的图像生成基准与训练框架

    当前主流的图像编辑模型在处理静态属性(如颜色、纹理、物体替换)时已相当成熟,但在修改图像中主体的动作、姿势或交互行为时仍面临显著挑战。例如,让一个人从“站立”变为“坐下”,或让其“拿起桌上的杯子”,现...
    图像模型# MotionEdit# 图像编辑
    4个月前
    0740
    基于图像编辑模型的 FE2E:革新单目密集几何预测

    基于图像编辑模型的 FE2E:革新单目密集几何预测

    在单目深度估计、表面法线预测等密集几何预测任务中,如何在有限标注数据下实现高精度的零样本泛化,一直是三维视觉的核心挑战。 近年来,研究者尝试利用文本到图像生成模型(如Stable Diffusion...
    图像模型# FE2E# 图像编辑
    7个月前
    02940
    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。 这一发现来自 Google Labs 实验...
    早报# Gempix# Imagen 4# Whisk
    8个月前
    06730
    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    阶跃星辰发布 NextStep-1:140 亿参数自回归模型,用“连续令牌”重塑图像生成

    在图像生成领域,自回归模型长期被视作“文本专家,视觉弱项”——它们擅长逐词生成语言,却难以像扩散模型那样精细构建图像。而如今,阶跃星辰(StepFun)正试图打破这一边界。 GitHub:https...
    图像模型# NextStep-1# 图像生成# 图像编辑
    8个月前
    05350
    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    ComfyUI正式支持OmniGen2: 一个模型搞定文生图、图像编辑与多图合成

    OmniGen2 是由北京人工智能研究院推出的统一多模态生成模型,目前已正式适配 ComfyUI 原生环境,支持从文本生成图像、指令级图像编辑到多图融合的一站式创作流程。 作为新一代多功能视觉生成系统...
    工作流# ComfyUI# OmniGen2# 北京人工智能研究院
    8个月前
    03680
    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    由新加坡国立大学、浙江大学、罗切斯特理工学院、南京大学、中国科学技术大学、曼苏里大学人工智能学院、上海人工智能实验室和SII联合提出的新方法 LoongX,首次将多模态脑机接口(BCI)信号引入扩散模...
    新技术# LoongX# 图像编辑
    9个月前
    02810
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    9个月前
    03450
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    waoo

    waoo

    waoowaoo AI 影视 Studio 是一款基于 AI 技术的短剧/漫画视频制作工具,支持从小说文本自动生成分镜、角色、场景,并制作成完整视频。
    OpResume

    OpResume

    OpResume 是一款免登录、高颜值、数据纯本地存储的开源在线简历生成器。没有后端,没有数据库,你的所有信息只留在你的浏览器里,安全、私密且极致高效。
    HiDream

    HiDream

    智象未来(HiDream.ai)倾力打造的基于国际领先且自主可控生成式人工智能(AIGC)多模态大模型的全中文易上手AIGC创作平台和社区。
    ValueCell

    ValueCell

    ValueCell 是一个开源的多智能体金融平台,旨在通过协作式 AI 智能体为用户提供专业级的投资分析与自动化交易能力。平台整合深度研究、市场情绪、新闻解读、基本面分析与自动交易策略,帮助用户构建更智能、更高效的投资组合。
    查看完整榜单