SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    图像模型

    共 212 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    新型图像训练自由方法 IP-Composer:从多个视觉概念中合成图像

    新型图像训练自由方法 IP-Composer:从多个视觉概念中合成图像

    特拉维夫大学和英伟达的研究人员介绍了一种名为 IP-Composer 的新型训练自由(training-free)方法,用于从多个视觉概念中合成图像。该方法通过自然语言描述从输入图像中提取特定概念,并...
    图像模型# IP-Composer
    7个月前
    03320
    三阶段扩散模型框架ColorFlow:专门用于解决黑白图像的自动着色问题

    三阶段扩散模型框架ColorFlow:专门用于解决黑白图像的自动着色问题

    ColorFlow 是由清华大学和腾讯ARC实验室提出的一个创新性三阶段扩散模型框架,专门用于解决黑白图像序列的自动着色问题。该模型旨在确保角色和对象的身份(ID)在着色过程中得到一致保留,同时生成高...
    图像模型# ColorFlow
    10个月前
    03310
    图像质量评估体系HPSv3:用“人类偏好”重新定义图像生成质量评估

    图像质量评估体系HPSv3:用“人类偏好”重新定义图像生成质量评估

    当AI画出一张“森林中休息的鹿”,我们如何判断它画得好不好? 是看它是否包含“鹿”和“树木”?还是看光影是否自然、构图是否美观、整体是否令人愉悦?显然,后者更贴近人类的真实审美。然而,当前大多数文本到...
    图像模型# HPSv3# 图像质量评估体系
    4个月前
    03300
    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    统一视觉理解与生成框架UniWorld:支持 20+语义图片编辑任务

    北京大学深圳研究生院、鹏城实验室、兔展AI的研究人员推出统一视觉理解与生成框架UniWorld,它基于强大的视觉-语言模型和对比语义编码器,能够同时处理图像感知和图像操控任务。 GitHub:http...
    图像模型# UniWorld# 图像生成# 图像编辑
    6个月前
    03300
    图像修复模型PixelHacker:基于潜在类别引导并结合扩散模型,显著提升图像修复质量

    图像修复模型PixelHacker:基于潜在类别引导并结合扩散模型,显著提升图像修复质量

    图像修复(Image Inpainting)是计算机视觉领域的重要研究方向,旨在通过生成合理的图像内容填补缺失或损坏的部分。然而,现有方法在处理复杂结构(如纹理、形状和空间关系)以及语义一致性(如颜色...
    图像模型# PixelHacker# 图像修复模型
    7个月前
    03290
    新型图像编码器FlexTok:能够将二维图像重新采样为长度可变的一维离散标记(token)序列

    新型图像编码器FlexTok:能够将二维图像重新采样为长度可变的一维离散标记(token)序列

    苹果和瑞士洛桑联邦理工学院的研究人员推出新型图像编码器FlexTok,它能够将二维图像重新采样为长度可变的一维离散标记(token)序列。FlexTok 的核心思想是通过灵活的标记长度来适应图像的复杂...
    图像模型# FlexTok# 图像编码器
    8个月前
    03290
    FLUX.1 Tools 系列模型FP8量化版本,适合小显存用户使用

    FLUX.1 Tools 系列模型FP8量化版本,适合小显存用户使用

    黑森林实验室(Black Forest Labs)在上个月发布了 FLUX.1 Tools 系列开源模型,旨在为图像处理和生成任务提供强大的工具。该系列包括以下三个主要模型: FLUX.1 Fill...
    图像模型# FLUX.1 Canny# FLUX.1 Depth# FLUX.1 Fill
    10个月前
    03250
    基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作

    基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作

    图像编辑技术近年来在基于反演(inversion-based)和基于指令(instruction-based)的方法上取得了显著进步。然而,这些方法各自存在局限性: 基于反演的方法:在处理重大修改(如...
    图像模型# BrushEdit# 图像编辑
    10个月前
    03240
    单步扩散方法NitroFusion:通过动态对抗框架实现高质量的图像生成

    单步扩散方法NitroFusion:通过动态对抗框架实现高质量的图像生成

    萨里大学和NetMind.AI的研究人员提出了NitroFusion,这是一种根本不同的单步扩散方法,旨在通过动态对抗框架实现高质量的图像生成。尽管单步方法在速度上具有显著优势,但它们通常在生成质量上...
    图像模型# NitroFusion# 单步扩散
    10个月前
    03240
    多功能即插即用适配器MV-Adapter:将SDXL模型及其衍生模型适配为多视图生成器。

    多功能即插即用适配器MV-Adapter:将SDXL模型及其衍生模型适配为多视图生成器。

    现有的多视图图像生成方法通常对预训练的文生图模型进行侵入性修改,并需要全面微调,导致高计算成本和图像质量下降。为了解决这些问题,北京航空航天大学、VAST 和上海交通大学的研究人员提出了 MV-Ada...
    图像模型# MV-Adapter# SDXL模型# 多视图
    10个月前
    03240
    多功能大规模扩散模型OneDiffusion:能够无缝支持双向图像合成和理解,跨越多种不同的任务

    多功能大规模扩散模型OneDiffusion:能够无缝支持双向图像合成和理解,跨越多种不同的任务

    AI2、加州大学欧文分校和华盛顿大学的研究人员介绍了一种名为OneDiffusion的多功能、大规模扩散模型。OneDiffusion能够无缝支持在多样化任务中进行双向图像合成和理解,涵盖从文本、深度...
    图像模型# OneDiffusion# 扩散模型
    10个月前
    03220
    跨模态图像生成模型Qwen2vl-Flux:将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成

    跨模态图像生成模型Qwen2vl-Flux:将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成

    Qwen2vl-Flux 是一种先进的跨模态图像生成模型,它将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成。该模型在文本提示和视觉参考的基础上生成高质量图像...
    图像模型# Qwen2vl-Flux# 视觉语言模型
    10个月前
    03190
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    DeepAnalyze

    DeepAnalyze

    DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。
    查看完整榜单