SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像模型

    共 225 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能

    高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能

    北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的...
    图像模型# Ctrl-Adapter# 空间控制# 视频生成模型
    12个月前
    08380
    Stability AI推出新模型Stable Cascade

    Stability AI推出新模型Stable Cascade

    关键要点摘要: Stable Cascade模型发布: 今天,Stability AI推出了基于Würstchen架构的文生图模型Stable Cascade,并仅允许在非商业许可下使用,限定于非商业...
    图像模型# Stability AI# Stable Cascade# 模型
    12个月前
    08190
    开源版GPT-4o!字节跳动开源新一代多模态模型 BAGEL:多模态理解、图像生成、图像编辑,还能“思考”

    开源版GPT-4o!字节跳动开源新一代多模态模型 BAGEL:多模态理解、图像生成、图像编辑,还能“思考”

    字节跳动发布了一款名为 BAGEL 的开源多模态基础模型,该模型拥有 70 亿活跃参数(总规模为 140 亿),在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...
    图像模型# BAGEL# GPT-4o# 多模态模型
    8个月前
    07950
    基于扩散模型(SDXL)的新型图像恢复方法InstantIR

    基于扩散模型(SDXL)的新型图像恢复方法InstantIR

    盲图像恢复(Blind Image Restoration, BIR)的主要挑战之一是处理测试时未知的退化,这需要模型具备高泛化能力。北京大学、InstantX团队和香港中文大学的研究人员提出了一种新...
    图像模型# InstantIR# 即时参考图像恢复# 高清修复
    12个月前
    07940
    新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示

    新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示

    阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...
    图像模型# Ranni# 文生图模型
    12个月前
    07810
    新型文生图框架SANA:能够高效地生成高达4096×4096分辨率的高清晰度图像

    新型文生图框架SANA:能够高效地生成高达4096×4096分辨率的高清晰度图像

    英伟达、麻省理工学院和清华大学的研究人员推出新型文本到图像生成框架SANA,它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA的核心优势在于它不仅生成的图像质量高,而且与文本的匹配度...
    图像模型# SANA# 文生图框架
    12个月前
    07790
    Stable Diffusion XL(SDXL)

    Stable Diffusion XL(SDXL)

    Stability AI于北京时间2023年 7 月 27 日正式发布 Stable Diffusion XL 首个正式版 1.0,SDXL 1.0 能生成更加鲜明准确的色彩,在对比度、光线和阴影方面...
    图像模型# AI绘画# SDXL# Stable Diffusion XL
    12个月前
    07530
    人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成

    人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成

    阿里巴巴集团智能计算研究院推出人像个性化框架UniPortrait,支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成。简单来说,UniPortrait能够根据用户提供的文本...
    图像模型# UniPortrait# 人像个性化
    12个月前
    07510
    统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能

    统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能

    来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL,它通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能。UniFL作为一种通用、高...
    图像模型# Stable Diffusion# UniFL
    12个月前
    07500
    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2

    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2

    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版,上个月它们推出了AuraSR 第一版后,得到了开源社区积极回应,让他们立刻着手开发新版。AuraSR 以 Adobe 的 Giga...
    图像模型# AuraSR# AuraSR-v2# Fal.ai
    12个月前
    07380
    以Stable Cascade为基础!新型超高分辨率图像生成方法UltraPixel:生成从1K至6K多种分辨率的高品质图像

    以Stable Cascade为基础!新型超高分辨率图像生成方法UltraPixel:生成从1K至6K多种分辨率的高品质图像

    香港科技大学(广州)、 华为诺亚方舟实验室、马克斯普朗克信息研究所和香港科技大学的研究人员推出一种新型超高分辨率图像生成方法UltraPixel,此方法是以Stability AI的模型Stable...
    图像模型# Stable Cascade# UltraPixel# 超高分辨率图像生成
    12个月前
    07150
    新型多模态自回归模型Lumina-mGPT:能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片

    新型多模态自回归模型Lumina-mGPT:能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片

    上海人工智能实验室和香港中文大学的研究人员推出新型多模态自回归模型Lumina-mGPT,它能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片。与现有的基于自回归的图像生成方法不同,Lum...
    图像模型# Lumina-mGPT# 多模态自回归模型
    12个月前
    07120
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    CivitAI

    CivitAI

    CivitAI是一个AI图像及视频模型托管平台,主要聚焦于 AI 生成的图像、视频和模型。它为用户提供了一个空间,可以上传、分享和发现由特定数据集训练的自定义 AI 模型,这些模型可用于生成独特的内容,如图像、视频。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单