SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像模型

    共 225 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta...
    图像模型# DiT# PIXART-Σ# 文生图模型
    12个月前
    01,0180
    CosmicMan:专注于生成高保真人类图像的文生图基础模型

    CosmicMan:专注于生成高保真人类图像的文生图基础模型

    上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http...
    图像模型# CosmicMan# 文生图模型
    12个月前
    01,0080
    文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性

    文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性

    Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成中实现主体与上下文解耦的注意力混合模型(MoA),用于个性化文本到图像的扩散模型。简单来说,Mo...
    图像模型# MoA# 文生图模型
    12个月前
    09890
    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...
    图像模型# MoMA# 个性化图像生成# 文生图模型
    12个月前
    09440
    用于长篇故事视觉化的迭代框架Story-Adapter:根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像

    用于长篇故事视觉化的迭代框架Story-Adapter:根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像

    加州大学圣克鲁斯分校、杭州电子科技大学和新加坡理工学院的研究人员推出一个用于长篇故事视觉化的迭代框架Story-Adapter,Story-Adapter能够根据长篇故事的文字描述生成一系列既连贯又具...
    图像模型# Story-Adapter# 长篇故事视觉化
    12个月前
    09280
    强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息

    强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息

    香港中文大学和思谋科技的研究人员推出强大且高效的图像和视频生成控制方法ControlNeXt,它同时支持图像和视频,并能整合多种形式的控制信息。在这个项目中,我们提出了一种新方法,与 ControlN...
    图像模型# ControlNeXt
    12个月前
    09270
    Neta Lumina 发布:专为二次元创作打造的高品质图像生成模型

    Neta Lumina 发布:专为二次元创作打造的高品质图像生成模型

    由捏Ta实验室(Neta.art)训练的 Neta Lumina 是一款专注于二次元风格的高质量图像生成模型。此模型基于上海人工智能实验室 Alpha-VLLM 团队开源的 Lumina-Image...
    图像模型# Neta Lumina# 二次元
    7个月前
    09150
    SD3-Turbo模型:在四步无指导采样的情况下,生成与最先进的文本到图像生成器相匹配的图像质量

    SD3-Turbo模型:在四步无指导采样的情况下,生成与最先进的文本到图像生成器相匹配的图像质量

    Stability AI还没发布Stable Diffusion 3,就已经发布了SD3-Turbo的技术论文,着重介绍了LADD技术,它是一种用于加速图像合成的新型蒸馏技术。 论文地址 SD3-Tu...
    图像模型# SD3-Turbo# Stability AI# Stable Diffusion 3
    12个月前
    09150
    图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

    图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑

    来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复(inpainting)模型BrushNet,它使用了分解的双分支扩散(diffusion)方法来进行图像内容的恢复和编辑。图像修复...
    图像模型# BrushNet# 图像修复
    12个月前
    09100
    Jasper推出新型蒸馏方法Flash Diffusion:高效、快速、多用途且与LoRA兼容,旨在加速预训练扩散模型图像生成

    Jasper推出新型蒸馏方法Flash Diffusion:高效、快速、多用途且与LoRA兼容,旨在加速预训练扩散模型图像生成

    Jasper推出了一种高效、快速、多用途且与LoRA兼容,旨在加速预训练扩散模型生成的蒸馏方法Flash Diffusion,该方法在COCO 2014和COCO 2017数据集上,针对少量步骤的图像...
    图像模型# Flash Diffusion# Jasper# 蒸馏模型
    12个月前
    08500
    新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强

    新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强

    来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR,专门针对动漫图像和视频的高质量增强。超分辨率技术(Super-Resolution, SR)是一种图像处理技术,旨在从低分辨率的图像中...
    图像模型# APISR# 动漫图像# 超分辨率技术
    12个月前
    08430
    SDXL Turbo: 实时文本到图像生成模型

    SDXL Turbo: 实时文本到图像生成模型

    Stability AI于北京时间2023年11月28日推出了新的开源文生图模型 SDXL Turbo,SDXL Turbo 是在 SDXL 1.0 的基础上采用新的蒸馏方案,让模型只需要一步就可以生...
    图像模型# LCM-XL# SDXL Turbo
    12个月前
    08400
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    CivitAI

    CivitAI

    CivitAI是一个AI图像及视频模型托管平台,主要聚焦于 AI 生成的图像、视频和模型。它为用户提供了一个空间,可以上传、分享和发现由特定数据集训练的自定义 AI 模型,这些模型可用于生成独特的内容,如图像、视频。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单