SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    图像模型

    共 212 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    Ideogram 3.0发布:更真实、更创意、更一致的生成式设计体验

    Ideogram 3.0发布:更真实、更创意、更一致的生成式设计体验

    Ideogram在今天正式发布了其最新模型Ideogram 3.0,这款最新的AI生成模型不仅在图像质量和文本渲染方面取得了重大突破,还通过强大的风格控制功能和高效的设计能力,为创作者和专业人士提供了...
    图像模型# AI绘画# Ideogram# Ideogram 3.0
    9个月前
    04490
    StarVector:利用多模态大语言模型(MLLM)从图像和文本生成SVG代码

    StarVector:利用多模态大语言模型(MLLM)从图像和文本生成SVG代码

    ServiceNow Research、魁北克人工智能研究所、加拿大 CIFAR 人工智能主席、不列颠哥伦比亚大学、高等工程技术学院和苹果的研究人员推出StarVector,利用多模态大语言模型(ML...
    图像模型# StarVector# SVG代码# 多模态大语言模型
    9个月前
    04430
    个性化图像生成和编辑方法SISO:适合在只有单张主题图像的情况下使用

    个性化图像生成和编辑方法SISO:适合在只有单张主题图像的情况下使用

    巴伊兰大学和英伟达的研究人员推出一种无需训练的方法SISO,用于从单张主题图像进行个性化图像生成和编辑。SISO 是一种无需训练的方法,通过优化与输入主题图像的相似度分数来实现图像的个性化生成和编辑...
    图像模型# SISO# 图像生成# 图像编辑
    9个月前
    01990
    URAE:基于 Flux的超高分辨率图像生成的高效解决方案

    URAE:基于 Flux的超高分辨率图像生成的高效解决方案

    在图像生成领域,高分辨率图像的生成一直是一个极具挑战性的问题,尤其是在训练数据和计算资源有限的情况下。新加坡国立大学的研究人员推出了一种名为 URAE(Ultra-Resolution Adaptat...
    图像模型# FLUX# URAE
    9个月前
    03480
    Yandex Research推出分层蒸馏框架SWD:加速扩散模型(如FLUX和SD3.5)的生成过程

    Yandex Research推出分层蒸馏框架SWD:加速扩散模型(如FLUX和SD3.5)的生成过程

    Yandex Research 推出了一种名为 “Scale-wise Distillation of Diffusion Models (SWD)” 的新型框架,通过分层采样策略加速扩散模型(DMs...
    图像模型# FLUX# SD3.5# SWD
    9个月前
    04550
    新型图像编辑框架PhotoDoodle:通过文字提示在照片中添加艺术化装饰

    新型图像编辑框架PhotoDoodle:通过文字提示在照片中添加艺术化装饰

    新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat的研究人员推出新型图像编辑框架PhotoDoodle,通过少量样本学习艺术家的独特风格,将装饰元素(如手绘线条、装饰图案等)无缝叠加到...
    图像模型# PhotoDoodle# 图像编辑框架# 照片涂鸦
    9个月前
    02860
    字节跳动推出新型框架 InfiniteYou (InfU):用于在保留个人身份特征的前提下,通过自由形式的文本描述重新创作照片

    字节跳动推出新型框架 InfiniteYou (InfU):用于在保留个人身份特征的前提下,通过自由形式的文本描述重新创作照片

    字节跳动推出新型框架 InfiniteYou (InfU),用于在保留个人身份特征的前提下,通过自由形式的文本描述重新创作照片。该框架利用先进的扩散变换器(Diffusion Transformers...
    图像模型# InfiniteYou# InfU# 字节跳动
    9个月前
    01820
    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5,这是一款高效的DiT架构模型,通过创新的训练和推理策略,实现文本到图像生成任务中的高...
    图像模型# DiT架构模型# SANA 1.5# 文生图模型
    9个月前
    02900
    Illustrious XL v2.0正式发布,支持1024x1536原生分辨率生成

    Illustrious XL v2.0正式发布,支持1024x1536原生分辨率生成

    在开源AI绘画模型领域,Flux模型是众多衍生开发的基础。然而,在二次元领域,尤其是日式风格方面,情况有所不同。目前,大量用户依然以SDXL模型为基础进行衍生开发。在开源社区中,Pony、Illust...
    图像模型# Illustrious XL v2.0# SDXL# 二次元
    9个月前
    02,3200
    基于神经热场的无混叠任意尺度超分辨率(ASR)方法Thera:实现高质量的图像超分辨率重建

    基于神经热场的无混叠任意尺度超分辨率(ASR)方法Thera:实现高质量的图像超分辨率重建

    苏黎世联邦理工学院和苏黎世大学的研究人员推出一种基于神经热场(Neural Heat Fields)的无混叠任意尺度超分辨率(ASR)方法Thera,该方通过结合神经场(Neural Fields)和...
    图像模型# Thera# 图像放大# 图像高清
    9个月前
    05120
    全新CLIP架构改进方案 CLIP-fine-tune-registers-gated

    全新CLIP架构改进方案 CLIP-fine-tune-registers-gated

    CLIP(对比语言-图像预训练)是 OpenAI 开发的一种多模态模型,通过对比学习在大量图像-文本对上训练,将图像和文本嵌入到同一个共享空间中,便于零样本任务。然而,CLIP 在处理全局信息时存在一...
    图像模型# CLIP# CLIP-fine-tune-registers-gated
    9个月前
    02650
    谷歌开源野生动物识别 AI 模型 SpeciesNet

    谷歌开源野生动物识别 AI 模型 SpeciesNet

    谷歌本周宣布开源野生动物识别 AI 模型 SpeciesNet,帮助动物学家更高效地处理和分析大量野生动物监测影像。这一工具能够显著加快生物多样性监测和保育研究的进程。 SpeciesNet:AI 助...
    图像模型# SpeciesNet# 谷歌# 野生动物
    9个月前
    03710
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ListenHub

    ListenHub

    ListenHub 是一款轻量级、支持中文和英语的 NotebookLM 替代工具,基于前沿AI技术,快速生成你感兴趣的专属播客。无论你想听什么,ListenHub 都能用超真实AI人声为你呈现自然对话。相比 NotebookLM,ListenHub 生成内容更加快速,且支持移动端的流畅体验,让你随时随地探索热门话题、同步收藏、轻松制作和收听播客。
    Invisible Studio

    Invisible Studio

    Invisible Studio 不只是一个 AI 工具集,而是一个为短视频时代量身定制的生产操作系统。它融合了五年社交数据洞察、全球化动画经验与前沿生成式 AI 技术,为企业提供了一种可持续、可扩展、低风险的内容创作路径。
    查看完整榜单