SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像生成模型

    共 18 篇文章
    排序
    发布更新浏览点赞
    新型图像生成模型Hourglass Diffusion Transformer(HDiT)

    新型图像生成模型Hourglass Diffusion Transformer(HDiT)

    Stability AI、慕尼黑大学和Birchlabs的开发人员提出了一种名为Hourglass Diffusion Transformer(HDiT)的新型图像生成模型,该模型在保持高分辨率图像合...
    新技术# HDiT# Stability AI# 图像生成模型
    2年前
    09970
    新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像

    新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像

    FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架构,旨在生成具有无限制分辨率和长宽比的图像。 GitHub 论文 模型 传统的图像生...
    新技术# FiT# Transformer# 图像生成模型
    2年前
    08230
    基于Transformer架构的新型图像生成模型DART:根据文本描述生成高质量的图像

    基于Transformer架构的新型图像生成模型DART:根据文本描述生成高质量的图像

    苹果和香港中文大学的研究人员推出新型图像生成模型DART,这个模型的目标是让计算机能够根据文本描述生成高质量的图像。DART是一个基于Transformer架构的模型,它在非马尔可夫框架内统一了自回归...
    新技术# DART# Transformer架构# 图像生成模型
    1年前
    06850
    谷歌旗下最新图像生成模型Imagen2,已在Bard和ImageFX上线

    谷歌旗下最新图像生成模型Imagen2,已在Bard和ImageFX上线

    无论是制作音乐、获取编程帮助还是创建图像,像Lyria、Codey和Imagen这样的基于任务的AI模型正在帮助人们将创意变为现实。 自从去年推出以来,我们的Imagen技术已经帮助人们和企业仅使用几...
    工具# Bard# ImageFX# Imagen2
    1年前
    05560
    苹果推出新型图像生成模型Kaleido Diffusion:通过整合自回归的潜在先验来增强采样的图像多样性

    苹果推出新型图像生成模型Kaleido Diffusion:通过整合自回归的潜在先验来增强采样的图像多样性

    苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型旨在通过自回归潜在模型(autoregressive latent modeling)提高扩散模型(dif...
    新技术# Kaleido Diffusion# 图像生成模型# 苹果
    2年前
    05530
    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    北京智象未来科技开源了一款全新的图像生成基础模型HiDream-I1,其拥有 170 亿个参数,能够在几秒内实现顶尖的图像生成效果。这一模型提供了三种变体:Full、Dev 和 Fast,以满足不同用...
    图像模型# HiDream-I1# 图像生成模型# 智象未来
    10个月前
    05280
    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01,标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能,还为全球用户带来了极具创意和...
    早报# Image-01# MiniMax# 图像生成模型
    11个月前
    04600
    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen,与流行的扩散模型(例如,Stable Diffusion)不同,OmniGen不再需要额外的模块,如ControlNet或IP-Adapter来处...
    新技术# OmniGen# 图像生成模型
    1年前
    04470
    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...
    新技术# IMM# Luma AI# 图像生成模型
    11个月前
    04080
    字节跳动提出的新一代多主体可控图像生成模型XVerse

    字节跳动提出的新一代多主体可控图像生成模型XVerse

    在文本到图像生成领域,如何实现对多个主体身份和语义属性(如姿势、风格、照明)的细粒度控制,同时保持高质量和一致性,一直是一个极具挑战性的问题。 传统方法往往存在以下问题: 在多主体场景中容易引入视觉伪...
    图像模型# XVerse# 图像生成模型
    7个月前
    03610
    阿里 Qwen 项目组发布 Qwen-Image:首个 20B 级 MMDiT 图像生成基础模型

    阿里 Qwen 项目组发布 Qwen-Image:首个 20B 级 MMDiT 图像生成基础模型

    阿里 Qwen 项目组正式推出 Qwen-Image,这是通义千问系列中首个专注于图像生成的基础大模型。基于 20B 参数的 MMDiT(Multimodal Diffusion Transforme...
    图像模型# Qwen-Image# 图像生成模型
    6个月前
    03490
    Science-T2I框架:通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性

    Science-T2I框架:通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性

    纽约大学、华盛顿大学、宾夕法尼亚大学和 加州大学圣地亚哥分校介绍了一个名为 Science-T2I 的框架,旨在通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性。该研究的核心是解决现有图...
    图像模型# Science-T2I# 图像生成模型# 科学
    9个月前
    03070
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单