SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像生成模型

    共 18 篇文章
    排序
    发布更新浏览点赞
    微软发布首款自研图像生成模型 MAI-Image-1,LMArena 排名进入前十

    微软发布首款自研图像生成模型 MAI-Image-1,LMArena 排名进入前十

    微软 AI 近日宣布推出其首款完全内部研发的文生图模型——MAI-Image-1。该模型已在 AI 基准平台 LMArena 的文生图排行榜中进入前十名,标志着微软在生成式 AI 领域迈出关键一步。 ...
    早报# MAI-Image-1# 图像生成模型# 微软
    4个月前
    0930
    如何让图像生成模型“遗忘”一个概念?东北大学与MIT提出扩散模型概念擦除新方法

    如何让图像生成模型“遗忘”一个概念?东北大学与MIT提出扩散模型概念擦除新方法

    随着图像生成模型(如Stable Diffusion、Flux等)在质量和可控性上的飞速进步,其潜在风险也日益凸显: 生成裸露或暴力内容 模仿特定艺术家风格引发版权争议 复现受保护的商标或人物形象 现...
    新技术# 图像生成模型# 概念擦除
    5个月前
    02070
    阿里 Qwen 项目组发布 Qwen-Image:首个 20B 级 MMDiT 图像生成基础模型

    阿里 Qwen 项目组发布 Qwen-Image:首个 20B 级 MMDiT 图像生成基础模型

    阿里 Qwen 项目组正式推出 Qwen-Image,这是通义千问系列中首个专注于图像生成的基础大模型。基于 20B 参数的 MMDiT(Multimodal Diffusion Transforme...
    图像模型# Qwen-Image# 图像生成模型
    6个月前
    03490
    字节跳动提出的新一代多主体可控图像生成模型XVerse

    字节跳动提出的新一代多主体可控图像生成模型XVerse

    在文本到图像生成领域,如何实现对多个主体身份和语义属性(如姿势、风格、照明)的细粒度控制,同时保持高质量和一致性,一直是一个极具挑战性的问题。 传统方法往往存在以下问题: 在多主体场景中容易引入视觉伪...
    图像模型# XVerse# 图像生成模型
    7个月前
    03610
    Soul AI推出新型推出新型图像生成模型 TransDiff :将自回归(AR)Transformer 和扩散模型相结合,用于高质量的图像生成

    Soul AI推出新型推出新型图像生成模型 TransDiff :将自回归(AR)Transformer 和扩散模型相结合,用于高质量的图像生成

    Soul AI推出新型图像生成模型 TransDiff ,该模型将自回归(AR)Transformer 和扩散模型相结合,用于高质量的图像生成。TransDiff 通过将输入编码为高级语义特征,并利用...
    图像模型# TransDiff# 图像生成模型
    7个月前
    02420
    Freepik 推出基于商业授权图像训练的 AI 图像生成模型 F Lite

    Freepik 推出基于商业授权图像训练的 AI 图像生成模型 F Lite

    在线图形设计平台 Freepik 于周二宣布推出一款新的开源图像生成模型——F Lite。这款模型完全基于商业授权的、“适合工作场所(SFW)”的图像进行训练,为用户提供安全、合法且高质量的图像生成服...
    图像模型# F Lite# Freepik# 图像生成模型
    9个月前
    02340
    Science-T2I框架:通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性

    Science-T2I框架:通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性

    纽约大学、华盛顿大学、宾夕法尼亚大学和 加州大学圣地亚哥分校介绍了一个名为 Science-T2I 的框架,旨在通过整合科学知识,提升图像合成模型生成图像的现实感和科学一致性。该研究的核心是解决现有图...
    图像模型# Science-T2I# 图像生成模型# 科学
    9个月前
    03070
    基于蒸馏的多功能图像生成模型DMM:通过蒸馏模型合并技术实现多功能图像生成

    基于蒸馏的多功能图像生成模型DMM:通过蒸馏模型合并技术实现多功能图像生成

    在文本到图像(Text-to-Image, T2I)生成领域,开发者通常会基于强大的基础模型(如Stable Diffusion 1.5)进行微调,以适应特定风格或场景的需求。例如,某些模型专注于生成...
    图像模型# DMM# 图像生成模型# 蒸馏模型
    10个月前
    02470
    基于像素空间流的图像生成模型PixelFlow:根据给定的文本描述生成高质量、语义一致的图像

    基于像素空间流的图像生成模型PixelFlow:根据给定的文本描述生成高质量、语义一致的图像

    香港大学和Adobe的研究人员推出基于像素空间流的图像生成模型PixelFlow,它直接在像素空间中进行操作,与传统的基于潜在空间(latent space)的模型不同。PixelFlow通过高效的级...
    图像模型# PixelFlow# 图像生成模型
    10个月前
    01940
    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    北京智象未来科技开源了一款全新的图像生成基础模型HiDream-I1,其拥有 170 亿个参数,能够在几秒内实现顶尖的图像生成效果。这一模型提供了三种变体:Full、Dev 和 Fast,以满足不同用...
    图像模型# HiDream-I1# 图像生成模型# 智象未来
    10个月前
    05280
    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...
    新技术# IMM# Luma AI# 图像生成模型
    11个月前
    04080
    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 发布其首个文本到图像生成模型 Image-01

    MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01,标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能,还为全球用户带来了极具创意和...
    早报# Image-01# MiniMax# 图像生成模型
    11个月前
    04600
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单