SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    文生图模型

    共 55 篇文章
    排序
    发布更新浏览点赞
    阿里发布文生图模型Qwen-Image-2512:人像、纹理、文字渲染显著提升

    阿里发布文生图模型Qwen-Image-2512:人像、纹理、文字渲染显著提升

    2025 年 12 月 31 日,阿里 Qwen 项目组发布了 Qwen-Image-2512 —— Qwen-Image 文生图基础模型的最新版本。这是继今年 8 月首次开源 Qwen-Image ...
    图像模型# Qwen-Image-2512# 文生图模型
    2个月前
    0390
    阿里开源Ovis-Image:7B 参数实现高质量文本渲染的文生图模型,海报 / UI 设计秒生成

    阿里开源Ovis-Image:7B 参数实现高质量文本渲染的文生图模型,海报 / UI 设计秒生成

    Ovis-Image 是由阿里巴巴国际数字商务团队开发的 70亿参数 文本到图像(Text-to-Image)生成模型,专注于解决文生图系统中长期存在的文本模糊、拼写错误、排版失真等痛点。该模型在保持...
    图像模型# Ovis-Image# 文生图模型
    3个月前
    02380
    BRIA 发布 FIBO:用 JSON 精确控制光线、构图与相机参数的文生图模型

    BRIA 发布 FIBO:用 JSON 精确控制光线、构图与相机参数的文生图模型

    BRIA 开源发布了其首个文本到图像模型 FIBO —— 一个专为专业图像生成工作流设计的 JSON 原生、结构化提示驱动 的开源模型。与主流强调“想象力”的生成模型不同,FIBO 的核心目标是 可控...
    图像模型# BRIA# FIBO# 文生图模型
    4个月前
    0990
    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    在文生图领域,高分辨率输出(如 4K)正成为标配。然而,随之而来的计算成本和推理延迟问题日益凸显——以当前领先的 FLUX.1-Krea-12B 模型为例,在英伟达H100 GPU 上生成一张 4K ...
    图像模型# DC-Gen# 文生图模型# 英伟达
    5个月前
    03180
    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元项目组正式开源HunyuanImage 2.1,一款支持 2048×2048 超高分辨率(2K)生成的文生图模型。该模型在语义对齐、细节控制与推理效率方面实现显著提升,具备电影级构图能力,并原...
    图像模型# HunyuanImage 2.1# 文生图模型
    6个月前
    04230
    复旦等团队联合突破文生图模型生成瓶颈:Pref-GRPO解决奖励操控,UniGenBench补上评估短板

    复旦等团队联合突破文生图模型生成瓶颈:Pref-GRPO解决奖励操控,UniGenBench补上评估短板

    文本到图像(T2I)生成技术的进步,离不开强化学习方法的优化与基准测试的支撑。但当前领域存在两大核心问题:一是传统强化学习依赖“点式奖励模型”打分,易出现“分数涨而质量降”的奖励操控现象;二是现有基准...
    图像模型# Pref-GRPO# 文生图模型
    6个月前
    03260
    Flex.2-preview:基于 Flux.1 Schnell 微调而成的开源 80 亿参数文生图模型

    Flex.2-preview:基于 Flux.1 Schnell 微调而成的开源 80 亿参数文生图模型

    Flex.2-preview 是一款开源的文本到图像扩散模型,具有 80 亿参数,支持通用控制和图像修复功能。它基于 Flux.1 Schnell 微调而成,旨在为用户提供更灵活、更强大的图像生成能力...
    图像模型# Flex.2-preview# FLUX.1 [schnell]# 文生图模型
    11个月前
    07200
    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite:提高模型的参数效率和生成性能

    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite:提高模型的参数效率和生成性能

    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite,旨在提高模型的参数效率和生成性能。其论文主要研究了扩散模型(Diffusion Models)在文本到图像生成任务中的架构设计、文...
    新技术# DiT-Air# DiT-Air-Lite# 文生图模型
    12个月前
    06830
    如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中

    如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中

    美国东北大学的研究人员发布论文《Distilling Diversity and Control in Diffusion Models》,探讨了如何在保持计算效率的同时,将原始扩散模型的多样性和控制...
    新技术# 文生图模型# 蒸馏模型
    12个月前
    04310
    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...
    新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院
    12个月前
    04590
    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5,这是一款高效的DiT架构模型,通过创新的训练和推理策略,实现文本到图像生成任务中的高...
    图像模型# DiT架构模型# SANA 1.5# 文生图模型
    12个月前
    03260
    智谱开源首个支持汉字生成的开源文生图模型 CogView4

    智谱开源首个支持汉字生成的开源文生图模型 CogView4

    作为中国AI厂商中的开源先锋,智谱AI一直致力于推动技术开放与共享。这家清华系初创企业近年来通过与清华大学合作,开源了多个备受关注的AI模型系列,包括大语言模型GLM系列、文生图模型CogView系列...
    图像模型# CogView4# 文生图模型# 智谱
    1年前
    03560
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    QClaw

    新QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    纳米漫剧流水线

    纳米漫剧流水线

    国内首个工业级 AI 漫剧智能体生产平台 ——“纳米漫剧流水线” 启动公开测试。该平台面向漫剧工作室、视频制作机构与专业创作者,直击行业 “效率与品质难以兼顾” 的长期痛点,以高效量产、品质可控、风格统一为核心,正式开启 AI 漫剧工业化生产新时代。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    Cutia

    Cutia

    Cutia 是一个开源、基于浏览器的视频编辑工具,旨在成为 CapCut 的最佳替代品。它坚持“本地优先”的理念,让你无需安装任何重型软件,只需打开浏览器,即可享受专业级的多轨道剪辑体验,且全程无订阅、无追踪、无水印。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    查看完整榜单