SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    文生图模型

    共 55 篇文章
    排序
    发布更新浏览点赞
    阿里发布文生图模型Qwen-Image-2512:人像、纹理、文字渲染显著提升

    阿里发布文生图模型Qwen-Image-2512:人像、纹理、文字渲染显著提升

    2025 年 12 月 31 日,阿里 Qwen 项目组发布了 Qwen-Image-2512 —— Qwen-Image 文生图基础模型的最新版本。这是继今年 8 月首次开源 Qwen-Image ...
    图像模型# Qwen-Image-2512# 文生图模型
    4周前
    0310
    阿里开源Ovis-Image:7B 参数实现高质量文本渲染的文生图模型,海报 / UI 设计秒生成

    阿里开源Ovis-Image:7B 参数实现高质量文本渲染的文生图模型,海报 / UI 设计秒生成

    Ovis-Image 是由阿里巴巴国际数字商务团队开发的 70亿参数 文本到图像(Text-to-Image)生成模型,专注于解决文生图系统中长期存在的文本模糊、拼写错误、排版失真等痛点。该模型在保持...
    图像模型# Ovis-Image# 文生图模型
    2个月前
    02210
    BRIA 发布 FIBO:用 JSON 精确控制光线、构图与相机参数的文生图模型

    BRIA 发布 FIBO:用 JSON 精确控制光线、构图与相机参数的文生图模型

    BRIA 开源发布了其首个文本到图像模型 FIBO —— 一个专为专业图像生成工作流设计的 JSON 原生、结构化提示驱动 的开源模型。与主流强调“想象力”的生成模型不同,FIBO 的核心目标是 可控...
    图像模型# BRIA# FIBO# 文生图模型
    3个月前
    0710
    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    在文生图领域,高分辨率输出(如 4K)正成为标配。然而,随之而来的计算成本和推理延迟问题日益凸显——以当前领先的 FLUX.1-Krea-12B 模型为例,在英伟达H100 GPU 上生成一张 4K ...
    图像模型# DC-Gen# 文生图模型# 英伟达
    4个月前
    02430
    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元项目组正式开源HunyuanImage 2.1,一款支持 2048×2048 超高分辨率(2K)生成的文生图模型。该模型在语义对齐、细节控制与推理效率方面实现显著提升,具备电影级构图能力,并原...
    图像模型# HunyuanImage 2.1# 文生图模型
    5个月前
    03420
    复旦等团队联合突破文生图模型生成瓶颈:Pref-GRPO解决奖励操控,UniGenBench补上评估短板

    复旦等团队联合突破文生图模型生成瓶颈:Pref-GRPO解决奖励操控,UniGenBench补上评估短板

    文本到图像(T2I)生成技术的进步,离不开强化学习方法的优化与基准测试的支撑。但当前领域存在两大核心问题:一是传统强化学习依赖“点式奖励模型”打分,易出现“分数涨而质量降”的奖励操控现象;二是现有基准...
    图像模型# Pref-GRPO# 文生图模型
    5个月前
    02940
    Flex.2-preview:基于 Flux.1 Schnell 微调而成的开源 80 亿参数文生图模型

    Flex.2-preview:基于 Flux.1 Schnell 微调而成的开源 80 亿参数文生图模型

    Flex.2-preview 是一款开源的文本到图像扩散模型,具有 80 亿参数,支持通用控制和图像修复功能。它基于 Flux.1 Schnell 微调而成,旨在为用户提供更灵活、更强大的图像生成能力...
    图像模型# Flex.2-preview# FLUX.1 [schnell]# 文生图模型
    9个月前
    06630
    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite:提高模型的参数效率和生成性能

    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite:提高模型的参数效率和生成性能

    苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite,旨在提高模型的参数效率和生成性能。其论文主要研究了扩散模型(Diffusion Models)在文本到图像生成任务中的架构设计、文...
    新技术# DiT-Air# DiT-Air-Lite# 文生图模型
    11个月前
    05970
    如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中

    如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中

    美国东北大学的研究人员发布论文《Distilling Diversity and Control in Diffusion Models》,探讨了如何在保持计算效率的同时,将原始扩散模型的多样性和控制...
    新技术# 文生图模型# 蒸馏模型
    11个月前
    03610
    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...
    新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院
    11个月前
    04330
    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本

    英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5,这是一款高效的DiT架构模型,通过创新的训练和推理策略,实现文本到图像生成任务中的高...
    图像模型# DiT架构模型# SANA 1.5# 文生图模型
    11个月前
    03130
    智谱开源首个支持汉字生成的开源文生图模型 CogView4

    智谱开源首个支持汉字生成的开源文生图模型 CogView4

    作为中国AI厂商中的开源先锋,智谱AI一直致力于推动技术开放与共享。这家清华系初创企业近年来通过与清华大学合作,开源了多个备受关注的AI模型系列,包括大语言模型GLM系列、文生图模型CogView系列...
    图像模型# CogView4# 文生图模型# 智谱
    11个月前
    03550
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    火宝短剧(Huobao Drama)

    火宝短剧(Huobao Drama)

    火宝短剧是一个基于AI的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    查看完整榜单