SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    文生图模型

    共 54 篇文章
    排序
    发布更新浏览点赞
    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    马里兰大学和佛罗里达州立大学推出一种针对文生图模型的新型剪枝方法APTP(Adaptive Prompt-Tailored Pruning,自适应提示定制剪枝),这是一种专门为文生图模型设计的、基于提...
    新技术# APTP# 剪枝方法# 文生图模型
    1年前
    06200
    新型文生图模型CountGen:根据文本提示准确地生成指定数量的对象

    新型文生图模型CountGen:根据文本提示准确地生成指定数量的对象

    巴伊兰大学、英伟达和特拉维夫大学的研究人员推出新型文生图模型CountGen,它能够根据文本提示准确地生成指定数量的对象。在以往的技术中,尽管文本到图像的扩散模型取得了巨大成功,但它们在控制生成图像中...
    新技术# CountGen# 文生图模型
    1年前
    05110
    基准测试CommonsensenT2I:用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力

    基准测试CommonsensenT2I:用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力

    宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I,用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力。简单来说,就是研究这些模型是否能够根据文字描述...
    新技术# CommonsensenT2I# 基准测试# 文生图模型
    1年前
    05520
    文生图模型偏好优化方法MaPO(边界感知偏好优化):让计算机在学习生成图像时,能够更好地符合人类的偏好

    文生图模型偏好优化方法MaPO(边界感知偏好优化):让计算机在学习生成图像时,能够更好地符合人类的偏好

    韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散模型的偏好优化方法,这种方法被称为“边界感知偏好优化”(Margin-aware Preference Opti...
    新技术# MaPO# 文生图模型# 边界感知偏好优化
    2年前
    08280
    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...
    新技术# controlnet# 可控性# 文生图模型
    2年前
    08580
    英伟达推出新型文生图模型BlobGEN:基于blob(斑点)的文本到图像扩散模型

    英伟达推出新型文生图模型BlobGEN:基于blob(斑点)的文本到图像扩散模型

    英伟达推出新型文生图模型BlobGEN,这个模型的核心思想是将场景分解为视觉原语——被称为密集的blob(斑点)表示——这些表示包含了场景的细粒度细节,同时具备模块化、易于理解和构建的特点。例如,一个...
    新技术# BlobGEN# 文生图模型# 英伟达
    2年前
    09660
    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT,它特别擅长理解中文和英文的文本提示,并据此生成图像,Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话,生成并优化图像...
    新技术# Hunyuan-DiT# 提示词# 文生图模型
    2年前
    07240
    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    SDXL-Lightning是由字节跳动发布的一款速度极快的文生图模型,它采用新型扩散模型蒸馏方法,优化扩散模型,能在短时间内高效生成分辨率为1024像素的高品质图像。 模型地址:https://hu...
    新技术# SDXL-Lightning# SDXL1.0# 字节跳动
    2年前
    06150
    ideogram.ai 发布文生图模型Ideogram 1.0:支持生成文字,支持扩展提示词功能Magic Prompt

    ideogram.ai 发布文生图模型Ideogram 1.0:支持生成文字,支持扩展提示词功能Magic Prompt

    ideogram.ai在今天正式推出Ideogram 1.0,这是他们最先进的文本转图像模型。和所有 Ideogram 模型一样,Ideogram 1.0 也是从零开始训练的。它提供了最先进的文本渲染...
    工具# Ideogram 1.0# Magic Prompt# 文生图模型
    2年前
    06690
    EdgeFusion:能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像

    EdgeFusion:能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像

    来自韩国Nota AI和三星电子的研究人员推出EdgeFusion,它能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像。这项技术的核心是优化了文生图模型Stable Diffusion...
    新技术# EdgeFusion# LCM# 文生图模型
    2年前
    06460
    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...
    新技术# attribute-control# 文生图模型# 精细控制
    2年前
    01,0530
    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...
    新技术# SPRIGHT T2I# 文生图模型
    2年前
    09060
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单