SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    文生图模型

    共 55 篇文章
    排序
    发布更新浏览点赞
    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...
    新技术# controlnet# 可控性# 文生图模型
    2年前
    08850
    新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好

    新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好

    加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO,它专门用于调整文生图模型,使其生成的图像更符合人类的偏好。这个过程不...
    图像模型# Diffusion-KTO# 文生图模型
    12个月前
    06480
    新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐

    新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐

    来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ...
    图像模型# YaART# 文生图模型
    12个月前
    05690
    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...
    图像模型# MoMA# 个性化图像生成# 文生图模型
    12个月前
    09440
    新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示

    新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示

    阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...
    图像模型# Ranni# 文生图模型
    12个月前
    07810
    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并...
    图像模型# CoMat# 文生图模型
    12个月前
    01,0620
    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...
    新技术# attribute-control# 文生图模型# 精细控制
    2年前
    01,0710
    CosmicMan:专注于生成高保真人类图像的文生图基础模型

    CosmicMan:专注于生成高保真人类图像的文生图基础模型

    上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http...
    图像模型# CosmicMan# 文生图模型
    12个月前
    01,0080
    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...
    新技术# SPRIGHT T2I# 文生图模型
    2年前
    09190
    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I,它旨在通过优化文本提示(prompt)来提高文本到图像(T2I)生成模型的图像与输入提示的一致性。尽管现有的T2I模型能够生成高质量和逼真的图像,但它们在确保生成的图像...
    新技术# OPT2I# 提示词# 文生图模型
    2年前
    07420
    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    来自特拉维夫大学和Snap的研究人员推出Bounded Attention,它旨在解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战。这些模型通常难以准确地捕捉到复杂输入提示中的意...
    新技术# Bounded Attention# 多主题# 文生图模型
    2年前
    05680
    VideoElevator:利用文生图模型来增强文生视频的质量和细节

    VideoElevator:利用文生图模型来增强文生视频的质量和细节

    来自哈尔滨大学和清华大学的研究团队推出VideoElevator,利用文生图模型来增强文生视频的质量和细节,这个过程是无需训练的,可以直接插入现有的模型中使用,还能利用文生图模型来实现风格迁移,非常方...
    新技术# VideoElevator# 文生图模型# 文生视频
    2年前
    06400
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单