SliderSpace:自动分解文生图模型的视觉能力,将其转化为简单的滑块控件,使用户能够更直观地控制生成结果 扩散模型(Diffusion Models)在生成高质量图像方面表现出色,但其生成过程的黑箱性质限制了用户的控制能力。为了增强扩散模型的可控性和可解释性,来自美国东北大学和 Adobe Researc... 图像模型# Adobe Research# SliderSpace# 东北大学 1天前030
micro_diffusion :一种低成本训练文生图模型的方法 索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe... 新技术# micro_diffusion# 文生图模型 1个月前0900
文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像 现有的文本到图像(T2I)扩散模型虽然在生成高质量图像方面表现出色,但面临着几个关键挑战: 模型尺寸大:许多先进的T2I模型包含数十亿个参数,导致存储和部署成本高昂。 运行时间慢:生成高分辨率图像通常... 新技术# SnapGen# 文生图模型 2个月前01170
文本到图像模型的数据归因:识别在生成新图像过程中最具影响力的训练图像 卡内基梅隆大学、Adobe 研究和加州大学伯克利分校的研究人员发布论文,论文的主题是关于文本到图像模型的数据归因(Data Attribution for Text-to-Image Models... 新技术# 文生图模型 3个月前0990
SWITTI:用于文本到图像合成的新型规模感知变换器模型 Yandex Research、HSE 大学、MIPT 和 Skoltech 的研究人员提出了 Switti,这是一个专门设计用于文本到图像(T2I)生成的尺度变换器。Switti 从现有的下一尺度预... 图像模型# SWITTI# 文生图模型 2周前0970
Collov Labs推出非自回归掩码图像建模的文本到图像合成模型Monetico Collov Labs 最近在8块H100 GPU上训练了一周时间,推出了新的非自回归掩码图像建模的文本到图像合成模型——Monetico。这款模型能够生成高分辨率图像,并且被设计为在消费级显卡上高效... 图像模型# Monetico# 文生图模型 2周前02010
苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程 大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题,研究人员提出了通过引导模型激活来控制模型生成的方法,... 新技术# ACT# 大语言模型# 文生图模型 4个月前02200
新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制 韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用DiT实现了无需训练的空间定位能力,用于在文本到图像生成中实现更精细的用户控制。这项技术特别关注于在图像生成... 新技术# GrounDiT# 文生图模型 4个月前01810
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑 场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性... 新技术# SGEdit# 图像编辑# 大语言模型 4个月前02090
文字处理能力出众!Playground推出最新文生图模型Playground v3 Playground 推出了Playground v3(PGv3),这是Playground最新的文本到图像模型,在多个测试基准上达到了最先进的(SoTA)性能,在图形设计能力上表现出色,并引入了新的... 图像模型# Playground v3# 文生图模型 2周前02070
EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型 近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了... 新技术# EvolveDirector# 文生图模型 4个月前02130
LongAlign:改进文生图模型的长文本对齐 文生图模型的快速发展使它们能够从给定的文本生成前所未有的结果。然而,随着文本输入变长,现有的编码方法如 CLIP 面临限制,并且将生成的图像与长文本对齐变得具有挑战性。为了解决这些问题,香港大学、新加... 新技术# LongAlign# 文生图模型# 长文本对齐 4个月前02840