半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO,用于优化和微调扩散模型(如用于生成图像的模型),使其更好地符合人类的审美和偏好,而无需依赖外...新技术# SePPO# 半策略偏好优化# 文生图模型1年前04570
EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了...新技术# EvolveDirector# 文生图模型1年前04460
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性...新技术# SGEdit# 图像编辑# 大语言模型1年前04410
文字处理能力出众!Playground推出最新文生图模型Playground v3Playground 推出了Playground v3(PGv3),这是Playground最新的文本到图像模型,在多个测试基准上达到了最先进的(SoTA)性能,在图形设计能力上表现出色,并引入了新的...图像模型# Playground v3# 文生图模型12个月前04410
韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院11个月前04330
micro_diffusion :一种低成本训练文生图模型的方法索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe...新技术# micro_diffusion# 文生图模型1年前04070
新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用DiT实现了无需训练的空间定位能力,用于在文本到图像生成中实现更精细的用户控制。这项技术特别关注于在图像生成...新技术# GrounDiT# 文生图模型1年前03950
如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中美国东北大学的研究人员发布论文《Distilling Diversity and Control in Diffusion Models》,探讨了如何在保持计算效率的同时,将原始扩散模型的多样性和控制...新技术# 文生图模型# 蒸馏模型11个月前03610
智谱开源首个支持汉字生成的开源文生图模型 CogView4作为中国AI厂商中的开源先锋,智谱AI一直致力于推动技术开放与共享。这家清华系初创企业近年来通过与清华大学合作,开源了多个备受关注的AI模型系列,包括大语言模型GLM系列、文生图模型CogView系列...图像模型# CogView4# 文生图模型# 智谱11个月前03550
腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型腾讯混元项目组正式开源HunyuanImage 2.1,一款支持 2048×2048 超高分辨率(2K)生成的文生图模型。该模型在语义对齐、细节控制与推理效率方面实现显著提升,具备电影级构图能力,并原...图像模型# HunyuanImage 2.1# 文生图模型5个月前03420
文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像现有的文本到图像(T2I)扩散模型虽然在生成高质量图像方面表现出色,但面临着几个关键挑战: 模型尺寸大:许多先进的T2I模型包含数十亿个参数,导致存储和部署成本高昂。 运行时间慢:生成高分辨率图像通常...新技术# SnapGen# 文生图模型1年前03180
SANA模型的升级版SANA 1.5:实现高质量的图像生成,同时显著降低了训练和推理成本英伟达、麻省理工学院、清华大学、Playground和北京大学的研究团队推出了SANA模型的升级版SANA 1.5,这是一款高效的DiT架构模型,通过创新的训练和推理策略,实现文本到图像生成任务中的高...图像模型# DiT架构模型# SANA 1.5# 文生图模型11个月前03130