新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示 阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更... 图像模型# Ranni# 文生图模型 2周前03380
人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好 俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO,它用于改善文本到图像的扩散模型(Diffusion Models),使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型,它们通过逐步去... 新技术# NCPPO# 人类偏好# 文生图模型 8个月前03370
新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐 来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ... 图像模型# YaART# 文生图模型 2周前03230
针对文生图模型的一次性个性化定制技术TextBoost:使用单个参考图像,通过微调文本编码器,来生成与文本提示相匹配的定制化图像 韩国科学技术院推出一种针对文本到图像模型的一次性个性化定制技术TextBoost,这种方法使用单个参考图像,通过微调文本编码器,来生成与文本提示相匹配的定制化图像。例如,你想要通过一段描述来生成一张图... 新技术# TextBoost# 个性化定制# 文生图模型 5个月前03150
新型文生图模型CountGen:根据文本提示准确地生成指定数量的对象 巴伊兰大学、英伟达和特拉维夫大学的研究人员推出新型文生图模型CountGen,它能够根据文本提示准确地生成指定数量的对象。在以往的技术中,尽管文本到图像的扩散模型取得了巨大成功,但它们在控制生成图像中... 新技术# CountGen# 文生图模型 8个月前03040
LongAlign:改进文生图模型的长文本对齐 文生图模型的快速发展使它们能够从给定的文本生成前所未有的结果。然而,随着文本输入变长,现有的编码方法如 CLIP 面临限制,并且将生成的图像与长文本对齐变得具有挑战性。为了解决这些问题,香港大学、新加... 新技术# LongAlign# 文生图模型# 长文本对齐 4个月前02850
Fluid: 基于连续令牌和随机顺序生成的文生图模型 在视觉领域,自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探索这一问题,Google DeepMind 和麻省理工学院的研究人员进行了一项研究,重点探讨了两个关键因素:模型是使用离散还... 新技术# Fluid:# 文生图模型 4个月前02530
半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好 罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO,用于优化和微调扩散模型(如用于生成图像的模型),使其更好地符合人类的审美和偏好,而无需依赖外... 新技术# SePPO# 半策略偏好优化# 文生图模型 5个月前02340
苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程 大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题,研究人员提出了通过引导模型激活来控制模型生成的方法,... 新技术# ACT# 大语言模型# 文生图模型 4个月前02230
EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型 近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了... 新技术# EvolveDirector# 文生图模型 4个月前02150
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑 场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性... 新技术# SGEdit# 图像编辑# 大语言模型 4个月前02100
文字处理能力出众!Playground推出最新文生图模型Playground v3 Playground 推出了Playground v3(PGv3),这是Playground最新的文本到图像模型,在多个测试基准上达到了最先进的(SoTA)性能,在图形设计能力上表现出色,并引入了新的... 图像模型# Playground v3# 文生图模型 2周前02090