EdgeFusion:能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像 来自韩国Nota AI和三星电子的研究人员推出EdgeFusion,它能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像。这项技术的核心是优化了文生图模型Stable Diffusion,... 新技术# EdgeFusion# LCM# 文生图模型 11个月前03910
ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程 中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制... 新技术# controlnet# 可控性# 文生图模型 9个月前05400
新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好 加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO,它专门用于调整文生图模型,使其生成的图像更符合人类的偏好。这个过程不... 图像模型# Diffusion-KTO# 文生图模型 1个月前04590
新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐 来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ... 图像模型# YaART# 文生图模型 1个月前03340
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成 来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化... 图像模型# MoMA# 个性化图像生成# 文生图模型 1个月前06610
新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示 阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更... 图像模型# Ranni# 文生图模型 1个月前03490
新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性 来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并... 图像模型# CoMat# 文生图模型 1个月前06250
attribute-control:对文生图模型生成的图像中的特定属性进行精细控制 来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t... 新技术# attribute-control# 文生图模型# 精细控制 11个月前07600
CosmicMan:专注于生成高保真人类图像的文生图基础模型 上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http... 图像模型# CosmicMan# 文生图模型 1个月前06630
SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力 来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性... 新技术# SPRIGHT T2I# 文生图模型 12个月前07240
Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性 Meta推出新型框架OPT2I,它旨在通过优化文本提示(prompt)来提高文本到图像(T2I)生成模型的图像与输入提示的一致性。尽管现有的T2I模型能够生成高质量和逼真的图像,但它们在确保生成的图像... 新技术# OPT2I# 提示词# 文生图模型 12个月前04920
Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战 来自特拉维夫大学和Snap的研究人员推出Bounded Attention,它旨在解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战。这些模型通常难以准确地捕捉到复杂输入提示中的意... 新技术# Bounded Attention# 多主题# 文生图模型 12个月前03500