用文生图的新型规模感知变换器SWITTI:基于现有的下一代规模预测自回归(AR)模型Yandex Research、俄罗斯国立研究型大学高等经济学院、莫斯科物理技术学院和Skoltech科大的研究人员推出新型规模感知变换器SWITTI,它用于文本到图像的合成。SWITTI基于现有的下...图像模型# AR模型# SWITTI10个月前03570
新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...图像模型# Ranni# 文生图模型10个月前07340
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...图像模型# MoMA# 个性化图像生成# 文生图模型10个月前09360
新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ...图像模型# YaART# 文生图模型10个月前05500
图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...图像模型# ByteEdit# 图像编辑框架10个月前01,0010
创新图像生成框架BeyondScene:能够生成高分辨率(超过8K)、以人为中心的场景图像来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene,它能够生成高分辨率(超过8K)、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景,即使这些场景的描述超出...图像模型# BeyondScene# 图像生成框架# 高分辨率10个月前06560
新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO,它专门用于调整文生图模型,使其生成的图像更符合人类的偏好。这个过程不...图像模型# Diffusion-KTO# 文生图模型10个月前06360
个性化视觉编辑框架SwapAnything:可以在保持上下文不变的情况下,用参考提供的个性化概念替换图像中的任何物体来自加州大学圣克鲁斯分校和Adobe的研究人员推出个性化视觉编辑框架SwapAnything,它可以在保持上下文不变的情况下,用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...图像模型# SwapAnything# 个性化视觉编辑10个月前05110
新型文生图架构Diffusion-RWKV:基于RWKV模型,为改进图像生成任务而设计昆仑万维推出新型文生图架构Diffusion-RWKV,它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型,这是一种在自然语言处理(NLP)领域中使用的模型,但经过了特别的修改,使其更适合处...图像模型# Diffusion-RWKV# RWKV模型# 文生图架构10个月前04830
统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL,它通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能。UniFL作为一种通用、高...图像模型# Stable Diffusion# UniFL10个月前07400
新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR,专门针对动漫图像和视频的高质量增强。超分辨率技术(Super-Resolution, SR)是一种图像处理技术,旨在从低分辨率的图像中...图像模型# APISR# 动漫图像# 超分辨率技术10个月前08360
高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的...图像模型# Ctrl-Adapter# 空间控制# 视频生成模型10个月前08350