创新图像生成框架BeyondScene:能够生成高分辨率(超过8K)、以人为中心的场景图像来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene,它能够生成高分辨率(超过8K)、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景,即使这些场景的描述超出...图像模型# BeyondScene# 图像生成框架# 高分辨率1年前06690
图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...图像模型# ByteEdit# 图像编辑框架1年前01,1270
新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ...图像模型# YaART# 文生图模型1年前05720
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...图像模型# MoMA# 个性化图像生成# 文生图模型1年前09460
新型文生图框架Ranni:利于大语言模型,更准确地理解和执行复杂的文本提示阿里巴巴和蚂蚁集团推出新型文生图框架Ranni,Ranni的核心特点是它能够更准确地理解和执行复杂的文本提示,尤其是那些包含数量描述、对象属性绑定和多主题描述的提示。这使得Ranni在生成图像时能够更...图像模型# Ranni# 文生图模型1年前08200
新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并...图像模型# CoMat# 文生图模型1年前01,1120
CosmicMan:专注于生成高保真人类图像的文生图基础模型上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http...图像模型# CosmicMan# 文生图模型1年前01,0570
图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复(inpainting)模型BrushNet,它使用了分解的双分支扩散(diffusion)方法来进行图像内容的恢复和编辑。图像修复...图像模型# BrushNet# 图像修复1年前09480
IDAdapter:根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调来自北京大学、InsightFace和格灵深瞳推出IDAdapter,它能够根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调。 论文 IDAdapter通...图像模型# IDAdapter# 个性化图像1年前06470
SD3-Turbo模型:在四步无指导采样的情况下,生成与最先进的文本到图像生成器相匹配的图像质量Stability AI还没发布Stable Diffusion 3,就已经发布了SD3-Turbo的技术论文,着重介绍了LADD技术,它是一种用于加速图像合成的新型蒸馏技术。 论文地址 SD3-Tu...图像模型# SD3-Turbo# Stability AI# Stable Diffusion 31年前09280
海贼王漫画风格LoRA模型:One Piece Manga StyleOne Piece Manga Style是一款基于 PONYDIFFUSION XL训练的LoRA模型,此LoRA需要搭配Pony Diffusion模型才能出好图,在书写提示词的时候需要添加触发词...图像模型# LoRA模型# 海贼王1年前07040
华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta...图像模型# DiT# PIXART-Σ# 文生图模型1年前01,0300