基于Mamba架构的自回归(AR)图像生成模型AiM:实现高质量和高效率的图像生成,同时保持推理速度的优势北京邮电大学、中国科学院大学、香港理工大学和中国科学院自动化研究所的研究人员推出自回归(autoregressive, AR)图像生成模型AiM,它基于Mamba架构构建。AiM模型的目的是实现高质量...图像模型# AiM# Mamba架构10个月前06920
海贼王漫画风格LoRA模型:One Piece Manga StyleOne Piece Manga Style是一款基于 PONYDIFFUSION XL训练的LoRA模型,此LoRA需要搭配Pony Diffusion模型才能出好图,在书写提示词的时候需要添加触发词...图像模型# LoRA模型# 海贼王10个月前06710
创新图像生成框架BeyondScene:能够生成高分辨率(超过8K)、以人为中心的场景图像来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene,它能够生成高分辨率(超过8K)、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景,即使这些场景的描述超出...图像模型# BeyondScene# 图像生成框架# 高分辨率10个月前06540
图像恢复算法PMRF:改善从损坏的图像中恢复出高质量、逼真图像以色列理工学院的研究人员推出图像恢复算法PMRF(Posterior-Mean Rectified Flow,后验均值校正流),这个算法的目标是改善从损坏的图像中恢复出高质量、逼真图像的方法。具体来说...图像模型# PMRF# 图像恢复算法10个月前06400
日本团队推出浮世绘风格专用生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie日本AI团队Sakana AI发布了专门用于生成浮世绘风格的生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie,此模型是是以转为日语打造的图像生成模型Evo-SDXL-JP为基础,通...图像模型# Evo-Nishikie# Evo-Ukiyoe# 浮世绘10个月前06390
Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病,虽然后来更改了许可证,但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...图像模型# AuraFlow# DiT模型# Fal.ai10个月前06380
Stability AI推出Stable Diffusion 3Stability AI推出Stable Diffusion 3模型的早期预览版本,这是我们迄今为止功能最为强大的文生图模型,在处理多主题提示、图像质量和拼写能力方面都有显著的提升。 Prompt: ...图像模型# Stability AI# Stable Diffusion 310个月前06340
IDAdapter:根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调来自北京大学、InsightFace和格灵深瞳推出IDAdapter,它能够根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调。 论文 IDAdapter通...图像模型# IDAdapter# 个性化图像10个月前06320
新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO,它专门用于调整文生图模型,使其生成的图像更符合人类的偏好。这个过程不...图像模型# Diffusion-KTO# 文生图模型10个月前06310
字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能字节跳动近日推出了UNO,这是一个强大的通用框架,能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力,还能将多样化的任务统一在一个模型之下,为图像生成领域带来了新的突破。 项目主页...图像模型# FLUX# UNO# 字节跳动8个月前06170
欧美漫画及插画风格SDXL模型:CHEYENNE_CHEYENNE_是一款专门针对欧美漫画及插画风格生成的SDXL模型。不论你是专业插画家、漫画家,还是热衷于视觉艺术表达的爱好者,CHEYENNE都将为你的创意世界打开全新维度! 模型下载地址 CH...图像模型# CHEYENNE# SDXL模型# 插画10个月前05980
智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ,CogView3 是一个基于级联扩散的文本生成图像系统,采用了接力扩散(relay diffusio...图像模型# CogView-3Plus# CogView3# 图像生成10个月前05840