人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成 阿里巴巴集团智能计算研究院推出人像个性化框架UniPortrait,支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成。简单来说,UniPortrait能够根据用户提供的文本... 图像模型# UniPortrait# 人像个性化 2周前04350
基于Mamba架构的自回归(AR)图像生成模型AiM:实现高质量和高效率的图像生成,同时保持推理速度的优势 北京邮电大学、中国科学院大学、香港理工大学和中国科学院自动化研究所的研究人员推出自回归(autoregressive, AR)图像生成模型AiM,它基于Mamba架构构建。AiM模型的目的是实现高质量... 图像模型# AiM# Mamba架构 2周前05020
Playground推出Playground v3:不仅在图形设计方面表现出色,还引入了一些新的能力,比如精确的RGB颜色控制和强大的多语言理解能力 Playground上线了Playground v3 beta版本,同时还发布了技术报告,与传统的依赖T5或CLIP文本编码器的预训练语言模型的文本到图像生成模型不同,Playground v3完全集... 图像模型# Playground v3 2周前02140
小红书推出图像生成模型StoryMaker:不仅能保持面部一致性,还能保持服装、发型和身体的一致性,从而通过一系列图像促进故事的创作 小红书推出图像生成模型StoryMaker,它专门设计用于在文本到图像的生成过程中保持人物的一致性。这种一致性不仅限于人物的面部特征,还包括服装、发型和身体特征。通过这种方式,StoryMaker能够... 图像模型# StoryMaker# 小红书 2周前02920
智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus 清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ,CogView3 是一个基于级联扩散的文本生成图像系统,采用了接力扩散(relay diffusio... 图像模型# CogView-3Plus# CogView3# 图像生成 2周前03950
高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像 OnomaAI 研究小组推出一个高级插图模型Illustrious,它主要用于生成动漫风格的图像。Illustrious XL是一个基于SDXL的模型,专门针对插画和动画任务进行了优化。它是基于 Ko... 图像模型# Illustrious# Illustrious XL# 插图模型 2周前05740
Momo XL:基于SDXL的动漫风格模型 Momo XL 是一个基于 Stable Diffusion XL (SDXL) 的动漫风格模型,经过微调后,能够生成具有详细和生动美学的优质动漫风格图像。这款模型专为艺术家和动漫爱好者设计,提供了多... 图像模型# Momo XL# SDXL# 动漫风格 2周前02760
图像恢复算法PMRF:改善从损坏的图像中恢复出高质量、逼真图像 以色列理工学院的研究人员推出图像恢复算法PMRF(Posterior-Mean Rectified Flow,后验均值校正流),这个算法的目标是改善从损坏的图像中恢复出高质量、逼真图像的方法。具体来说... 图像模型# PMRF# 图像恢复算法 2周前04100
IterComp:为了解决文本到图像生成中的复杂和组合问题而设计的新框架 清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学的研究人员推出AI绘画新框架IterComp,它是为了解决文本到图像生成中的复杂和组合问题而设计的。简单来说,就是当你给... 图像模型# IterComp# 文本到图像 2周前03510
用于长篇故事视觉化的迭代框架Story-Adapter:根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像 加州大学圣克鲁斯分校、杭州电子科技大学和新加坡理工学院的研究人员推出一个用于长篇故事视觉化的迭代框架Story-Adapter,Story-Adapter能够根据长篇故事的文字描述生成一系列既连贯又具... 图像模型# Story-Adapter# 长篇故事视觉化 2周前05240
新型文生图框架SANA:能够高效地生成高达4096×4096分辨率的高清晰度图像 英伟达、麻省理工学院和清华大学的研究人员推出新型文本到图像生成框架SANA,它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA的核心优势在于它不仅生成的图像质量高,而且与文本的匹配度... 图像模型# SANA# 文生图框架 2周前04170
新型图像抠图方法SEMat:能够在复杂的自然场景中实现更精确的前景对象抠图 近年来,交互式分割模型(如 SAM)在图像分割任务中取得了显著进展。然而,这些模型在应用于交互式抠图任务时面临挑战,尤其是在处理复杂和遮挡场景时。现有的方法通常在合成数据上训练模型,但这些模型难以泛化... 图像模型# SEMat# 图像抠图 2周前02290