图像生成

排序

发布更新浏览点赞

如何兼顾“创意”与“真实”？用 Qwen-Image + Wan 2.2 实现高质量图像生成

阿里Qwen项目组近期发布的两款模型Qwen-Image和Wan 2.2都具有图像生成功能，但两款模型在生成图片的时候具有局限性： Qwen-Image 擅长创意构图，想象力丰富，但人物细节 AI 感...

8个月前

01,6120

新型图像生成模型Diffusion Mamba（DiM）：通过结合Mamba序列模型的效率和扩散模型的表现力，来高效生成高分辨率的图像

来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图像生成模型Diffusion Mamba（简称DiM），它融合了基于状态空间模型(SSM)的高效序列模型——Mamba，与扩...

新技术 # Diffusion Mamba # DiM # 图像生成

2年前

01,3810

新型图像生成模型DiMR：通过多分辨率处理和时间依赖的层归一化技术，有效地提高了图像的质量和真实感，减少了失真

字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR（Distortion-reduced Multi-Resolution Diffusion Model），此模...

新技术 # DiMR # 图像生成

2年前

09140

新型图像生成模型EMMA：能够接受多模态提示，并生成高质量的图像

南洋理工大学和腾讯的研究人员推出新型图像生成模型EMMA，它基于最先进的文本到图像（T2I）扩散模型ELLA，能够接受多模态提示（multi-modal prompts），并生成高质量的图像。简单来说...

新技术 # ELLA # EMMA # 图像生成

2年前

08850

无需训练、基于轨迹的可控图像生成技术TraDiffusion：允许用户通过鼠标轨迹来轻松引导图像的生成，而无需进行额外的训练或微调

厦门大学和中国科学院大学深圳先进技术研究院的研究人员推出新型图像生成技术TraDiffusion，这项技术的核心在于它允许用户通过鼠标轨迹来轻松引导图像的生成，而无需进行额外的训练或微调。简单来说，就...

新技术 # TraDiffusion # 图像生成

2年前

08440

图像和视频生成框架StoryDiffusion：能够生成一系列内容一致的图像和视频

来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion，这项技术的核心在于它能够生成一系列内容一致的图像和视频，这对于讲述一个故事或者展示一个连贯的场景来说非常重要...

新技术 # StoryDiffusion # 图像生成 # 视频生成

2年前

08050

新算法ViewFusion：解决在多视角图像生成一致性的问题

来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion，它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成，用于生成高质量、多样化的图像。论...

新技术 # ViewFusion # 图像生成

2年前

07280

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（Llama）中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...

新技术 # LlamaGen # 图像生成 # 大语言模型

2年前

06770

英伟达推出图像生成模型家族Edify Image：能够生成高保真度的图像内容，并且具有像素级完美准确性

英伟达推出图像生成模型家族Edify Image，它们能够生成高保真度的图像内容，并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型，这些模型通过一个新颖的拉普拉斯扩散...

新技术 # Edify Image # 图像生成 # 英伟达

1年前

06450

WAN 2.2 图像生成 + 高分辨率修复工作流指南

尽管阿里发布的 WAN 2.1 和 WAN 2.2 主要定位为视频生成模型，但其强大的视觉建模能力同样适用于高质量静态图像生成任务。网盘下载：https://www.123865.com/s/hyQ...

工作流 # WAN 2.2 # 图像生成

8个月前

06040

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ，CogView3 是一个基于级联扩散的文本生成图像系统，采用了接力扩散（relay diffusio...

图像模型 # CogView-3Plus # CogView3 # 图像生成

1年前

06000

黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]：实现更真实、更自然的图像生成

黑森林实验室（Black Forest Labs, BFL）与创意 AI 平台 KREA AI 正式宣布推出 FLUX.1 Krea [dev] —— 一个全新的开源文本到图像生成模型，也是 Krea...

图像模型 # FLUX.1 Krea [dev]# 图像生成 # 黑森林实验室

8个月前

05780

加载更多

如何兼顾“创意”与“真实”？用 Qwen-Image + Wan 2.2 实现高质量图像生成

新型图像生成模型Diffusion Mamba（DiM）：通过结合Mamba序列模型的效率和扩散模型的表现力，来高效生成高分辨率的图像

新型图像生成模型DiMR：通过多分辨率处理和时间依赖的层归一化技术，有效地提高了图像的质量和真实感，减少了失真

新型图像生成模型EMMA：能够接受多模态提示，并生成高质量的图像

无需训练、基于轨迹的可控图像生成技术TraDiffusion：允许用户通过鼠标轨迹来轻松引导图像的生成，而无需进行额外的训练或微调

图像和视频生成框架StoryDiffusion：能够生成一系列内容一致的图像和视频

新算法ViewFusion：解决在多视角图像生成一致性的问题

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

英伟达推出图像生成模型家族Edify Image：能够生成高保真度的图像内容，并且具有像素级完美准确性

WAN 2.2 图像生成 + 高分辨率修复工作流指南

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]：实现更真实、更自然的图像生成

S.H.I.T

ITELLOU

Jellyfish AI短剧工厂

waoo

OpenMAIC

OpResume

图像生成

网址

S.H.I.T

ITELLOU

Jellyfish AI短剧工厂

waoo

OpenMAIC

OpResume