图像生成

排序

发布更新浏览点赞

新型端到端模型DnD-Transformer：提高了图像生成任务的质量和效率，为图像生成领域带来了新的可能

北京大学、阿里巴巴集团、威斯康星大学麦迪逊分校和北京理工大学的研究人员推出新型端到端模型DnD-Transformer，这是一种用于高效细粒度图像生成的二维自回归Transformer。简单来说，这个...

新技术 # DnD-Transformer # 图像生成

1年前

04870

智谱AI推出图像生成模型 CogView3 以及 CogView-3Plus

清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ，CogView3 是一个基于级联扩散的文本生成图像系统，采用了接力扩散（relay diffusio...

图像模型 # CogView-3Plus # CogView3 # 图像生成

1年前

06000

新型图像生成技术MaskBit：根据一些简单的描述或者标签，自动创造出相对应的图像

字节跳动、慕尼黑工业大学、MCML和卡内基梅隆大学的研究人员推出新型图像生成技术MaskBit，这个技术能够自动创造出新的图像，而且不需要像传统方法那样依赖于大量的预训练数据或者复杂的数学模型。Mas...

新技术 # MaskBit # 图像生成

2年前

05620

无需训练、基于轨迹的可控图像生成技术TraDiffusion：允许用户通过鼠标轨迹来轻松引导图像的生成，而无需进行额外的训练或微调

厦门大学和中国科学院大学深圳先进技术研究院的研究人员推出新型图像生成技术TraDiffusion，这项技术的核心在于它允许用户通过鼠标轨迹来轻松引导图像的生成，而无需进行额外的训练或微调。简单来说，就...

新技术 # TraDiffusion # 图像生成

2年前

08440

新型图像生成模型DiMR：通过多分辨率处理和时间依赖的层归一化技术，有效地提高了图像的质量和真实感，减少了失真

字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR（Distortion-reduced Multi-Resolution Diffusion Model），此模...

新技术 # DiMR # 图像生成

2年前

09140

新型图像生成模型EMMA：能够接受多模态提示，并生成高质量的图像

南洋理工大学和腾讯的研究人员推出新型图像生成模型EMMA，它基于最先进的文本到图像（T2I）扩散模型ELLA，能够接受多模态提示（multi-modal prompts），并生成高质量的图像。简单来说...

新技术 # ELLA # EMMA # 图像生成

2年前

08850

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（Llama）中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...

新技术 # LlamaGen # 图像生成 # 大语言模型

2年前

06770

新型图像生成模型Diffusion Mamba（DiM）：通过结合Mamba序列模型的效率和扩散模型的表现力，来高效生成高分辨率的图像

来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图像生成模型Diffusion Mamba（简称DiM），它融合了基于状态空间模型(SSM)的高效序列模型——Mamba，与扩...

新技术 # Diffusion Mamba # DiM # 图像生成

2年前

01,3810

图像和视频生成框架StoryDiffusion：能够生成一系列内容一致的图像和视频

来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion，这项技术的核心在于它能够生成一系列内容一致的图像和视频，这对于讲述一个故事或者展示一个连贯的场景来说非常重要...

新技术 # StoryDiffusion # 图像生成 # 视频生成

2年前

08050

新算法ViewFusion：解决在多视角图像生成一致性的问题

来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion，它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成，用于生成高质量、多样化的图像。论...

新技术 # ViewFusion # 图像生成

2年前

07280

没有了