新型图像生成模型EMMA:能够接受多模态提示,并生成高质量的图像 南洋理工大学和腾讯的研究人员推出新型图像生成模型EMMA,它基于最先进的文本到图像(T2I)扩散模型ELLA,能够接受多模态提示(multi-modal prompts),并生成高质量的图像。简单来说... 新技术# ELLA# EMMA# 图像生成 8个月前05120
新型图像生成模型家族LlamaGen:将大语言模型(Llama)应用到视觉图像生成领域 香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(Llama)中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图... 新技术# LlamaGen# 图像生成# 大语言模型 9个月前04570
新型图像生成模型Diffusion Mamba(DiM):通过结合Mamba序列模型的效率和扩散模型的表现力,来高效生成高分辨率的图像 来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图像生成模型Diffusion Mamba(简称DiM),它融合了基于状态空间模型(SSM)的高效序列模型——Mamba,与扩... 新技术# Diffusion Mamba# DiM# 图像生成 9个月前06770
图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频 来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要... 新技术# StoryDiffusion# 图像生成# 视频生成 10个月前05340
新算法ViewFusion:解决在多视角图像生成一致性的问题 来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion,它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成,用于生成高质量、多样化的图像。 论... 新技术# ViewFusion# 图像生成 12个月前05070