新型图像生成模型EMMA:能够接受多模态提示,并生成高质量的图像 南洋理工大学和腾讯的研究人员推出新型图像生成模型EMMA,它基于最先进的文本到图像(T2I)扩散模型ELLA,能够接受多模态提示(multi-modal prompts),并生成高质量的图像。简单来说... 新技术# ELLA# EMMA# 图像生成 8个月前05010
大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力 腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能... 新技术# DPG-Bench# ELLA# TSC 10个月前04750