基于定制化扩散模型权重的子空间weights2weights(w2w):能够支持从单一图像中提取视觉身份,编辑模型中编码的身份,以及采样新模型来编码多样化的人物实例
加州大学伯克利分校、Snap和斯坦福大学的研究人员推出weights2weights(w2w),这...
新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真
字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成...
基准测试CommonsensenT2I:用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力
宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I,...
新型图像压缩技术CMC(模态压缩):利用大型多模态模型来实现图像到文本再到图像的转换,从而在保持图像质量的同时,大幅度减小图像的大小
上海交通大学和南洋理工大学的研究人员推出一种新型的图像压缩技术“跨模态压缩”(C...
扩散模型中“幻觉”(hallucinations)现象:生成了一些在训练数据中从未出现过的样本
卡内基梅隆大学和DatalogyAI的研究人员发布论文探讨扩散模型(diffusion models)...
文生图模型偏好优化方法MaPO(边界感知偏好优化):让计算机在学习生成图像时,能够更好地符合人类的偏好
韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散...