苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由(training-free)高分辨率图像生成方法HiWave,利用预训练的扩散模型生成高质量的高分辨率图像。
例如,HiWave能够将一个1024×1024的基础图像放大到4096×4096的分辨率,同时保持图像的全局一致性并增强细节,而不会引入常见的重复对象和视觉伪影。

主要功能
HiWave的主要功能是生成高分辨率的图像,特别是在4K(4096×4096)及以上分辨率。它能够从预训练的扩散模型中生成具有丰富细节和最小重复伪影的高质量图像。例如,它可以将一个模糊的低分辨率图像转换为一个具有清晰纹理和细节的高分辨率图像。
主要特点
- 训练自由(Training-Free):HiWave不需要对预训练的扩散模型进行额外的训练或架构修改,即可生成高分辨率图像。
- 全局一致性与细节增强:通过结合基于小波变换(wavelet-based)的细节增强模块和补丁式的DDIM(Denoising Diffusion Implicit Models)反转策略,HiWave在保持全局一致性的同时增强了图像的细节。
- 减少重复伪影:与现有的高分辨率生成方法相比,HiWave显著减少了重复对象和结构不一致的问题。
工作原理
HiWave的工作原理基于一个两阶段的管道:
- 基础图像生成:首先使用预训练的扩散模型生成一个标准分辨率(如1024×1024)的基础图像。
- 细节增强:然后通过补丁式的DDIM反转步骤和小波变换细节增强模块,将基础图像放大到目标高分辨率(如4096×4096),同时保留低频成分以保持结构一致性,并引导高频成分以丰富细节和纹理。
测试结果
在使用Stable Diffusion XL进行的广泛评估中,HiWave有效地减少了常见视觉伪影,实现了优于先前方法的感知质量。用户研究确认了HiWave的性能,超过80%的比较中用户更倾向于选择HiWave的结果,这突出了其在无需重新训练或架构修改的情况下进行高质量、超高分辨率图像合成的有效性。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















