RealRestorer：开源图像修复新标杆，九合一全能模型直逼闭源顶尖水平

11 0

在自动驾驶、安防监控、遥感分析乃至日常摄影中，图像质量往往决定了下游任务的成败。然而，真实世界中的图像退化（如模糊、噪点、雾霾、反光等）复杂多变，传统修复模型往往“水土不服”，而效果卓越的闭源大模型（如 Nano Banana Pro）又让普通开发者望尘莫及。

由 南方科技大学、StepFun（阶跃星辰） 和 中国科学院深圳先进技术研究院 联合推出的 RealRestorer 是一个面向通用真实世界图像修复的大规模开源模型，它不仅涵盖了九种主流退化类型的修复能力，更在性能上首次实现了开源模型与顶尖闭源模型的“零距离”对标。

RealRestorer 不再是需要针对每种问题切换不同模型的“专科医生”，而是一位全能的“全科专家”。它能精准处理以下 9 种 真实世界常见的图像退化问题：

惊喜彩蛋：得益于强大的泛化能力，RealRestorer 甚至能零样本（Zero-shot）处理未专门训练的任务，如去雪和老照片修复。

特性	传统开源模型	顶尖闭源模型 (如 Nano Banana Pro)	RealRestorer
修复能力	单一或少数几种，泛化差	全能，效果好	全能九合一，效果比肩闭源
数据基础	依赖人工合成，脱离真实	海量真实数据	165万+ 真实/合成混合数据
一致性保持	易变形、失真、改变主体	高度一致	精准保留结构与语义，不“修歪”
获取成本	免费但效果一般	昂贵/不可用	完全开源，免费可商用
适用场景	实验室理想环境	商业落地	真实复杂场景，鲁棒性极强

RealRestorer 摒弃了单纯依赖人工合成数据的传统路径，构建了包含 165 万对 “受损 - 清晰”图像的大规模数据集。其中融合了真实的网络退化图像和高保真合成数据，确保模型见过足够多的“世面”，从而在复杂多变的真实环境中依然表现稳定。

为了平衡泛化性与真实性，团队采用了创新的两阶段训练法：

许多修复模型在去噪或去模糊时，往往会把人脸修歪、把文字修错。RealRestorer 通过特殊的架构设计和损失函数约束，确保了修复后的图像在场景结构、语义内容和细节纹理上与原始图像高度一致，真正做到了“修旧如旧”。

在团队 newly 提出的 RealIR-Bench 基准（含 464 张真实退化图）及传统 FoundIR 基准上的测试结果显示：

开源榜一：在去模糊、低光增强等核心任务上斩获 SOTA (State-of-the-Art)，综合得分远超 Qwen-Image-Edit、LongCat-Image-Edit 等其他开源模型。
比肩闭源：综合性能仅略低于顶尖闭源模型 Nano Banana Pro，差距微乎其微，但在多项指标上已超越其他商业模型。
用户认可：在 32 人参与的盲测调研中，RealRestorer 的视觉效果和一致性评分仅次于 Nano Banana Pro，大幅领先其他选手。