图像水印技术在保护数字内容的版权和完整性方面发挥着重要作用。然而,传统的图像水印方法并未针对处理小面积水印区域进行优化,这限制了其在实际应用中的使用,例如图像的部分可能来自不同来源或已被编辑。Meta介绍了一种用于局部图像水印的深度学习模型,称为水印任何模型(Watermark Anything Model,WAM)。WAM在不可察觉性和鲁棒性方面表现出色,特别是在修复和拼接方面,即使在高分辨率图像上也是如此。
例如,一个艺术家使用了AI技术来编辑一幅画,只对画的一小部分添加了水印。在传统的水印技术中,可能无法检测到这个小面积的水印,或者在图像被进一步编辑(如裁剪、色彩调整)后,水印信号可能会消失。WAM技术能够处理这种情况,即使在图像的一小部分被水印的情况下,也能检测和提取水印信息。
模型概述
1. WAM嵌入器
-
不可察觉的修改:WAM嵌入器对输入图像进行不可察觉的修改,以嵌入水印信息。这些修改非常细微,肉眼难以察觉。 -
局部水印:嵌入器可以在图像的任意小区域内嵌入水印,而不仅仅是整幅图像。
2. WAM提取器
-
分割和恢复:提取器将接收到的图像分割成水印区域和非水印区域,并从被发现为水印的区域中恢复一个或多个隐藏信息。 -
多区域处理:提取器能够处理多个小水印区域,即使这些区域不超过图像表面的10%。
主要功能:
-
局部图像水印:能够在图像的特定区域嵌入水印,而不是整个图像。 -
水印检测与提取:能够检测图像中哪些部分被水印,并从中恢复隐藏的信息。 -
多水印处理:能够在同一图像中嵌入和提取多个水印信息。
主要特点:
-
高分辨率图像的兼容性:即使在高分辨率图像上也表现出良好的不可见性和鲁棒性。 -
对抗性编辑的鲁棒性:特别对抗图像编辑(如修复和拼接)表现出强大的鲁棒性。 -
新的应用能力:能够定位拼接图像中的水印区域,并从多个小区域提取不同的32位消息。
工作原理:
WAM通过一个深度学习模型实现,包括一个嵌入器(embedder)和一个提取器(extractor)。嵌入器在输入图像上不可见地修改,而提取器则将接收到的图像分割成已水印和未水印的区域,并从已水印的区域恢复一个或多个隐藏消息。这个过程分为两个训练阶段:
-
低分辨率下的联合训练:在没有感知约束的情况下进行,以实现鲁棒性。 -
后训练阶段:针对不可见性和多水印进行优化,通过Just-Noticeable-Difference(JND)模型来调整水印的可见性,并允许在同一图像中嵌入多个消息。
实验结果
1. 不可察觉性和鲁棒性
-
不可察觉性:WAM在嵌入水印后,图像的视觉质量几乎不受影响,肉眼难以察觉水印的存在。 -
鲁棒性:WAM在处理图像修复和拼接等操作时表现出色,能够有效恢复隐藏信息。
2. 特殊功能
-
多区域水印:WAM可以在拼接图像中定位水印区域,并从多个小区域中提取出具有小于1比特误差的独特32位信息,即使对于小尺寸的256×256图像也是如此。 -
小面积水印:WAM特别擅长处理小面积水印区域,这对于实际应用中的复杂图像编辑非常有用。
实际应用
WAM在实际应用中具有广泛的应用前景,特别是在以下领域:
-
版权保护:在数字内容的版权保护中,WAM可以嵌入水印以验证图像的来源和完整性。 -
图像编辑:在图像编辑过程中,WAM可以帮助标记和追踪图像的不同部分,确保编辑后的图像仍然包含必要的信息。 -
安全认证:在安全认证和身份验证中,WAM可以用于嵌入和提取唯一的标识信息,提高安全性。
评论0