Meta推出局部图像水印的深度学习模型WAM

图像水印技术在保护数字内容的版权和完整性方面发挥着重要作用。然而,传统的图像水印方法并未针对处理小面积水印区域进行优化,这限制了其在实际应用中的使用,例如图像的部分可能来自不同来源或已被编辑。Meta介绍了一种用于局部图像水印的深度学习模型,称为水印任何模型(Watermark Anything Model,WAM)。WAM在不可察觉性和鲁棒性方面表现出色,特别是在修复和拼接方面,即使在高分辨率图像上也是如此。

例如,一个艺术家使用了AI技术来编辑一幅画,只对画的一小部分添加了水印。在传统的水印技术中,可能无法检测到这个小面积的水印,或者在图像被进一步编辑(如裁剪、色彩调整)后,水印信号可能会消失。WAM技术能够处理这种情况,即使在图像的一小部分被水印的情况下,也能检测和提取水印信息。

模型概述

1. WAM嵌入器

  • 不可察觉的修改:WAM嵌入器对输入图像进行不可察觉的修改,以嵌入水印信息。这些修改非常细微,肉眼难以察觉。
  • 局部水印:嵌入器可以在图像的任意小区域内嵌入水印,而不仅仅是整幅图像。

2. WAM提取器

  • 分割和恢复:提取器将接收到的图像分割成水印区域和非水印区域,并从被发现为水印的区域中恢复一个或多个隐藏信息。
  • 多区域处理:提取器能够处理多个小水印区域,即使这些区域不超过图像表面的10%。

主要功能:

  1. 局部图像水印:能够在图像的特定区域嵌入水印,而不是整个图像。
  2. 水印检测与提取:能够检测图像中哪些部分被水印,并从中恢复隐藏的信息。
  3. 多水印处理:能够在同一图像中嵌入和提取多个水印信息。

主要特点:

  • 高分辨率图像的兼容性:即使在高分辨率图像上也表现出良好的不可见性和鲁棒性。
  • 对抗性编辑的鲁棒性:特别对抗图像编辑(如修复和拼接)表现出强大的鲁棒性。
  • 新的应用能力:能够定位拼接图像中的水印区域,并从多个小区域提取不同的32位消息。

工作原理:

WAM通过一个深度学习模型实现,包括一个嵌入器(embedder)和一个提取器(extractor)。嵌入器在输入图像上不可见地修改,而提取器则将接收到的图像分割成已水印和未水印的区域,并从已水印的区域恢复一个或多个隐藏消息。这个过程分为两个训练阶段:

  1. 低分辨率下的联合训练:在没有感知约束的情况下进行,以实现鲁棒性。
  2. 后训练阶段:针对不可见性和多水印进行优化,通过Just-Noticeable-Difference(JND)模型来调整水印的可见性,并允许在同一图像中嵌入多个消息。

实验结果

1. 不可察觉性和鲁棒性

  • 不可察觉性:WAM在嵌入水印后,图像的视觉质量几乎不受影响,肉眼难以察觉水印的存在。
  • 鲁棒性:WAM在处理图像修复和拼接等操作时表现出色,能够有效恢复隐藏信息。

2. 特殊功能

  • 多区域水印:WAM可以在拼接图像中定位水印区域,并从多个小区域中提取出具有小于1比特误差的独特32位信息,即使对于小尺寸的256×256图像也是如此。
  • 小面积水印:WAM特别擅长处理小面积水印区域,这对于实际应用中的复杂图像编辑非常有用。

实际应用

WAM在实际应用中具有广泛的应用前景,特别是在以下领域:

  • 版权保护:在数字内容的版权保护中,WAM可以嵌入水印以验证图像的来源和完整性。
  • 图像编辑:在图像编辑过程中,WAM可以帮助标记和追踪图像的不同部分,确保编辑后的图像仍然包含必要的信息。
  • 安全认证:在安全认证和身份验证中,WAM可以用于嵌入和提取唯一的标识信息,提高安全性。
0

评论0

没有账号?注册  忘记密码?