悉尼科技大学、百度和浙江大学的研究人员推出图像复制检测模型ICDiff,这是第一个专门针对扩散模型的ICD(图像复制检测)。为此,研究人员构建了一个扩散-复制(D-Rep)数据集,并相应地提出了一种新颖的深度嵌入方法。D-Rep使用最先进的扩散模型(Stable Diffusion V1.5)生成了40,000个图像-复制品对,这些对被手动标注为从0(无复制)到5(完全复制)的6个复制级别。PDF-Embedding将每个图像-复制品对的复制级别转换为一个概率密度函数(PDF)作为监督信号。其直觉是,相邻复制级别的概率应该是连续和平滑的。实验结果表明,PDF-Embedding在D-Rep测试集上超越了协议驱动的方法和非PDF选择。此外,通过利用PDF-Embedding,研究人员发现知名扩散模型针对开源图库的复制比例从10%到20%不等。
- 项目主页:https://icdiff.github.io
- GitHub:https://github.com/WangWenhao0716/PDF-Embedding
- 数据:https://huggingface.co/datasets/WenhaoWang/D-Rep
例如,你是一名数字艺术家,你使用了一个很酷的工具(扩散模型)来创作一幅新的画作。这个工具可以根据你给出的描述生成图像。但问题是,这个工具生成的图像可能和你之前在网上看到的某个图像非常相似,这可能涉及到版权问题。ICDiff就是为了解决这个问题,它可以帮助我们识别出这些由扩散模型生成的图像是否复制了现有的图像。
主要功能
- 图像复制检测:检测由扩散模型生成的图像是否与现有图像数据库中的图像相似或复制。
主要特点
- 专门为扩散模型设计:传统的图像复制检测方法对扩散模型生成的图像效果不佳,这篇论文提出了专门针对这类模型的检测方法。
- 构建了新的数据集:为了训练和测试这个检测方法,研究者们构建了一个包含40,000对图像的数据集,这些图像由扩散模型生成,并手动标注了它们之间的相似度等级。
- 使用概率密度函数:提出了一种新的深度嵌入方法,将图像复制的等级转换为概率密度函数,用于训练检测模型。
工作原理
- 数据集构建:首先,研究者们使用一个先进的扩散模型(Stable Diffusion V1.5)生成了大量图像,并手动标注了这些图像与现有图像的相似度等级。
- PDF-Embedding方法:然后,他们提出了一种新的深度嵌入方法,将每对图像的复制等级转换为一个概率密度函数(PDF),以此作为训练信号。
- 训练模型:使用这些PDF作为监督信号,训练一个深度学习模型来预测图像对之间的复制等级。
具体应用场景
- 版权检测:帮助版权持有者检测他们的图像是否被扩散模型非法复制。
- 内容审核:社交媒体和内容平台可以使用这项技术来自动检测和过滤掉可能侵犯版权的用户生成内容。
- 法律和合规:为法律专业人士提供工具,帮助他们在版权纠纷中确定图像的原创性。
总的来说,这篇论文提出了一个创新的方法来解决扩散模型生成图像的版权和原创性问题,这对于维护数字艺术和媒体领域的版权保护具有重要意义。
评论0