Adobe 推出新工具,为 AI 训练数据创建“Robots.txt 风格”的指示器

早报2个月前发布 小马良
74 0

随着人工智能(AI)技术的快速发展,AI 模型训练对海量数据的需求引发了创作者和平台之间的争议。许多艺术家和内容创作者担心自己的作品未经许可被用于训练生成式 AI 模型,进而侵犯了他们的版权和创作意图。为了应对这一挑战,Adobe 提议了一种类似于 robots.txt 的行业标准,旨在让创作者对其内容是否被用于 AI 训练拥有更多控制权。

背景:AI 数据抓取与创作者权益的冲突

近年来,AI 公司通过网络爬虫抓取大量公开图像、文本和其他媒体用于模型训练。尽管许多网站使用 robots.txt 文件来指示爬虫哪些内容不允许抓取,但 AI 爬虫通常会忽略这些请求,导致创作者无法阻止其作品被滥用。

Adobe 推出新工具,为 AI 训练数据创建“Robots.txt 风格”的指示器

针对这一问题,Adobe 提出了一个基于 内容凭证(Content Credentials) 的解决方案,允许创作者明确标注其作品是否可用于 AI 训练。这种机制是 Adobe 在内容真实性领域的最新尝试,也是其参与的 内容来源和真实性联盟(C2PA) 的一部分。

Adobe 的新工具:内容真实性应用程序

1. 内容凭证的核心功能

  • 元数据嵌入:Adobe 的新工具将内容凭证嵌入到图像文件的元数据中,包括创作者的身份信息(如姓名、社交媒体帐户等)。
  • 数字指纹识别:结合开源水印和加密技术,即使图像被修改或重新发布,凭证元数据仍能保持完整。
  • AI 训练指示器:创作者可以选择勾选一个框,明确表示该图像不应被用于 AI 模型训练。

2. Web 工具与 Chrome 扩展程序

  • Adobe Content Authenticity App:这是一个新的 Web 应用程序,用户可以一次性为最多 50 个 JPG 或 PNG 文件附加内容凭证。
  • 验证集成:与 LinkedIn 合作,利用其验证程序证明创作者身份的真实性。
  • Chrome 扩展程序:用户可以通过扩展程序检查带有内容凭证的图像。如果图像附带凭证,会在图片上显示一个小的“CR”符号。
Adobe 推出新工具,为 AI 训练数据创建“Robots.txt 风格”的指示器

3. 技术实现

Adobe 使用 数字指纹识别 和 开源水印 技术,将元数据嵌入到图像的像素级别,确保即使图像经过裁剪、压缩或其他修改,凭证信息仍然可用。这种技术使得在不支持 C2PA 标准的平台上(如 Instagram),用户也能通过 Chrome 扩展程序查看凭证。

挑战:如何说服 AI 公司遵守标准?

尽管 Adobe 的提议具有创新性,但其成功与否取决于 AI 公司是否愿意采纳并尊重这一标准。目前,Adobe 尚未与任何 AI 模型开发者签署正式协议,但它表示正在与所有顶级 AI 公司进行谈判,以推动该标准的普及。

Adobe 推出新工具,为 AI 训练数据创建“Robots.txt 风格”的指示器

然而,历史经验表明,AI 爬虫通常会忽略 robots.txt 文件中的禁止请求,因此 Adobe 的新标准可能面临类似的执行难题。如果没有法律或监管机构的支持,仅靠自愿遵守可能难以有效约束 AI 公司的行为。

行业反应与 Meta 的案例

Adobe 的尝试并非孤立事件。去年,Meta 曾尝试在其平台上自动标记图像,但由于标记方式引发争议(如将编辑过的照片错误标记为“使用 AI 制作”),最终不得不更改标签为“AI 信息”。这表明,在 AI 和艺术领域,不同平台的实施方式可能存在巨大差异。

Adobe 内容真实性倡议高级主管 Andy Parson 强调,Adobe 的目标不是对什么是艺术发表意见,而是提供一种工具,让创作者能够明确声明其作品的所有权和用途意图。他指出:“我们希望通过这一工具,帮助小创作者和代理机构对其作品拥有更多控制权。”

虽然 Adobe 的新工具目前专注于图像,但公司计划在未来扩展支持视频和音频文件。这意味着内容凭证的应用范围可能会进一步扩大,为更多类型的创作者提供保护。(来源

© 版权声明

相关文章

暂无评论

none
暂无评论...