谷歌在 Nano Banana Pro 等模型中集成了 SynthID ——一种旨在检测 AI 生成图像的不可见数字水印技术。然而,任何安全机制的有效性,都需经受“红队测试”的检验。

由开发者00quebec提出的新项目 SynthID-Bypass,提供了一套基于 ComfyUI 的概念验证工作流,展示了如何通过扩散模型的“低去噪重渲染”策略,有效移除 SynthID 水印,同时保留图像主体内容与结构。
开发者免责声明:本项目仅用于教育与 AI 安全研究,不得用于规避版权、伪造内容或任何恶意用途。所有代码与方法“按原样”提供,无任何担保。
为什么研究 SynthID?
SynthID 作为当前主流的 AI 水印方案之一,其核心是将微妙的噪声模式嵌入到生成图像的像素空间中。这些噪声对人眼不可见,但可通过专用检测器(如 Gemini 内置分析器)识别。

然而,如果水印仅存在于像素级噪声中,那么通过重建图像是否就能将其“洗掉”?
正是这一问题,催生了本研究。
核心发现:水印可被“像素清洗”移除
研究者通过一个巧妙的可视化实验揭示了水印的本质:
- 用 Nano Banana Pro 生成一张纯黑图像;
- 极度提升其曝光、亮度与阴影,同时降低对比度;
- 结果显示出非确定性的、类似噪声的水印图案——每次生成都不同。
这表明:SynthID 水印是生成过程中注入的随机扰动,而非语义或频域特征。

基于此,开发者提出假设:
若使用扩散模型以极低去噪强度(如 denoise=0.2)对图像进行“温和重绘”,即可替换原始噪声(含水印),同时保留高层语义。

技术实现:两种 ComfyUI 工作流
开发者提供了两类工作流,均基于 多阶段低去噪 + 结构引导 架构:
1. 通用绕过流程(Synthid_Bypass.json)
- Canny 边缘检测:提取原始图像结构轮廓;
- ControlNet 引导:确保重绘过程严格遵循原始构图;
- 三阶段 KSampler:以极低 denoise 值迭代重绘,逐步“清洗”像素噪声;
- FaceDetailer:自动检测并精细修复人脸区域,防止面部失真。

2. 人像优化流程(Synthid_Bypass_Portrait.json)
- 人脸感知遮罩:使用 YOLO 模型精确定位面部;
- 局部修复与拼接:通过
InpaintCropImproved裁剪人脸,单独处理后无缝融合; - 专用超分:应用
SeedVR2对人脸区域进行细节增强。

两种流程在保留视觉内容的同时,使 SynthID 检测器无法识别水印——实测中,Gemini 等工具将处理后图像判定为“非 AI 生成”。
伦理立场:安全研究,而非攻击工具
本项目明确反对滥用,并强调以下原则:
- 负责任的披露:通过公开方法,推动水印技术迭代;
- 社区共建防御:鼓励开发者测试边界、提出更强方案;
- 警惕“猫鼠游戏”:像素级水印易受重建攻击,未来需探索语义域、频域或模型内嵌等更鲁棒的方案。
开发者呼吁:不要把水印当作“银弹”。合成媒体的真实性保障,需结合技术、政策与用户教育。
如何复现?(研究用途)
环境要求
- ComfyUI 最新版(支持自定义节点)
- GPU 显存 ≥ 16GB(推荐)
- 必装自定义节点:
- ComfyUI Impact Pack
- FaceDetailer 相关组件
- Inpaint Crop & Stitch
- SeedVR2 Nodes(人像流程)
模型依赖(部分)
| 模型 | 路径 | 来源 |
|---|---|---|
ae.safetensors | vae/ | Hugging Face |
z_image_turbo_bf16.safetensors | diffusion_models/ | Hugging Face |
yolov8n-face.pt | ultralytics/bbox/ | Hugging Face |
完整模型列表与下载链接见项目 README。
使用步骤
- 加载工作流 JSON 到 ComfyUI;
- 在
Load Image节点输入 SynthID 水印图像; - 点击
Queue Prompt; - 输出图像即为“去水印”版本。
局限性与未来方向
当前方法仍有不足:
- 高分辨率图像(>4K)需降采样;
- 可能丢失背景细节(如纹理、文字);
- 对精细结构(如织物、文字)可能引入伪影;
- 依赖较强算力,难以大规模部署。
未来研究可探索:
- 水印嵌入到潜在空间或频域;
- 利用模型内部激活而非像素输出进行标记;
- 多模态一致性验证(如文本-图像对齐)。















