东京科学研究所的研究团队近日提出一种新方法——LatentCSI,能够利用日常 Wi-Fi 设备采集的无线信号,结合预训练扩散模型,生成高分辨率的室内布局图像。
这项技术并非直接“看见”房间,而是通过分析 Wi-Fi 信号在空间中的传播特性,推断出物体和人体的位置分布,并借助 AI 补全视觉细节。

虽然仍处于实验室阶段,但它展示了无线感知与生成式 AI 融合的新方向。
背后的原理:Wi-Fi 也能“感知”空间
我们周围的 Wi-Fi 路由器和设备持续发送无线信号,这些信号不仅直达接收端,还会在墙壁、家具、人体等物体上发生反射、折射和衍射。
这一过程会改变信号的幅度、相位和传播路径,形成被称为 信道状态信息(Channel State Information, CSI) 的数据流。
传统上,CSI 被用于提升网络性能(如波束成形)。近年来,研究人员发现它可以反映环境的空间结构:
- 有人走动时,CSI 会发生明显波动
- 不同物体的反射模式存在差异
过去的方法尝试将 CSI 直接映射为二维热力图或简略轮廓,但结果粗糙、分辨率低,且计算开销大。
LatentCSI 的突破:从像素空间到潜在空间
LatentCSI 的核心创新在于:不直接生成像素图像,而是先在“潜在空间”中构建表示。
什么是潜在空间?
- 是生成模型(如 Stable Diffusion)内部使用的压缩特征空间
- 比原始像素数据更紧凑,更适合高效生成
具体流程如下:
- 采集 CSI 数据
使用标准 Wi-Fi 收发设备获取信号回波信息。 - 映射至潜在空间
将 CSI 数据输入一个经过修改的编码器,将其转换为与扩散模型兼容的潜在向量。 - 调用预训练扩散模型
研究人员采用 Stable Diffusion 3 作为基础生成器,仅替换其图像编码器部分,使其能接受 CSI 输入。 - 输出高分辨率图像
模型基于潜在表示生成房间的视觉化图像,包含纹理、家具样式等 Wi-Fi 本身无法捕捉的细节。
这种方法的优势在于:
- 利用已有视觉先验知识(模型“知道”房间通常长什么样”)
- 显著降低计算负担
- 提升图像分辨率与语义合理性
关键前提:依赖预训练,非通用黑盒
需要强调的是,LatentCSI 并不能凭空还原任意房间的图像。
它的前提是:
- 所研究的房间类型已在训练集中出现过
- 模型已学习过类似场景的真实照片
换句话说,AI 并不是“看到”房间,而是在“根据信号线索,想象最可能的样子”。
因此,该方法适用于特定环境下的部署,例如智能家居、养老监护等固定场景,而不适合随意拍摄一段 Wi-Fi 数据就还原陌生空间。
实验表现与局限性
根据论文描述,LatentCSI 在受控环境中表现出优于以往 Wi-Fi 成像技术的效果:
- 能识别多人位置分布
- 可区分家具大致布局
- 生成图像具备合理纹理与空间逻辑
但仍有明显限制:
- 对未见过的房间结构泛化能力弱
- 无法精确还原颜色、文字或小物件
- 依赖高质量 CSI 采集设备(目前多为专业硬件)
此外,整个系统尚未脱离实验室验证阶段,距离实际应用尚有距离。
隐私问题不容忽视
尽管研究人员强调其潜在用途包括:
- 老人跌倒检测
- 智能照明与空调控制
- 无摄像头的家庭监控
但这项技术的本质是“通过无线信号间接获取室内视觉信息”,一旦被滥用,可能带来严重隐私风险:
- 无需摄像头即可推测室内活动
- 可穿透墙壁工作(取决于频率)
- 用户往往 unaware 自家路由器正在“感知”环境
事实上,已有商用路由器支持基本的运动检测功能。随着此类 AI 技术成熟,监管和技术伦理需提前介入。















