ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

多模态模型1个月前发布小马良

43 0

脑电图（EEG）研究长期面临着一个棘手难题：信号噪声大、电极脱落导致数据缺失、以及高密度采集成本高昂。传统处理方法往往依赖复杂的数学插值或手工设计的滤波器，不仅效果有限，还难以适应多变的实际场景。

ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

ZUNA 是一款开源脑电图基础模型，这款仅拥有 3.8 亿参数 的轻量级模型，凭借强大的重建、去噪和上采样能力，正在重新定义 EEG 信号处理的标准。更令人惊喜的是，它无需昂贵的算力集群，在消费级 GPU 甚至 CPU 上即可流畅运行。

GitHub：https://github.com/Zyphra/zuna
模型：https://huggingface.co/Zyphra/ZUNA

核心能力：不仅仅是“修补”，更是“理解”

ZUNA 是一个基于掩码扩散自编码器（Masked Diffusion Autoencoder）架构的模型。它在约 200 万通道小时 的公开脑电图数据上进行了大规模预训练，从而学习到了脑电信号的深层通用先验知识。

给定一部分脑电图通道作为输入，ZUNA 能够完成三项核心任务：

智能去噪：有效去除肌电、眼电及环境干扰，还原纯净的脑电波形，显著提升信噪比。
缺失重建：当部分电极接触不良或数据丢失时，ZUNA 能根据周围通道的信息，高精度地“脑补”出缺失通道的信号，而非简单的线性插值。
虚拟上采样：这是 ZUNA 最惊艳的功能。它能根据头皮上的物理坐标，预测并生成全新的通道信号。这意味着研究人员可以用低密度设备采集数据，再通过 ZUNA 生成高密度脑电图谱，大幅降低硬件成本。

ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

性能实测：碾压传统插值算法

为了验证 ZUNA 的实力，研发团队将其与神经科学领域常用的 MNE-Python 默认球面样条插值法进行了全方位对比。

测试结果令人印象深刻：

泛化性强：在多个未见过的数据集上，即使这些数据集采用了完全不同的预处理流程，ZUNA 的重建精度依然稳定优于 MNE。
高倍率上采样优势明显：在进行高比例通道上采样（如从 32 通道扩展到 128 通道）时，传统插值法往往显得力不从心，产生大量伪影；而 ZUNA 凭借预训练学到的生理结构先验，生成的信号更加自然、准确。
鲁棒性高：面对不同程度的噪声污染和数据缺失，ZUNA 均表现出极强的适应能力。

这表明，ZUNA 并非仅仅在“死记硬背”训练数据，而是真正理解了脑电信号在头皮空间分布的内在规律。

轻量部署：科研民主化的新里程碑

在 AI 模型动辄数百亿参数的今天，ZUNA 的 3.8 亿参数 显得格外“亲民”。

硬件友好：无需 A100/H100 等高端显卡，普通的 RTX 4090 甚至更入门的消费级 GPU 即可胜任推理任务。
CPU 可用：在许多轻量级工作负载下，ZUNA 甚至可以直接在 CPU 上运行，这为便携式脑电设备和边缘计算场景打开了大门。
开源开放：项目代码与模型权重已完全开源，全球的研究人员、医生和开发者均可免费使用、微调或集成到自己的产品中。

应用前景：从实验室到临床

ZUNA 的出现，将为多个领域带来变革：

低成本脑机接口（BCI）：通过软件算法弥补硬件不足，让低通道数的头戴设备也能实现高精度的意图识别。
临床诊断辅助：自动修复因患者移动导致的伪影数据，提高癫痫定位、睡眠分期等诊断的准确性。
神经科学研究：让中小实验室也能利用公开的低质量历史数据，通过重建和上采样挖掘出新的科学发现。
可穿戴设备：轻量化模型可嵌入移动端，实现实时的脑电监测与反馈。

多模态模型 # ZUNA

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

AI终于能“边看视频边记人”！北大等联合推出PEARL，实时互动不“失忆”

AI终于能“边看视频边记人”！北大等联合推出PEARL，实时互动不“失忆”

多模态模型 # PEARL # 视频理解

2周前

0350

TNG科技微调 olmOCR推出olmOCR-7B-faithful：更忠实的 OCR 模型，适用于业务场景中的全面信息提取

TNG科技微调 olmOCR推出olmOCR-7B-faithful：更忠实的 OCR 模型，适用于业务场景中的全面信息提取

多模态模型 # olmOCR # olmOCR-7B-faithful

12个月前

02440

CDMs：让机器人“看清”三维世界，实现从仿真到现实的无缝迁移

CDMs：让机器人“看清”三维世界，实现从仿真到现实的无缝迁移

多模态模型 # CDMs # 机器人

7个月前

0960

视觉语言模型ClipTagger-12B：开源视频理解新标杆，性能对标 GPT-4.1，成本低至 1/15

视觉语言模型ClipTagger-12B：开源视频理解新标杆，性能对标 GPT-4.1，成本低至 1/15

多模态模型 # ClipTagger-12B # 视觉语言模型

8个月前

05180

暂无评论

none

暂无评论...