瑞士近日正式推出其国家级开源大语言模型 Apertus,标志着该国在构建自主可控、合规透明的人工智能基础设施方面迈出关键一步。
这一模型由 洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich) 与 瑞士国家超级计算中心(CSCS) 联合研发——三者均为瑞士公共科研机构。与多数由企业主导的闭源模型不同,Apertus 从诞生之初就被定义为一项公共产品,目标是成为 OpenAI、Anthropic 等商业模型之外的可信替代方案。
“Apertus”源自拉丁语,意为“开放”。这个名字不仅指向其开源属性,也象征着瑞士对 AI 公共化愿景的坚持。

什么是 Apertus?一个完全透明的 AI 模型
Apertus 的核心理念是:可审查、可验证、可信赖。
为此,研发团队采取了前所未有的开放策略:
- ✅ 模型权重完全公开
- ✅ 训练代码与流程开源
- ✅ 训练数据集明确披露
- ✅ 训练日志与文档完整发布
这意味着任何研究人员、开发者或监管机构都可以追溯模型的每一个构建环节——从数据采集到最终训练结果,无一隐藏。
这种“全栈透明”模式,在当前主流大模型中极为罕见。大多数商业模型仅提供 API 接口,用户无法知晓其训练数据来源或内部机制。
为何要建一个“公共 AI”?
推动 AI 成为公共基础设施的核心倡导者、EPFL 研究员 约书亚・谭(Joshua Tan) 表示:
“当前,Apertus 是领先的公共 AI 模型:由公立机构打造,服务于公共利益。这是我们迄今为止最有力的证明——AI 完全可以成为像公路、供水、供电一样的公共基础设施。”
这一理念的背后,是对当前 AI 发展路径的深刻反思:
- 商业模型受利润驱动,可能牺牲隐私与公平;
- 数据来源不透明,存在版权与合规风险;
- 企业对模型拥有绝对控制权,用户无从干预。
而 Apertus 的目标,是让 AI 回归公共服务本质:非营利、可审计、受法规约束、服务于社会整体利益。
合规优先:专为欧洲法规设计
Apertus 的研发严格遵循 瑞士数据保护法 与 版权法,并充分尊重网站的 robots.txt 协议——当爬虫检测到“拒绝爬取”指令时,会主动停止抓取。
这与近年来多起 AI 数据争议形成鲜明对比:
- 某些企业被指控绕过反爬机制;
- 新闻机构、作家团体因内容被用于训练而提起诉讼。
对于高度注重数据合规的行业(如金融、医疗、政府),Apertus 提供了一个更具法律确定性的选择。
瑞士银行家协会此前指出,本土研发的大模型具有“巨大的长期潜力”,因为它们能更好地契合瑞士严格的数据本地化要求与银行保密制度。目前,瑞士金融机构已在使用各类 AI 模型处理客户服务、风险评估等任务,未来是否会转向 Apertus,虽尚无定论,但其合规优势无疑增加了吸引力。
技术规格:多语言支持,兼顾规模与效率
Apertus 目前提供两个版本,满足不同使用场景:
| 版本 | 参数量 | 适用场景 |
|---|---|---|
| Apertus-8B | 80 亿 | 轻量级部署、边缘设备、教学研究 |
| Apertus-70B | 700 亿 | 高性能推理、复杂任务处理、企业定制 |
训练数据涵盖 1000 多种语言,总 token 数达 15 万亿,其中 非英语数据占比 40%,包括瑞士德语、法语、意大利语以及罗曼什语等本土语言。
这一设计使其在处理多语种、小语种任务时具备天然优势,尤其适合瑞士多语言社会的实际需求。















