上海AI实验室正式推出 Intern-S1 —— 一款具备强大科学理解能力的开源多模态推理模型。它不仅在通用任务上表现卓越,更在化学、生物、数学、物理等多个科学领域达到最先进的性能水平,部分指标甚至超越当前主流闭源商业模型。
Intern-S1 的诞生,标志着开源模型在真实科研场景中的可用性迈出了关键一步。
模型库
Intern-S1
| BF16 | FP8 | GGUF | |
|---|---|---|---|
| HuggingFace | Intern-S1 | Intern-S1-FP8 | Intern-S1-GGUF |
| ModelScope | Intern-S1 | Intern-S1-FP8 | Intern-S1-GGUF |
Intern-S1-mini
| BF16 | FP8 | GGUF | |
|---|---|---|---|
| HuggingFace | Intern-S1-mini | Intern-S1-mini-FP8 | Intern-S1-mini-GGUF |
| ModelScope | Intern-S1-mini | Intern-S1-mini-FP8 | - |

模型架构:大模型 + 专业数据 + 领域感知
Intern-S1 基于两大核心组件构建:
- 语言模型:以通义千问 Qwen3 的 235B MoE 架构为基础,支持高效推理与知识表达;
- 视觉编码器:采用自研的 6B InternViT,具备高分辨率感知与细粒度视觉理解能力。
在此基础上,团队在 5T token 的多模态数据上对模型进行了持续预训练,其中超过 2.5T token 来自科学领域,涵盖:
- 化学文献与分子数据库
- 生物医学论文与蛋白质序列
- 数理公式与教科书图像
- 地球科学信号(如地震波形)
- 工程图纸与实验图表
这一训练策略使 Intern-S1 在保留强大通用能力的同时,深度融入了跨学科专业知识,成为真正意义上的“科研AI助手”。
核心特性
1. 科学任务专项优化
Intern-S1 能够完成一系列高难度科研任务,包括但不限于:
- 解析化学结构式(SMILES、InChI、分子图)
- 理解蛋白质序列与功能关系
- 规划有机化合物合成路径
- 推理解题数学与物理竞赛题
- 分析地球科学图表与信号数据
2. 动态分词器原生支持专业符号
传统语言模型难以处理非文本数据,而 Intern-S1 引入了动态分词机制,可直接理解以下专业格式:
- 分子式(如 C₆H₁₂O₆)
- 蛋白质序列(如 MET-ALA-SER...)
- 数学表达式(LaTeX 风格)
- 地震波形编码、电路图符号等
无需额外插件或后处理,实现端到端的专业内容理解。
3. 多模态深度融合
模型支持图文联合输入,能准确关联图像中的图表、结构式与对应文字描述,实现跨模态语义对齐,在科研论文解析、实验报告生成等任务中表现优异。
模型下载:全精度覆盖,灵活部署
为满足不同硬件环境需求,Intern-S1 提供多种量化版本,均已开源。
| 精度格式 | Hugging Face | ModelScope |
|---|---|---|
| BF16(原始精度) | internlm/Intern-S1 | Shanghai_AI_Laboratory/Intern-S1 |
| FP8(低精度优化) | internlm/Intern-S1-FP8 | Shanghai_AI_Laboratory/Intern-S1-FP8 |
| GGUF(本地推理友好) | internlm/Intern-S1-GGUF | - |
✅ 支持主流框架加载,兼容 Llama.cpp、vLLM、Transformers 等生态工具。
性能评估:全面对标主流模型
我们在多个通用与专业基准上对 Intern-S1 进行了系统评估,对比对象包括 Qwen、Gemini、Kimi、Grok、DS-R1 等先进视觉语言模型(VLMs)和大语言模型(LLMs)。
✅ 表示在开源模型中排名第一
👑 表示在所有参评模型中排名第一
| 评测集 | Intern-S1 | 最优闭源模型 | 关键领域 |
|---|---|---|---|
| MMLU-Pro | 83.5 ✅ | Gemini 2.5 Pro (86.0) | 通用知识 |
| MMMU | 77.7 ✅ | o3 (80.8) | 多模态理解 |
| GPQA | 77.3 | Grok-4 (87.5) | 高阶科学问答 |
| MMStar | 74.9 ✅ | o3 (75.1) | 多模态推理 |
| MathVista | 81.5 👑 | - | 数学图表理解 |
| AIME2025 | 86.0 | Grok-4 (91.7) | 数学竞赛 |
| MathVision | 62.5 ✅ | o3 (67.7) | 视觉数学题 |
| IFEval | 86.7 | Grok-4 (92.8) | 指令遵循 |
| SFE | 44.3 👑 | DS-R1-0528 (43.0) | 科学事实提取 |
| Physics | 44.0 ✅ | o3 (47.9) | 物理问题求解 |
| SmolInstruct | 51.0 👑 | Grok-4 (47.3) | 化学指令执行 |
| ChemBench | 83.4 👑 | Gemini 2.5 Pro (82.8) | 化学综合能力 |
| MatBench | 75.0 👑 | Grok-4 (67.9) | 材料科学 |
| MicroVQA | 63.9 👑 | DS-R1-0528 (63.1) | 显微图像问答 |
| ProteinLMBench | 63.1 | Kimi-K2 (66.7) | 蛋白质语言模型 |
| MSEarthMCQ | 65.7 👑 | o3 (61.0) | 地球科学 |
| XLRS-Bench | 55.0 👑 | Grok-4 (45.4) | 跨语言科学理解 |
关键结论:
- 在 16 项评测中,Intern-S1 在 7 项中取得全局第一(👑),在 5 项中位列开源第一(✅);
- 特别在 化学(ChemBench)、材料(MatBench)、地球科学(MSEarthMCQ) 等专业领域全面领先;
- MathVista 上以 81.5 分刷新纪录,成为首个在该数学视觉任务上突破 80 的模型;
- 在 SmolInstruct(化学任务) 上显著优于其他模型,展现其在科研流程自动化中的潜力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















