上海AI实验室发布书生 Intern-S1:专为科研打造的多模态AI助手

多模态模型4个月前更新 小马良
235 0

上海AI实验室正式推出 Intern-S1 —— 一款具备强大科学理解能力的开源多模态推理模型。它不仅在通用任务上表现卓越,更在化学、生物、数学、物理等多个科学领域达到最先进的性能水平,部分指标甚至超越当前主流闭源商业模型。

Intern-S1 的诞生,标志着开源模型在真实科研场景中的可用性迈出了关键一步。

模型库

Intern-S1

BF16FP8GGUF
HuggingFaceIntern-S1Intern-S1-FP8Intern-S1-GGUF
 ModelScopeIntern-S1Intern-S1-FP8Intern-S1-GGUF

Intern-S1-mini

BF16FP8GGUF
HuggingFaceIntern-S1-miniIntern-S1-mini-FP8Intern-S1-mini-GGUF
 ModelScopeIntern-S1-miniIntern-S1-mini-FP8-
上海AI实验室发布书生 Intern-S1:专为科研打造的多模态AI助手

模型架构:大模型 + 专业数据 + 领域感知

Intern-S1 基于两大核心组件构建:

  • 语言模型:以通义千问 Qwen3 的 235B MoE 架构为基础,支持高效推理与知识表达;
  • 视觉编码器:采用自研的 6B InternViT,具备高分辨率感知与细粒度视觉理解能力。

在此基础上,团队在 5T token 的多模态数据上对模型进行了持续预训练,其中超过 2.5T token 来自科学领域,涵盖:

  • 化学文献与分子数据库
  • 生物医学论文与蛋白质序列
  • 数理公式与教科书图像
  • 地球科学信号(如地震波形)
  • 工程图纸与实验图表

这一训练策略使 Intern-S1 在保留强大通用能力的同时,深度融入了跨学科专业知识,成为真正意义上的“科研AI助手”。

核心特性

1. 科学任务专项优化

Intern-S1 能够完成一系列高难度科研任务,包括但不限于:

  • 解析化学结构式(SMILES、InChI、分子图)
  • 理解蛋白质序列与功能关系
  • 规划有机化合物合成路径
  • 推理解题数学与物理竞赛题
  • 分析地球科学图表与信号数据

2. 动态分词器原生支持专业符号

传统语言模型难以处理非文本数据,而 Intern-S1 引入了动态分词机制,可直接理解以下专业格式:

  • 分子式(如 C₆H₁₂O₆)
  • 蛋白质序列(如 MET-ALA-SER...)
  • 数学表达式(LaTeX 风格)
  • 地震波形编码、电路图符号等

无需额外插件或后处理,实现端到端的专业内容理解。

3. 多模态深度融合

模型支持图文联合输入,能准确关联图像中的图表、结构式与对应文字描述,实现跨模态语义对齐,在科研论文解析、实验报告生成等任务中表现优异。

模型下载:全精度覆盖,灵活部署

为满足不同硬件环境需求,Intern-S1 提供多种量化版本,均已开源。

精度格式Hugging FaceModelScope
BF16(原始精度)internlm/Intern-S1Shanghai_AI_Laboratory/Intern-S1
FP8(低精度优化)internlm/Intern-S1-FP8Shanghai_AI_Laboratory/Intern-S1-FP8
GGUF(本地推理友好)internlm/Intern-S1-GGUF-

✅ 支持主流框架加载,兼容 Llama.cpp、vLLM、Transformers 等生态工具。

性能评估:全面对标主流模型

我们在多个通用与专业基准上对 Intern-S1 进行了系统评估,对比对象包括 Qwen、Gemini、Kimi、Grok、DS-R1 等先进视觉语言模型(VLMs)和大语言模型(LLMs)。

✅ 表示在开源模型中排名第一
👑 表示在所有参评模型中排名第一

评测集Intern-S1最优闭源模型关键领域
MMLU-Pro83.5 ✅Gemini 2.5 Pro (86.0)通用知识
MMMU77.7 ✅o3 (80.8)多模态理解
GPQA77.3Grok-4 (87.5)高阶科学问答
MMStar74.9 ✅o3 (75.1)多模态推理
MathVista81.5 👑-数学图表理解
AIME202586.0Grok-4 (91.7)数学竞赛
MathVision62.5 ✅o3 (67.7)视觉数学题
IFEval86.7Grok-4 (92.8)指令遵循
SFE44.3 👑DS-R1-0528 (43.0)科学事实提取
Physics44.0 ✅o3 (47.9)物理问题求解
SmolInstruct51.0 👑Grok-4 (47.3)化学指令执行
ChemBench83.4 👑Gemini 2.5 Pro (82.8)化学综合能力
MatBench75.0 👑Grok-4 (67.9)材料科学
MicroVQA63.9 👑DS-R1-0528 (63.1)显微图像问答
ProteinLMBench63.1Kimi-K2 (66.7)蛋白质语言模型
MSEarthMCQ65.7 👑o3 (61.0)地球科学
XLRS-Bench55.0 👑Grok-4 (45.4)跨语言科学理解

关键结论:

  • 在 16 项评测中,Intern-S1 在 7 项中取得全局第一(👑),在 5 项中位列开源第一(✅)
  • 特别在 化学(ChemBench)、材料(MatBench)、地球科学(MSEarthMCQ) 等专业领域全面领先;
  • MathVista 上以 81.5 分刷新纪录,成为首个在该数学视觉任务上突破 80 的模型;
  • 在 SmolInstruct(化学任务) 上显著优于其他模型,展现其在科研流程自动化中的潜力。
© 版权声明

相关文章

暂无评论

none
暂无评论...