在2025世界人工智能大会(WAIC)开幕前夕,中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”,将于7月31日面向全球开源,旨在为开发者和企业提供高性能、低成本、可落地的多模态AI解决方案。
- 地址:https://www.stepfun.com
- GitHub:https://github.com/stepfun-ai/Step3
- 模型:https://huggingface.co/stepfun-ai/step3
- 魔塔:https://www.modelscope.cn/models/stepfun-ai/step3

与此同时,阶跃星辰宣布联合多家国内芯片与平台厂商,发起成立“模芯生态创新联盟”,推动模型与芯片产业链的深度协同。公司还与上海国有资本投资有限公司达成战略合作,进一步强化资本与生态联动。

从“能用”到“好用”:Step 3 的研发逻辑
阶跃星辰创始人、CEO姜大昕表示,从Step 1到Step 2的快速迭代,让团队深入思考一个问题:
“性能更强,是否就等于价值更高?”
在大模型进入以推理能力为核心的“推理时代”后,单一维度的性能提升已不足以满足真实场景需求。企业更关注的是综合能力:既要智能,也要高效;既要先进,也要可部署。
基于此,Step 3 的研发理念聚焦于四个核心维度:
- ✅ 强智能:具备跨模态复杂推理能力
- ✅ 低成本:系统级优化,显著降低推理开销
- ✅ 可开源:开放模型与技术细节,赋能开发者
- ✅ 多模态:原生支持图像、文本、音频等多模态输入输出
“我们不是追求参数规模的堆砌,而是致力于打造真正‘能用起来’的模型。”姜大昕说。
Step 3 核心特性
1. 原生多模态,性能达开源 SOTA
Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,采用 MoE 架构,总参数量 3210亿,激活参数量 380亿。
它在多项权威基准测试中取得开源多模态模型中的领先成绩:
- MMMU:复杂视觉理解任务
- MathVision:数学与视觉信息交叉分析
- SimpleVQA:日常视觉问答
- AIME 2025:数学推理竞赛
- LiveCodeBench (2024.08–2025.05):代码生成与理解
这些表现验证了其在跨领域知识理解、视觉分析与复杂推理方面的强大能力。

2. 极致成本效益:推理效率行业领先
在确保性能的同时,Step 3 在推理效率上实现突破:
- 通过系统架构创新,显著提升解码效率;
- 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%;
- 在英伟达 Hopper 架构芯片上进行分布式推理时,吞吐量提升超 70%;
- 所有优化均在不牺牲激活参数量、不降低注意力容量的前提下完成。
这一成果意味着,Step 3 能在中端及国产算力平台上高效运行,大幅降低企业部署成本。
目前,Step 3 已完成与多家国产芯片厂商的适配,并将于7月31日全球开源,同步发布技术报告,公开其系统架构创新细节。

“1+N” 模型矩阵:构建全栈多模态能力
成立两年多来,阶跃星辰已构建起“1+N”大模型矩阵:
- “1”:Step 3 基础大模型,作为智能底座;
- “N”:面向具体场景的多模态模型,覆盖语音、视觉、图像生成、视频、音乐等方向。
本次WAIC期间,阶跃同步升级了以下模型:
- Step 3o Vision:公司首个多模态理解与生成一体化模型,支持图文互生、复杂视觉推理;
- Step-Audio 2:第二代端到端语音大模型,在语音识别、合成与理解任务上全面提升。
共建“模芯生态创新联盟”
为加速大模型在真实场景中的落地,阶跃星辰联合国内多家芯片与平台厂商,发起成立“模芯生态创新联盟”。该联盟将聚焦:
- 模型与芯片的联合优化;
- 推理框架与硬件的深度适配;
- 开源生态与产业应用的协同创新。
此举是为了打破“模型强、算力弱”“国外模型适配高端芯片、国产芯片难发挥性能”的困局,推动中国AI产业链的自主可控。















