阶跃星辰发布 Step 3：开源最强多模态推理模型，推动“模芯”生态共建

147 0

在2025世界人工智能大会（WAIC）开幕前夕，中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”，将于7月31日面向全球开源，旨在为开发者和企业提供高性能、低成本、可落地的多模态AI解决方案。

地址：https://www.stepfun.com
GitHub：https://github.com/stepfun-ai/Step3
模型：https://huggingface.co/stepfun-ai/step3
魔塔：https://www.modelscope.cn/models/stepfun-ai/step3

与此同时，阶跃星辰宣布联合多家国内芯片与平台厂商，发起成立“模芯生态创新联盟”，推动模型与芯片产业链的深度协同。公司还与上海国有资本投资有限公司达成战略合作，进一步强化资本与生态联动。

从“能用”到“好用”：Step 3 的研发逻辑

阶跃星辰创始人、CEO姜大昕表示，从Step 1到Step 2的快速迭代，让团队深入思考一个问题：

“性能更强，是否就等于价值更高？”

在大模型进入以推理能力为核心的“推理时代”后，单一维度的性能提升已不足以满足真实场景需求。企业更关注的是综合能力：既要智能，也要高效；既要先进，也要可部署。

基于此，Step 3 的研发理念聚焦于四个核心维度：

✅ 强智能：具备跨模态复杂推理能力
✅ 低成本：系统级优化，显著降低推理开销
✅ 可开源：开放模型与技术细节，赋能开发者
✅ 多模态：原生支持图像、文本、音频等多模态输入输出

“我们不是追求参数规模的堆砌，而是致力于打造真正‘能用起来’的模型。”姜大昕说。

Step 3 核心特性

1. 原生多模态，性能达开源 SOTA

Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型，采用 MoE 架构，总参数量 3210亿，激活参数量 380亿。

它在多项权威基准测试中取得开源多模态模型中的领先成绩：

MMMU：复杂视觉理解任务
MathVision：数学与视觉信息交叉分析
SimpleVQA：日常视觉问答
AIME 2025：数学推理竞赛
LiveCodeBench (2024.08–2025.05)：代码生成与理解

这些表现验证了其在跨领域知识理解、视觉分析与复杂推理方面的强大能力。

2. 极致成本效益：推理效率行业领先

在确保性能的同时，Step 3 在推理效率上实现突破：

通过系统架构创新，显著提升解码效率；
在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%；
在英伟达 Hopper 架构芯片上进行分布式推理时，吞吐量提升超 70%；
所有优化均在不牺牲激活参数量、不降低注意力容量的前提下完成。

这一成果意味着，Step 3 能在中端及国产算力平台上高效运行，大幅降低企业部署成本。

目前，Step 3 已完成与多家国产芯片厂商的适配，并将于7月31日全球开源，同步发布技术报告，公开其系统架构创新细节。

技术报告地址：https://github.com/stepfun-ai/Step3

“1+N” 模型矩阵：构建全栈多模态能力

成立两年多来，阶跃星辰已构建起“1+N”大模型矩阵：

“1”：Step 3 基础大模型，作为智能底座；
“N”：面向具体场景的多模态模型，覆盖语音、视觉、图像生成、视频、音乐等方向。

本次WAIC期间，阶跃同步升级了以下模型：

Step 3o Vision：公司首个多模态理解与生成一体化模型，支持图文互生、复杂视觉推理；
Step-Audio 2：第二代端到端语音大模型，在语音识别、合成与理解任务上全面提升。

共建“模芯生态创新联盟”

为加速大模型在真实场景中的落地，阶跃星辰联合国内多家芯片与平台厂商，发起成立“模芯生态创新联盟”。该联盟将聚焦：

模型与芯片的联合优化；
推理框架与硬件的深度适配；
开源生态与产业应用的协同创新。

此举是为了打破“模型强、算力弱”“国外模型适配高端芯片、国产芯片难发挥性能”的困局，推动中国AI产业链的自主可控。

文章版权归作者所有，未经允许请勿转载。

阿里达摩院开源多语言大语言模型Babel：解决现有开源多语言模型在语言覆盖上的不足

大语言模型 # Babel # 多语言大语言模型 # 阿里达摩院

1年前

02540

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

大语言模型 # DeepSeek # DeepSeek-R1-0528-Qwen3-8B # 深度求索

10个月前

02730

Ai2 发布 Olmo Hybrid：混合架构的“效率革命”，用一半数据训练出同等能力的 7B 模型

大语言模型 # Olmo Hybrid # 艾伦AI研究所

1个月前

0290

快手 Kwaipilot 团队开源 40B 大模型 KAT-V1-40B ：用 AutoThink 实现智能“何时思考”

大语言模型 # KAT-V1-40B # 快手

9个月前

01380

暂无评论

暂无评论...

阶跃星辰发布 Step 3：开源最强多模态推理模型，推动“模芯”生态共建

从“能用”到“好用”：Step 3 的研发逻辑

Step 3 核心特性

1. 原生多模态，性能达开源 SOTA

2. 极致成本效益：推理效率行业领先

“1+N” 模型矩阵：构建全栈多模态能力

共建“模芯生态创新联盟”

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

相关文章

阿里达摩院开源多语言大语言模型Babel：解决现有开源多语言模型在语言覆盖上的不足

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

Ai2 发布 Olmo Hybrid：混合架构的“效率革命”，用一半数据训练出同等能力的 7B 模型

快手 Kwaipilot 团队开源 40B 大模型 KAT-V1-40B ：用 AutoThink 实现智能“何时思考”

暂无评论

文章

新面壁智能发布 VoxCPM2：20亿参数、无离散 Tokenizer 的开源语音合成新标杆

2026 年Coding Plan 深度横评：谁才是“养龙虾”的性价比之王？

Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

Illustrious XL v2.0正式发布，支持1024x1536原生分辨率生成

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

美团开源 5677 亿参数 LongCat-Flash-Prover：专攻数学证明，MiniF2F 通过率高达 97.1%

S.H.I.T

Tripo

ITELLOU

Flova

TapNow

waoo

阶跃星辰发布 Step 3：开源最强多模态推理模型，推动“模芯”生态共建

从“能用”到“好用”：Step 3 的研发逻辑

Step 3 核心特性

1. 原生多模态，性能达开源 SOTA

2. 极致成本效益：推理效率行业领先

“1+N” 模型矩阵：构建全栈多模态能力

共建“模芯生态创新联盟”

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

相关文章

文章

标签云

网址

S.H.I.T

Tripo

ITELLOU

Flova

TapNow

waoo