阿里Qwen项目组正式推出Qwen3-Coder系列代码模型,这是其迄今代理能力最强的代码模型版本,其中旗舰款Qwen3-Coder-480B-A35B-Instruct更是拉满配置——总参数量480B、激活35B的MoE架构,原生支持256K token上下文且可通过YaRN扩展至1M,在Agentic Coding(代理式编程)、Agentic Browser-Use(代理式浏览器使用)、Agentic Tool-Use(代理式工具调用)三大核心任务上斩获开源模型SOTA,性能直追Claude Sonnet4。
- GitHub:https://github.com/QwenLM/Qwen3-Coder
- Hugging Face:https://huggingface.co/collections/Qwen/qwen3-coder-next
- 魔塔:https://modelscope.cn/collections/Qwen/Qwen3-Coder-Next
同时,Qwen团队还同步开源了专为AI编程打造的命令行工具Qwen Code,并实现了与Claude Code、Cline等社区优秀编程工具的兼容适配,让Qwen3-Coder能无缝融入各类开发流程,真正实现Agentic Coding in the World(智能体编程无处不在)。

旗舰模型核心亮点:大参数量MoE+超长上下文,开源编程代理新标杆
Qwen3-Coder-480B-A35B-Instruct作为系列最强版本,从架构、上下文、能力三大维度实现突破,专为复杂代理式编程场景打造:
- MoE高效架构:总参480B,实际激活仅35B,兼顾大模型的能力深度与推理效率,降低部署和使用成本;
- 超长上下文支持:原生256K token,可扩展至1M token,针对仓库级代码开发、Pull Request等动态长文本场景深度优化,轻松处理大规模代码工程;
- 顶级代理能力:在Agentic Coding、浏览器/工具调用等代理式任务上达成开源SOTA,可与闭源的Claude Sonnet4媲美,能自主规划、调用工具、处理反馈完成复杂编程任务;
- 多工具兼容:不仅适配官方Qwen Code,还能与Claude Code、Cline无缝结合,作为基础模型可落地于各类数字开发场景。

预训练:四重Scaling升级,夯实代码能力基础
Qwen3-Coder的强悍能力,源于预训练阶段从数据、上下文、数据质量等多维度的深度打磨,同时兼顾通用能力与数学能力,让模型不止会写代码,更能理解复杂编程逻辑:
- 数据规模扩展:训练数据总计7.5T,其中代码占比70%,在海量代码数据中锤炼核心编程能力,同时保留通用与数学能力,适配多场景编程需求;
- 上下文长度扩展:原生支持256K token,为仓库级代码开发、长文本需求的编程任务量身定制,还可通过YaRN技术拓展至1M token,解锁超长篇代码处理能力;
- 合成数据扩展:利用Qwen2.5-Coder对低质量训练数据进行清洗和重写,大幅提升整体数据质量,从源头保证模型学习的有效性;
- 针对性场景优化:专为Agentic Coding(代理式编程)优化,让模型能更好地理解代理任务逻辑,适配工具调用、自主规划等复杂场景。
后训练:两大RL技术突破,解锁真实世界编程能力
与社区多数聚焦竞赛类代码生成的模型不同,Qwen3-Coder的后训练阶段聚焦真实软件工程场景,通过两大强化学习(RL)技术的规模化落地,让模型从“会写代码”升级为“能解决实际编程问题”,核心遵循Hard to Solve, Easy to Verify(难解决、易验证) 原则。
1. Scaling Code RL:强化代码执行成功率
针对所有代码任务天然适合“执行驱动验证”的特点,Qwen团队在更丰富的真实代码任务上扩展Code RL训练:通过自动扩展测试样例,构造大量高质量训练实例,充分释放强化学习潜力。这一优化不仅让模型的代码执行成功率大幅提升,还对其他编程任务形成能力增益,为后续探索更多难解决、易验证的任务打下基础。

2. Scaling Long-Horizon RL:适配复杂长周期软件工程
真实世界的软件工程任务(如SWE-Bench基准测试),需要模型在环境中持续交互、自主规划步骤、选择工具调用、接收反馈并调整决策,属于典型的长周期强化学习(Long-Horizon RL) 任务。

Qwen3-Coder在后训练中执行Agent RL训练,针对性解决长周期RL的核心痛点——环境规模化(Environment Scaling):基于阿里云基础设施,实现20k独立环境同时运行,打造了可验证的环境扩展系统,能为模型提供大规模的强化学习反馈和评测。最终,模型在SWE-bench Verified基准测试中拿下开源模型SOTA,成为解决真实软件工程问题的开源佼佼者。
快速上手:多工具适配,一键解锁Qwen3-Coder编程能力
Qwen3-Coder打造了极致友好的使用体验,不仅推出官方CLI工具Qwen Code,还完美兼容Claude Code、Cline等社区热门编程工具,同时支持百炼API调用,覆盖命令行、第三方工具、代码调用等多种使用场景,开发者可按需选择。
方式1:官方CLI工具——Qwen Code(推荐,专为Qwen3-Coder优化)
Qwen Code基于Gemini Code二次开发,针对Qwen3-Coder系列优化了解析器和工具支持,能最大程度激发模型的Agentic Coding能力,需Node.js 20及以上版本。
步骤1:安装Node.js(若未安装)
curl -qL https://www.npmjs.com/install.sh | sh
步骤2:安装Qwen Code
npm install -g qwen-code
(也可从项目源码手动安装,适配开发定制需求)
步骤3:配置环境变量(或写入.env文件)
export OPENAI_API_KEY="your_api_key_here" # 阿里云百炼平台获取
export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"
步骤4:启动使用
qwen
即可进入Qwen Code交互界面,体验代理式编程能力。
方式2:兼容社区工具——Claude Code
将Qwen3-Coder与Claude Code搭配使用,可结合Claude Code的交互优势与Qwen3-Coder的开源能力,需先从阿里云百炼平台申请API Key。
步骤1:安装Claude Code
npm install -g @anthropic-ai/claude-code
步骤2:两种接入方式二选一
方案1:使用百炼代理API(简单直接)
直接将Anthropic的base url替换为阿里云百炼提供的endpoint,即可无缝调用Qwen3-Coder。
方案2:使用claude-code-config自定义路由(灵活适配)
借助第三方路由工具claude-code-router切换后端API,百炼提供专属扩展包生成默认配置:
# 生成配置文件和插件目录
npx claude-code-config init
# 启动Claude Code并调用Qwen3-Coder
ccr
(可手动调整~/.claude-code-router/下的配置,适配个性化需求)
方式3:兼容社区工具——Cline
通过简单配置,即可在Cline中调用Qwen3-Coder-480B-A35B-Instruct:
- 进入Cline的配置设置界面;
- 选择OpenAI Compatible(OpenAI兼容)模式;
- 在OpenAI Compatible API tokens处,输入从阿里云百炼获取的密钥;
- 勾选使用自定义基础URL,输入:
https://dashscope.aliyuncs.com/compatible-mode/v1; - 输入模型名称:
qwen3-coder-plus,保存配置即可使用。
方式4:百炼API调用——Python代码示例
若希望通过阿里百炼API平台(Alibaba Cloud Model Studio)在代码中直接调用Qwen3-Coder,可参考以下Python示例(基于OpenAI SDK):
import os
from openai import OpenAI
# 初始化客户端,配置百炼API信息
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"), # 环境变量中配置百炼API Key
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
# 定义编程需求提示词
prompt = "Help me create a web page for an online bookstore."
# 调用Qwen3-Coder模型
completion = client.chat.completions.create(
model="qwen3-coder-plus",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": prompt}
],
)
# 打印生成结果
print(completion.choices[0].message.content.strip())
未来规划:轻量化模型+自改进探索,持续解放编程生产力
Qwen项目组表示,本次Qwen3-Coder的发布只是开始,后续将围绕降低使用成本、提升核心能力两大方向持续迭代,让代理式编程能力更易落地、更加强大:
- 推出多尺寸轻量化模型:在保证核心能力的前提下,开发更小参数量的Qwen3-Coder版本,降低部署和推理开销,让更多开发者、小团队能轻松使用;
- 深耕复杂软件工程任务:让Qwen3-Coder承担更多复杂软件工程中的繁琐任务,进一步解放人类开发者的生产力,聚焦创意和核心逻辑设计;
- 探索Coding Agent自改进(self-improving):这是团队重点探索的激动人心的方向,让代码代理模型具备自我优化、自我提升的能力,实现能力的持续进化。















