阿里Qwen3-Coder重磅发布：480B MoE模型拿下开源Agent编程SOTA，媲美Claude Sonnet4

14 0

阿里Qwen项目组正式推出Qwen3-Coder系列代码模型，这是其迄今代理能力最强的代码模型版本，其中旗舰款Qwen3-Coder-480B-A35B-Instruct更是拉满配置——总参数量480B、激活35B的MoE架构，原生支持256K token上下文且可通过YaRN扩展至1M，在Agentic Coding（代理式编程）、Agentic Browser-Use（代理式浏览器使用）、Agentic Tool-Use（代理式工具调用）三大核心任务上斩获开源模型SOTA，性能直追Claude Sonnet4。

GitHub：https://github.com/QwenLM/Qwen3-Coder
Hugging Face：https://huggingface.co/collections/Qwen/qwen3-coder-next
魔塔：https://modelscope.cn/collections/Qwen/Qwen3-Coder-Next

同时，Qwen团队还同步开源了专为AI编程打造的命令行工具Qwen Code，并实现了与Claude Code、Cline等社区优秀编程工具的兼容适配，让Qwen3-Coder能无缝融入各类开发流程，真正实现Agentic Coding in the World（智能体编程无处不在）。

阿里Qwen3-Coder重磅发布：480B MoE模型拿下开源Agent编程SOTA，媲美Claude Sonnet4

旗舰模型核心亮点：大参数量MoE+超长上下文，开源编程代理新标杆

Qwen3-Coder-480B-A35B-Instruct作为系列最强版本，从架构、上下文、能力三大维度实现突破，专为复杂代理式编程场景打造：

MoE高效架构：总参480B，实际激活仅35B，兼顾大模型的能力深度与推理效率，降低部署和使用成本；
超长上下文支持：原生256K token，可扩展至1M token，针对仓库级代码开发、Pull Request等动态长文本场景深度优化，轻松处理大规模代码工程；
顶级代理能力：在Agentic Coding、浏览器/工具调用等代理式任务上达成开源SOTA，可与闭源的Claude Sonnet4媲美，能自主规划、调用工具、处理反馈完成复杂编程任务；
多工具兼容：不仅适配官方Qwen Code，还能与Claude Code、Cline无缝结合，作为基础模型可落地于各类数字开发场景。

预训练：四重Scaling升级，夯实代码能力基础

Qwen3-Coder的强悍能力，源于预训练阶段从数据、上下文、数据质量等多维度的深度打磨，同时兼顾通用能力与数学能力，让模型不止会写代码，更能理解复杂编程逻辑：

数据规模扩展：训练数据总计7.5T，其中代码占比70%，在海量代码数据中锤炼核心编程能力，同时保留通用与数学能力，适配多场景编程需求；
上下文长度扩展：原生支持256K token，为仓库级代码开发、长文本需求的编程任务量身定制，还可通过YaRN技术拓展至1M token，解锁超长篇代码处理能力；
合成数据扩展：利用Qwen2.5-Coder对低质量训练数据进行清洗和重写，大幅提升整体数据质量，从源头保证模型学习的有效性；
针对性场景优化：专为Agentic Coding（代理式编程）优化，让模型能更好地理解代理任务逻辑，适配工具调用、自主规划等复杂场景。

后训练：两大RL技术突破，解锁真实世界编程能力

与社区多数聚焦竞赛类代码生成的模型不同，Qwen3-Coder的后训练阶段聚焦真实软件工程场景，通过两大强化学习（RL）技术的规模化落地，让模型从“会写代码”升级为“能解决实际编程问题”，核心遵循Hard to Solve, Easy to Verify（难解决、易验证） 原则。

1. Scaling Code RL：强化代码执行成功率

针对所有代码任务天然适合“执行驱动验证”的特点，Qwen团队在更丰富的真实代码任务上扩展Code RL训练：通过自动扩展测试样例，构造大量高质量训练实例，充分释放强化学习潜力。这一优化不仅让模型的代码执行成功率大幅提升，还对其他编程任务形成能力增益，为后续探索更多难解决、易验证的任务打下基础。

2. Scaling Long-Horizon RL：适配复杂长周期软件工程

真实世界的软件工程任务（如SWE-Bench基准测试），需要模型在环境中持续交互、自主规划步骤、选择工具调用、接收反馈并调整决策，属于典型的长周期强化学习（Long-Horizon RL） 任务。

Qwen3-Coder在后训练中执行Agent RL训练，针对性解决长周期RL的核心痛点——环境规模化（Environment Scaling）：基于阿里云基础设施，实现20k独立环境同时运行，打造了可验证的环境扩展系统，能为模型提供大规模的强化学习反馈和评测。最终，模型在SWE-bench Verified基准测试中拿下开源模型SOTA，成为解决真实软件工程问题的开源佼佼者。

快速上手：多工具适配，一键解锁Qwen3-Coder编程能力

Qwen3-Coder打造了极致友好的使用体验，不仅推出官方CLI工具Qwen Code，还完美兼容Claude Code、Cline等社区热门编程工具，同时支持百炼API调用，覆盖命令行、第三方工具、代码调用等多种使用场景，开发者可按需选择。

方式1：官方CLI工具——Qwen Code（推荐，专为Qwen3-Coder优化）

Qwen Code基于Gemini Code二次开发，针对Qwen3-Coder系列优化了解析器和工具支持，能最大程度激发模型的Agentic Coding能力，需Node.js 20及以上版本。

步骤1：安装Node.js（若未安装）

curl -qL https://www.npmjs.com/install.sh | sh

步骤2：安装Qwen Code

npm install -g qwen-code

（也可从项目源码手动安装，适配开发定制需求）

步骤3：配置环境变量（或写入.env文件）

export OPENAI_API_KEY="your_api_key_here" # 阿里云百炼平台获取
export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"

步骤4：启动使用

qwen

即可进入Qwen Code交互界面，体验代理式编程能力。

方式2：兼容社区工具——Claude Code

将Qwen3-Coder与Claude Code搭配使用，可结合Claude Code的交互优势与Qwen3-Coder的开源能力，需先从阿里云百炼平台申请API Key。

步骤1：安装Claude Code

npm install -g @anthropic-ai/claude-code

步骤2：两种接入方式二选一

方案1：使用百炼代理API（简单直接）

直接将Anthropic的base url替换为阿里云百炼提供的endpoint，即可无缝调用Qwen3-Coder。

方案2：使用claude-code-config自定义路由（灵活适配）

借助第三方路由工具claude-code-router切换后端API，百炼提供专属扩展包生成默认配置：

# 生成配置文件和插件目录
npx claude-code-config init
# 启动Claude Code并调用Qwen3-Coder
ccr

（可手动调整~/.claude-code-router/下的配置，适配个性化需求）

方式3：兼容社区工具——Cline

通过简单配置，即可在Cline中调用Qwen3-Coder-480B-A35B-Instruct：

进入Cline的配置设置界面；
选择OpenAI Compatible（OpenAI兼容）模式；
在OpenAI Compatible API tokens处，输入从阿里云百炼获取的密钥；
勾选使用自定义基础URL，输入：https://dashscope.aliyuncs.com/compatible-mode/v1；
输入模型名称：qwen3-coder-plus，保存配置即可使用。

方式4：百炼API调用——Python代码示例

若希望通过阿里百炼API平台（Alibaba Cloud Model Studio）在代码中直接调用Qwen3-Coder，可参考以下Python示例（基于OpenAI SDK）：

import os
from openai import OpenAI

# 初始化客户端，配置百炼API信息
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"), # 环境变量中配置百炼API Key
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

# 定义编程需求提示词
prompt = "Help me create a web page for an online bookstore."

# 调用Qwen3-Coder模型
completion = client.chat.completions.create(
    model="qwen3-coder-plus",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": prompt}
    ],
)

# 打印生成结果
print(completion.choices[0].message.content.strip())

未来规划：轻量化模型+自改进探索，持续解放编程生产力

Qwen项目组表示，本次Qwen3-Coder的发布只是开始，后续将围绕降低使用成本、提升核心能力两大方向持续迭代，让代理式编程能力更易落地、更加强大：

推出多尺寸轻量化模型：在保证核心能力的前提下，开发更小参数量的Qwen3-Coder版本，降低部署和推理开销，让更多开发者、小团队能轻松使用；
深耕复杂软件工程任务：让Qwen3-Coder承担更多复杂软件工程中的繁琐任务，进一步解放人类开发者的生产力，聚焦创意和核心逻辑设计；
探索Coding Agent自改进（self-improving）：这是团队重点探索的激动人心的方向，让代码代理模型具备自我优化、自我提升的能力，实现能力的持续进化。