Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

48 0

Cursor 团队近日正式推出其智能编程模型 Composer 1.5，作为对前代 Composer 1 的重大升级。新版本聚焦于复杂、多步骤编程任务的处理能力，在推理深度、上下文管理和响应效率上均实现显著突破。

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

目前，Composer 1.5 已向所有用户开放，具体定价可查阅 Cursor 官方文档。

核心升级：从“生成代码”到“规划解决”

与传统代码补全模型不同，Composer 1.5 被设计为一个具备主动推理能力的编码代理。其三大关键技术改进如下：

1. 强化学习规模扩大 20 倍

训练过程中使用的强化学习（Reinforcement Learning, RL）步数达到前代的 20 倍。这意味着模型在大量编程任务中通过试错与反馈机制，更精细地学习了“如何正确解决问题”，而非仅模仿代码片段。结果是在困难场景（如算法实现、系统重构、跨文件调试）中表现更稳定、逻辑更严密。

2. 引入“思考 token”机制

Composer 1.5 在生成代码前，会先输出一系列不可见的“思考 token”（thought tokens），用于内部规划解题路径。这一机制模拟人类开发者“先想清楚再写”的过程，使模型能够：

分解复杂需求为子任务
评估多种实现方案
避免过早陷入局部最优解

该过程对用户透明，但显著提升了输出代码的结构合理性与可维护性。

3. 自我总结管理超长上下文

面对大型项目或长对话历史，模型通过递归自我总结（recursive self-summarization）动态压缩上下文信息。例如，在处理数千行代码的上下文时，Composer 1.5 会自动提炼关键变量、函数依赖和任务目标，从而在有限内存下维持高精度推理，避免因上下文截断导致的逻辑断裂。

性能表现：快而不浅，深而不慢

Cursor 强调，Composer 1.5 并非一味追求“深度思考”而牺牲响应速度。相反，它采用分层推理策略：

对简单任务（如单行补全、常见 API 调用），保持低延迟、即时响应；
对复杂任务（如实现新功能模块、修复并发 bug），自动启用深度推理模式。

早期用户在开发者论坛反馈，新模型在以下场景提升明显：

多文件协同修改的一致性
非结构化需求（如“优化这个循环性能”）的准确理解
生成带注释、错误处理和测试建议的完整函数

定位：面向专业开发者的日常智能协作者

Cursor 将 Composer 1.5 定位为日常编码工作流中的核心助手，而非仅用于演示或玩具项目。其强化学习驱动的持续优化路径，也表明团队致力于实现“可预测的能力提升”——每一次迭代都带来明确的工程价值。

对于需要处理大型代码库、频繁应对模糊需求或追求高质量自动化的开发者而言，Composer 1.5 提供了一种更可靠、更具规划能力的 AI 编码体验。

文章版权归作者所有，未经允许请勿转载。

小红书 Hi Lab 发布 1420 亿参数 MoE 大模型 dots.llm1：推理仅激活 140 亿参数，性能媲美 Qwen2.5-72B

大语言模型 # dots.llm1 # 小红书

9个月前

03700

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

大语言模型 # Apriel-1.5-15B-Thinker

5个月前

01530

新英伟达发布 Nemotron 3 Super：1200 亿参数 MoE 架构，智能体吞吐量飙升 5 倍

大语言模型 # NVIDIA Nemotron 3 Super # 英伟达

3小时前

030

Cursor推出Cursor Automations：从“编码助手”到“24/7 常驻智能体”，重塑软件工程工作流

早报 # Cursor # Cursor Automations

4天前

0430

暂无评论

暂无评论...

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

核心升级：从“生成代码”到“规划解决”

1. 强化学习规模扩大 20 倍

2. 引入“思考 token”机制

3. 自我总结管理超长上下文

性能表现：快而不浅，深而不慢

定位：面向专业开发者的日常智能协作者

Helcyon-Mercury-12B-v3.0：基于 Mistral Nemo 的高情感智能对话模型

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

相关文章

小红书 Hi Lab 发布 1420 亿参数 MoE 大模型 dots.llm1：推理仅激活 140 亿参数，性能媲美 Qwen2.5-72B

Apriel-1.5-15B-Thinker：用中期训练提升多模态推理效率

新英伟达发布 Nemotron 3 Super：1200 亿参数 MoE 架构，智能体吞吐量飙升 5 倍

Cursor推出Cursor Automations：从“编码助手”到“24/7 常驻智能体”，重塑软件工程工作流

暂无评论

文章

Kimi × OpenClaw 最新配置指南：原生支持Kimi K2.5，三步快速搭建智能体工作流

拒绝无效等待！在 Ollama 中灵活开关 Qwen3.5 思考模式，简单问题秒回，复杂问题深究

ComfyUI 原生支持 LTX-2.3：开源音视频生成的画质新标杆

Jina AI推出文本嵌入模型Jina Embeddings v4：多模态多语言检索的通用嵌入模型

Anthropic 为“退役”的 Claude 3 Opus 开设 Substack 专栏：全球首个 AI 博客实验，每周发布“退休思考”

Lightricks 双重重磅发布：LTX-2.3 模型进化与 LTX Desktop 开源编辑器，本地视频生成时代正式来临

S.H.I.T

新QClaw

CoPaw

waoo

新ArkClaw

新WorkBuddy

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

核心升级：从“生成代码”到“规划解决”

1. 强化学习规模扩大 20 倍

2. 引入“思考 token”机制

3. 自我总结管理超长上下文

性能表现：快而不浅，深而不慢

定位：面向专业开发者的日常智能协作者

Helcyon-Mercury-12B-v3.0：基于 Mistral Nemo 的高情感智能对话模型

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

相关文章

文章

标签云

网址

S.H.I.T

新QClaw

CoPaw

waoo

新ArkClaw

新WorkBuddy