Slate

3天前发布 9 00

总部位于旧金山、由 Y Combinator 支持的初创公司 Random Labs 正式发布了 Slate V1,据称是业界首个"群体原生"自主编码智能体,执行大规模并行的复杂工程任务。

所在地:
美国
收录时间:
2026-03-14
其他站点:

在 AI 编程助手日益普及的今天,软件工程界正面临一个尴尬的“能力悖论”:大模型越来越聪明,但在处理长周期、高复杂度的实际工程任务时,往往因上下文窗口限制和状态管理混乱而“智障化”。

由 Y Combinator 支持的初创公司 Random Labs 正式结束公测,发布 Slate V1。这款被定义为业界首个“群体原生”(Swarm-Native)自主编码智能体,不再试图用单个模型解决所有问题,而是通过创新的“线程编织”(Thread Weaving)架构,调度多个模型并行协作,将 AI 编程从“单兵作战”带入了“军团协同”时代。

 Slate

核心突破:从“单一大脑”到“群体智慧”

Slate V1 的核心理念并非替代人类开发者,而是成为“下一个 2000 万工程师”的协作伙伴。它通过模拟人类组织的分工协作机制,解决了传统 AI 助手在复杂任务中的瓶颈。

1. 架构创新:Thread Weaving(线程编织)

传统 AI 助手通常采用“有损压缩”来维持长上下文,极易丢失关键信息。Slate 引入了全新的原语:

  • 情景记忆(Episodic Memory):辅助线程完成任务后,不返回冗长的试错日志,而是生成一个压缩的情景摘要(包含成功调用和结论)。
  • 共享上下文:这些情景直接与核心编排器共享,形成一种持久的“群体记忆”,确保系统始终掌握项目的全局状态,而非碎片化的对话历史。

2. 运行逻辑:行动空间中的“操作系统”

受 Andrej Karpathy “LLM OS” 概念启发,Slate 将自身构建为一个操作系统:

  • 内核(Orchestrator):一个核心的编排线程,负责战略规划和任务分发。它不直接写代码,而是使用基于 TypeScript 的领域特定语言 (DSL) 来定义执行图。
  • 进程(Worker Threads):多个并行的辅助线程,负责具体的战术执行(如写函数、跑测试、查文档)。
  • 动态修剪:利用递归语言模型技术,主动管理上下文窗口,决定哪些信息保留(作为内存),哪些丢弃,从而在有限资源下实现无限扩展。

3. 多模型协同:让合适的模型做合适的事

Slate 支持异构模型集群同时工作,实现成本与性能的最优解:

  • 战略层:调用 Claude Sonnet 进行复杂的架构重构规划。
  • 执行层:指派 GPT-5.4 进行具体的代码编写。
  • 研究层:后台运行 GLM 5 实时检索最新的库文档。
  • 优势:用户无需为简单的战术步骤支付高昂的“智能溢价”,同时又能享受顶级模型的深度推理能力。

实测表现:稳定性碾压单体模型

Slate V1 的稳定性是其最大卖点。在严苛的 Terminal Bench 2.0 测试中:

  • 任务make-mips-interpreter(一个极具挑战性的编译器构建任务)。
  • 成绩:Slate 早期版本成功率达到 2/3
  • 对比:即使是最新的前沿模型,在非编排的单体框架下,该任务成功率通常低于 20%

一位纽约金融科技创始人评价道:“Slate 是我用过的最佳调试工具。”这印证了 Random Labs 的愿景:构建能像组织一样扩展、能在变化环境中稳定运行的智能体。

商业模式与生态集成

  • 计费模式:采用基于使用量的信用点(Credit)模式。用户可以通过 /usage 和 /billing 命令实时监控消耗,组织级计费开关表明其明确指向专业工程团队
  • 开放集成:Slate 定位为卓越的编排层,而非模型竞争者。
    • 下周将正式支持 OpenAI Codex 和 Anthropic Claude Code 的原生接口。
    • 通过子线程复用最大化缓存,降低群体协作的经济成本。

数据统计

相关导航

暂无评论

none
暂无评论...