上下文工程学 - 什么是上下文工程学，以及需要考虑的技术

科普9个月前发布小马良

203 0

虽然“上下文工程”这一术语背后的原理并非全新，但这个措辞提供了一个有用的抽象概念，使我们能够思考构建有效 AI 代理时面临的最紧迫挑战。在本文中，我想探讨三件事：上下文工程的含义、它与“提示工程”的区别。

什么是上下文工程

AI 代理需要与任务相关的上下文，才能以合理的方式执行该任务。我们早已知道这一点，但鉴于 AI 领域的快速发展与新鲜感，我们不断提出新的抽象概念，以便以易于理解的方式探讨最佳实践和新方法。

Andrey Karpathy 的帖子对此做了很好的总结：

人们将提示与日常使用中给 LLM 的简短任务描述联系起来。然而，在每一个工业级 LLM 应用中，上下文工程是一门精妙的艺术与科学，旨在为下一步填充恰到好处的上下文信息。

虽然“提示工程”专注于为 LLM 提供正确的指令，但“上下文工程”更侧重于为 LLM 的上下文窗口填充最相关的信息，无论这些信息来自何处。

你可能会问：“这不就是 RAG（检索增强生成）吗？这似乎很像专注于检索。”这个问题问得很好。但上下文工程这一术语让我们能够超越检索步骤，考虑上下文窗口作为一个需要谨慎策划的整体，同时也要考虑其限制：即上下文窗口的容量限制。

上下文的构成

在撰写这篇博客之前，我们阅读了 Philipp Schmid 的文章《AI 新技能不是提示工程，而是上下文工程》，他在文中很好地分解了 AI 代理或 LLM 上下文的构成。因此，我们基于他的列表并加入了一些补充内容，总结了“上下文”的构成：

系统提示/指令：为代理设定场景，说明我们希望它执行的任务类型。
用户输入：可以是问题、完成任务的请求等。
短期记忆或聊天历史：为 LLM 提供关于当前对话的上下文。
长期记忆：可用于存储和检索长期聊天历史或其他相关信息。
从知识库检索的信息：可以是基于向量搜索的数据库检索，也可以是通过 API 调用、MCP 工具或其他来源检索的相关信息。
工具及其定义：为 LLM 提供它可访问的工具的额外上下文。
工具的响应：将工具运行的响应返回给 LLM，作为额外的上下文。
结构化输出：提供我们期望从 LLM 获得的输出格式的上下文，也可以反过来为特定任务提供简洁的结构化信息。
全局状态/上下文：特别适用于使用 LlamaIndex 构建的代理，允许我们使用工作流的 Context 作为一种便签板，跨代理步骤存储和检索全局信息。

上述内容的某种组合几乎构成了当前所有代理 AI 应用的底层 LLM 的上下文。这引出了一个关键点：精确思考上述哪些内容应构成代理的上下文，以及以何种方式构成，正是上下文工程的核心。因此，让我们看看一些需要考虑上下文策略的场景，以及如何使用 LlamaIndex 和 LlamaCloud 实现这些策略。