上下文工程：构建下一代 AI 应用的核心

AI资讯 7个月前 charles

12.3K 0 45

随着#大语言模型（LLM）的快速发展，AI 应用正从简单的单次问答，进化为更复杂的、具备代理（Agent）能力的动态系统。

在这一演进过程中，一个核心挑战浮出水面：当一个智能 #Agent 表现不佳时，根本原因往往并非模型能力不足，而是它未能获得完成任务所需的、恰当的上下文信息。

关注公众号 #极客开源 👆 获取最新一手#AI大模型 #开源项目信息，如果这篇文章对你有用，可以点个“♥️推荐”，听说会影响公众号推荐算法。

上下文工程（Context Engineering）正是在这样的背景下，成为 #AI应用开发者需要掌握的关键技能。

什么是上下文工程？

上下文工程的核心定义是：构建一个动态系统，以正确的格式，提供正确的信息和工具，从而让大语言模型能够合理地完成指定任务。

MCP协议与大模型集成实战：从协议设计到智能体开发" data-type="1">

大模型应用开发者可能或多或少都了解过 #MCP协议，如果想系统理解并且实战上手开发，推荐这本《MCP协议与大模型集成实战》新书。

这个定义包含几个关键点：

1. 它是一个动态系统：复杂的 #AI应用需要从多个来源获取上下文，包括开发者的预设指令、用户的实时输入、历史交互记录、外部工具的调用结果等。上下文工程旨在构建一个能够动态整合这些信息的系统，而非依赖静态、写死的提示词。

2. 它需要正确的信息：大语言模型无法凭空猜测。如果缺少关键信息，它就无法做出正确的决策。所谓"垃圾进，垃圾出"，提供高质量、高相关度的信息是系统成功的基石。

3. 它需要正确的工具：很多时候，仅靠初始信息是无法解决问题的。必须赋予 Agent 使用工具的能力，例如查询数据库、调用 #API、浏览网页等。提供正确的工具和提供正确的信息同等重要。

4. 格式至关重要：与模型沟通的方式会直接影响其表现。一个结构清晰、简明扼要的错误报告，远比一个庞大的、未经处理的 #JSON 数据块要有效。如何设计工具的输入输出参数，同样深刻影响着模型使用工具的成功率。

在设计和调试系统时，开发者可以时常自问一个问题："在当前的上下文下，AI 有可能合理地完成任务吗？" 这个问题有助于将失败归因于上下文的缺失，还是模型本身的失误，从而找到正确的优化方向。

上下文工程、提示词工程与 Agent 记忆

为了更好地理解上下文工程，可以将其与另外两个密切相关的概念——"提示词工程"和"Agent 的记忆"进行比较。

如果将构建一个 #Agent 比作一项建筑工程：

上下文工程 (Context Engineering)：是总体的建筑蓝图和施工策略。它是一个宏观的系统性概念，负责规划需要哪些信息、从哪里获取、以及如何动态地将它们组织起来。

Agent 的记忆 (Agent's Memory)：是施工所需的原材料仓库。它是上下文工程的一个关键信息来源，负责存储和检索历史信息，如短期对话记录和用户的长期偏好。

#提示词工程 (Prompt Engineering)：则是具体的施工与装修工艺。它处于整个流程的末端，专注于将蓝图规划好的、从仓库中取出的所有材料，以最优的方式组合呈现给模型。

三者关系如下：

1. 提示词工程是上下文工程的子集：它负责"最后一公里"的沟通优化，但它无法决定上游有哪些信息可用。一个设计精良的上下文系统，是优秀提示词工程发挥作用的前提。

2. Agent 的记忆是上下文工程的重要组件：记忆系统为上下文系统提供了跨越时间维度的信息输入，实现了应用的连续性和个性化。

2.1. 短期记忆：通过对话历史摘要等技术，确保 Agent 在多轮对话中不会"失忆"。

2.2. 长期记忆：通过向量数据库等技术，存储用户的关键偏好，让 Agent 越来越懂用户。

因此，一个成熟的 AI 应用开发者，其关注点会从孤立的"#提示词调优"转向更为系统化的"#上下文构建"。

开发者的实践路径

要将上下文工程的思想融入开发实践，可以从以下几个方面入手：

1. 建立系统化思维：当 Agent 表现不佳时，优先反思："它是否获得了做决策所需的所有信息？" 是缺少用户背景，还是不了解对话历史，或是没有合适的工具？

2. 策略性实现记忆：根据应用场景，有目的地设计记忆模块。对于多轮对话，采用摘要或滑动窗口机制管理短期记忆；对于需要个性化的场景，引入基于向量检索的长期记忆系统。

3. 精细化运用提示词：在拥有了丰富的上下文信息后，通过提示词工程技术进行优化。例如，使用 #XML 标签或 #Markdown 将不同来源的上下文（<history>, <documents>）清晰地结构化，并将最关键的指令或最新信息放在提示词的末尾，以最大化模型的注意力。

总而言之，上下文工程并非一个全新的发明，而是对构建高质量 Agent 过程中沉淀下来的经验和原则的精准概括。它标志着 AI 应用开发正在走向成熟，从依赖"炼金术"般的提示词技巧，转向更加系统化、工程化的构建范式。而 #LangGraph、#LangSmith 等工具的设计理念，也正是为了更好地支持开发者进行这种可控、可观测的上下文工程实践。