上下文工程:构建下一代 AI 应用的核心

AI资讯 7小时前 charles
510 0

上下文工程:构建下一代 AI 应用的核心

随着#大语言模型(LLM)的快速发展,AI 应用正从简单的单次问答,进化为更复杂的、具备代理(Agent)能力的动态系统。

在这一演进过程中,一个核心挑战浮出水面:当一个智能 #Agent 表现不佳时,根本原因往往并非模型能力不足,而是它未能获得完成任务所需的、恰当的上下文信息。

关注公众号 #极客开源 👆 获取最新一手#AI大模型 #开源项目信息,如果这篇文章对你有用,可以点个“♥️推荐”,听说会影响公众号推荐算法。

上下文工程(Context Engineering)正是在这样的背景下,成为 #AI应用 开发者需要掌握的关键技能。

上下文工程:构建下一代 AI 应用的核心

什么是上下文工程?

上下文工程的核心定义是:构建一个动态系统,以正确的格式,提供正确的信息和工具,从而让大语言模型能够合理地完成指定任务。

MCP协议与大模型集成实战:从协议设计到智能体开发" data-type="1">

大模型应用开发者可能或多或少都了解过 #MCP协议,如果想系统理解并且实战上手开发,推荐这本MCP协议与大模型集成实战新书。

上下文工程:构建下一代 AI 应用的核心

这个定义包含几个关键点:

1. 它是一个动态系统:复杂的 #AI应用 需要从多个来源获取上下文,包括开发者的预设指令、用户的实时输入、历史交互记录、外部工具的调用结果等。上下文工程旨在构建一个能够动态整合这些信息的系统,而非依赖静态、写死的提示词。
2. 它需要正确的信息:大语言模型无法凭空猜测。如果缺少关键信息,它就无法做出正确的决策。所谓"垃圾进,垃圾出",提供高质量、高相关度的信息是系统成功的基石。
3. 它需要正确的工具:很多时候,仅靠初始信息是无法解决问题的。必须赋予 Agent 使用工具的能力,例如查询数据库、调用 #API、浏览网页等。提供正确的工具和提供正确的信息同等重要。
4. 格式至关重要:与模型沟通的方式会直接影响其表现。一个结构清晰、简明扼要的错误报告,远比一个庞大的、未经处理的 #JSON 数据块要有效。如何设计工具的输入输出参数,同样深刻影响着模型使用工具的成功率。
上下文工程:构建下一代 AI 应用的核心

在设计和调试系统时,开发者可以时常自问一个问题:"在当前的上下文下,AI 有可能合理地完成任务吗?" 这个问题有助于将失败归因于上下文的缺失,还是模型本身的失误,从而找到正确的优化方向。

上下文工程、提示词工程与 Agent 记忆

为了更好地理解上下文工程,可以将其与另外两个密切相关的概念——"提示词工程"和"Agent 的记忆"进行比较。

上下文工程:构建下一代 AI 应用的核心

如果将构建一个 #Agent 比作一项建筑工程:

上下文工程 (Context Engineering):是总体的建筑蓝图施工策略。它是一个宏观的系统性概念,负责规划需要哪些信息、从哪里获取、以及如何动态地将它们组织起来。
Agent 的记忆 (Agent's Memory):是施工所需的原材料仓库。它是上下文工程的一个关键信息来源,负责存储和检索历史信息,如短期对话记录和用户的长期偏好。
#提示词工程 (Prompt Engineering):则是具体的施工与装修工艺。它处于整个流程的末端,专注于将蓝图规划好的、从仓库中取出的所有材料,以最优的方式组合呈现给模型。

三者关系如下:

1. 提示词工程是上下文工程的子集:它负责"最后一公里"的沟通优化,但它无法决定上游有哪些信息可用。一个设计精良的上下文系统,是优秀提示词工程发挥作用的前提。
2. Agent 的记忆是上下文工程的重要组件:记忆系统为上下文系统提供了跨越时间维度的信息输入,实现了应用的连续性和个性化。
2.1. 短期记忆:通过对话历史摘要等技术,确保 Agent 在多轮对话中不会"失忆"。
2.2. 长期记忆:通过向量数据库等技术,存储用户的关键偏好,让 Agent 越来越懂用户。

因此,一个成熟的 AI 应用开发者,其关注点会从孤立的"#提示词调优"转向更为系统化的"#上下文构建"。

开发者的实践路径

要将上下文工程的思想融入开发实践,可以从以下几个方面入手:

1. 建立系统化思维:当 Agent 表现不佳时,优先反思:"它是否获得了做决策所需的所有信息?" 是缺少用户背景,还是不了解对话历史,或是没有合适的工具?
2. 策略性实现记忆:根据应用场景,有目的地设计记忆模块。对于多轮对话,采用摘要或滑动窗口机制管理短期记忆;对于需要个性化的场景,引入基于向量检索的长期记忆系统。
3. 精细化运用提示词:在拥有了丰富的上下文信息后,通过提示词工程技术进行优化。例如,使用 #XML 标签或 #Markdown 将不同来源的上下文(<history><documents>)清晰地结构化,并将最关键的指令或最新信息放在提示词的末尾,以最大化模型的注意力。
上下文工程:构建下一代 AI 应用的核心

总而言之,上下文工程并非一个全新的发明,而是对构建高质量 Agent 过程中沉淀下来的经验和原则的精准概括。它标志着 AI 应用开发正在走向成熟,从依赖"炼金术"般的提示词技巧,转向更加系统化、工程化的构建范式。而 #LangGraph#LangSmith 等工具的设计理念,也正是为了更好地支持开发者进行这种可控、可观测的上下文工程实践。

延伸阅读

大模型应用开发者可能或多或少都了解过 MCP 协议,如果想系统理解并且实战上手开发,推荐这本MCP协议与大模型集成实战新书。

本书从协议设计到智能体开发,一本书讲透 MCP 的核心概念与应用机制,帮读者在 AI 大模型开发中灵活管理上下文信息,构建“能控、能扩、能协作”的智能体系统。

上下文工程:构建下一代 AI 应用的核心

版权声明:charles 发表于 2025年6月24日 pm10:52。
转载请注明:上下文工程:构建下一代 AI 应用的核心 | AI工具大全&导航

相关文章