AI Agent 很热,但许多团队在真正落地时,发现它并不是灵药。一套纯 Agent 架构往往缺乏边界感、不可控,也难以与已有系统整合。于是,我们开始思考,如何以更务实的方式搭建一个结构清晰、执行稳定的智能系统。
我们发现:以 workflow 为起点进行 Agent 化演进,是很多团队更实际、也更高效的路径。它提供了秩序感,也提供了技术与业务之间的缓冲带。
01 - 为什么从 workflow 出发更可控?
相比直接构建一套复杂的 Agent 系统,workflow 有几个天然优势:
-
流程边界清晰:可控性高,执行路径明确,有固定起止。
-
工程路径稳定:已有成熟工具支持,可快速上线系统。
-
可插入智能节点:每个节点都可以通过 LLM 进行增强(如意图识别、文本生成、信息抽取等)。
-
便于组织托管与权限控制:业务流程天然带有权限、角色控制机制,方便部署到实际场景。
换句话说,Workflow 是一个稳定的地基。在这个基础上逐步 Agent 化,比从零搭建要来得更“长线安全”。
02 - 什么是 Agent 化的升级过程?
一个完整的 Agent 系统,往往具备以下几个核心能力:
-
感知能力:理解用户意图、环境上下文(如通过对话理解、状态持久化、外部知识调用等)
-
规划能力:能根据目标拆解任务、组织工具、设定执行路径
-
执行能力:调用外部系统完成任务,包括 API 调用、流程调度、UI 交互
-
自适应能力:对失败做出恢复、调整策略,或优化路径
从 Workflow 到 Agent,并不是一步跃迁,而是可以阶段演进的。例如:
|
|
---|---|
|
|
|
|
|
|
|
|
03 - MCP vs Function Call:两种集成方式的差异
当我们引入 LLM 与工具系统对接时,有两个主流思路:
1. Function Call
-
LLM 输出一段结构化调用(函数名 + 参数),由系统执行;
-
示例:GPT function calling, LangChain tool use 等。
优点:
-
快速、轻量、结构化;
-
与传统系统集成成本低。
劣势:
-
LLM 缺乏任务记忆与上下文调度能力;
-
难以执行多步任务;
-
一旦调用失败,恢复能力弱。
2. MCP(Memory-Controller-Planner)
这是更“Agent 化”的思路,结构更像一个小型操作系统:
-
Memory:存储中间状态、已完成任务、外部环境信息;
-
Planner:根据目标和记忆拆解任务,设定执行路径;
-
Controller:调度执行,并对失败做出调整;
-
Executor:具体调用 API、控制系统动作。
优点:
-
更接近人类认知;
-
具备多轮、动态、自恢复能力;
-
可做复杂规划与反思优化。
缺点:
-
系统复杂度显著增加;
-
调试难度、响应时间提升;
-
部署成本更高,不适合所有场景。
04 - 如何在 Workflow 上逐步实现 Agent 能力?
这部分是我们最推荐的“中道路径”:
用 workflow 保持系统秩序,让 LLM 扮演专家角色,把某些节点变得更智能;再通过 memory、planner 等组件,引入一定的 Agent 特性。
具体可以分为三层演进:
Step 1:节点智能化
-
在固定流程节点插入 LLM,比如智能推荐字段、自动摘要内容、分析用户意图等。
Step 2:局部任务代理
-
让某些任务由 LLM 代理完成,比如自动生成某种类型的表单、自动审核用户信息等。
Step 3:引入 Agent 调度
-
某些任务模块内部由小型 MCP 架构驱动,例如:
-
多轮对话创建复杂内容
-
任务失败后尝试多种策略重试
-
结合用户历史行为调整任务路径
05 - 最后的建议
-
对业务要求稳定性、可控性强的系统,建议以 workflow 为主架构,逐步智能化;
-
对探索性、开放式任务较多的系统,可考虑构建小规模 MCP Agent 并辅以工具调度;
-
绝大多数企业场景不需要“通用智能体”,而是“具备 Agent 特质的系统”。
关键学习资源推荐
想进一步深入理解 MCP 架构、Agent 调度与 workflow 的结合路径,以下资源推荐收藏:
技术文章
-
AutoGPT 源码解析与系统结构梳理
-
LangChain vs Agentic RAG 架构比较
-
OpenAI Function Calling 文档
-
HuggingGPT:用多个专家模型解决任务
视频 / 公开课
-
DeepLearning.ai 的 “Building Systems with LLMs” 系列
-
吴恩达 & LangChain 联合课程:LangGraph、Agentic design patterns
-
Anthropic Claude 团队分享的 Agent 架构设计实践
框架工具
-
LangGraph(基于 LangChain 的 Agent 状态机)
-
CrewAI(多智能体调度框架)
-
Autogen(微软开源的 multi-agent 编排库)
如果你正在推进 AI Agent 项目,或在平台中引入智能工作流,欢迎一起讨论如何结合 MCP 架构、智能体角色与业务流程,找到更贴合的落地路径。