一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?

“大模型+插件”的功能叠加,已不能满足需求,让企业心甘情愿买单的智能体,必须能自主决策和闭环执行任务。

一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?
‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

文|周享玥
‍‍‍

编|周路平



去年,业界对于智能体的定义颇有争议,市场侧更多还只是To C端的一些尝鲜。但进入2025年,智能体的概念边界已迅速清晰,并迈向规模化应用。IDC预测,Agent 中国市场规模预计将突破300亿美元。


To B市场的需求也正在快速崛起,企业用户更加关注效果和ROI,对智能体的要求,也随之上了一个新的level——


光是“大模型+插件”的功能叠加,已不能满足需求,真正能带来价值,让企业心甘情愿买单的智能体,必须能自主决策和闭环执行任务。当然,如果还能有记忆,可以实现个性化主动服务则是一个更理想的状态。


本周,智谱就宣布推出首个企业级超级助手Agent——CoCo,在这几项能力上进行了重点突破。(评论区有测试码大放送)


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


智谱是最早布局智能体的大模型厂商之一,率先提出了Agentic GLM战略,一直围绕着模型、智能体框架、Agent应用、开发平台、生态等多方面布局智能体市场。今年3月,智谱也推出了一个全新智能体——AutoGLM沉思,并开源了其背后的模型。


而这次发布的这个新的智能体工具,被定位为企业级AI Agent,具有交付导向、记忆机制和无缝嵌入三大企业级特性,支持企业私有化部署;同时,针对需要重复执行的任务,还能一键完成工作流编排,并形成可重复调用的MCP工具,当用户后续有需要时,可以像“小程序”一样,一键实现调用。


简单用一句话来总结,就是“懂你懂企业,能干能交付”。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


我们也在第一时间对CoCo进行了测试,让我们直观地感受一下,当智能体进入金融、快消等企业真实场景中的真实表现。



01


一个“有记忆”的智能体



作为一个“有记忆”的企业级AI Agent,从用户首次进入界面的那一刻,CoCo就已经开始了“角色扮演”。


当我们完成注册,进入页面时,首先看到的就是一个自我介绍输入框,在这里,用户可以选择提前输入对应的自我介绍或者上传个人文档,完成初印象记忆。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


进入对话框界面后,可以在配置中心进一步对智能体进行调教、预设信息。比如可自行输入想让智能体记住的信息,可以设置记忆的有效期,是一天、一周、一个月、三个月,还是永久。当然,你也可以为CoCo选择可自主调度的工具、知识库、数据库。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


我们把新能源和快消作为我们比较关注的领域,当我们时隔一段时间重新打开CoCo时,CoCo已不再是一个懵懂无知的新兵蛋子,它会主动询问是否需要帮忙获取新能源领域的最新数据,或者优化快消产品文案


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


据悉,这是因为智谱在CoCo内部专门嵌入了感知记忆能力,它可以自动感知企业用户画像和企业知识资源,根据长短期记忆能力自动抽取和精准召回,提供千人千面个性化服务


基于这样的记忆能力,它除了可以通过记忆配置来记住对应信息并主动服务外,也能从日常交流中,提取和记忆每位用户的职位、偏好,以及近期工作重点,为用户提供更多个性化的服务,让每个人都拥有一个越用越懂你的私人助手。比如它会基于不同的角色设定为用户推送相关的日报信息。


当这样一个有记忆的智能体,在深入日常工作场景时,会带来怎样的效果?



02 


海量数据分析,虽有瑕疵,但专业性够强



项目统计和企业数据分析,是很多企业都存在的刚需。以前靠手动去做对应的统计和分析,搞得头晕眼花,耗时耗力。


智能体能否高效地完成这一工作呢?为了为难一下AI,我们给CoCo准备了一份有着近500条数据、数十个字段的复杂项目统计表


结果显示,CoCo不仅准确无误地理解了我的要求,很快给出了一个较为清晰的任务规划步骤,其自主规划的几个分析维度,也基本符合预期,即便我并未在指令中提出具体需要哪些分析维度。而后,CoCo开始提示我进行任务规划步骤的相关“修改”或“确认”。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


“确认规划”后,AI开始按步骤执行任务规划。而在此过程中,你可以随时看到智能体的执行进程。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


经过十几分钟的等待,CoCo最终给出了一份维度较为丰富的可视化分析报告。我们核对了其中的重点数据和趋势总结,基本与我们此前人工进行过的归纳和分析一致。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/T7IAXG3VUMVT4TGJCQ2S6BTPW4/cocod/chatfiles/8882ce8c-d44e-431e-961e-6b4d1149a54b/2/index.html


当然,这个过程,也并非每次都能完全准确无误。尤其是在涉及的数据较多,且同一数据类目中有着多种数据单位,需要进行换算并进行大量数据汇总时,还会有一些瑕疵。但如果用户能补充和强调处理方法,CoCo输出结果的准确性就会得到大幅提升。



03


全流程辅助,更适配企业的Agent



当企业对智能体的需求,从技术尝鲜开始进入实际落地,业界观察,企业最关注的Top3问题,已经逐渐凸显。


第一,任务闭环可靠性,即复杂任务能否自主规划、执行、纠错直至完成。比如招聘智能体能否连贯处理从简历筛选到面试到报告的全流程。这要求智能体应具有全流程辅助的能力,以交付为导向,带来更大范围的效率提升。


第二,定制化微调的成本与效率,即能否以合理成本高效地将智能体适配到企业独特业务和知识上。


第三,数据安全与合规性。尤其对于政企客户来说,这属于生命线,不少企业仍然希望相关产品和服务能够私有化部署。


那么,围绕这几个关键问题,CoCo的表现如何?


来看几组测试。


在金融场景中,我们让CoCo分析某企业财报和产销快报,给出业绩展望分析和风险提示。接到任务后,CoCo首先进行了整个任务规划节点的拆解,并向用户确认是否开始执行。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


而后开始针对每个子环节,再次自主规划细节要求,并频繁提醒自己注意数据和信息的真实性与完整性,以避免产生幻觉。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


大概12分钟后,全部任务执行完毕,CoCo返回一份涵盖了业绩亮点、产销趋势、经营动态、风险事项、业绩展望等的完整报告,给到一份可视化分析报告,并交付包含原文件在内的多个文件。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/PYPYJDW53WIZ7YXTABGTJALFW4/cocod/chatfiles/2a2e70b2-49d5-4b91-aeb5-5fb286eecb17/15/byd_analysis_report.html


接下来,我们让它基于以上分析结果,结合最新行业趋势、政策,输出一份完整的投资研究报告。可以看到,在进行到下一个环节的任务时,CoCo并没有忘记上一个任务中的内容,依然能够准确无误地开始自主规划新一轮的任务步骤。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


期间,CoCo还考虑到了从盈利能力与成长性、同行业企业的估值水平对比、投资回报与风险收益比等多角度出发,进行更为专业的投资价值分析。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


最终,一份结构完整的投资研究报告新鲜出炉,不仅有各项关键信息分析,其中的可视化图标还可供动态查看。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/RCH5JXNWWIJNANK4VQWSY5WFXI/cocod/chatfiles/2a2e70b2-49d5-4b91-aeb5-5fb286eecb17/17/byd_investment_report.html


在此基础上,我们又让CoCo继续根据此前输出的投资研究报告,制作成一份PPT。仅用了3分钟,CoCo便输出了一份完整的PPT内容大纲,并给到了PPT在线编辑入口,在这里,我们还可以再次修改和丰富细节,再选择自己喜欢的模板,一键生成PPT。略微调整后,点击“下一步”,仅一分钟左右,一份有着15页内容的结构完整、图文并茂的PPT文档就已经完成。智能体不仅能查找、归纳信息,更是能够直接交付成果。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


又比如快消行业,有着广泛的营销宣传需求。先让CoCo帮忙分析一下最近一个月的爆款视频和文案


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


结果显示,接到任务后,CoCo很细致地将任务拆分成了7个具体步骤,每个步骤的执行过程中,都十分详细地对每个子任务再次进行了拆解、细化。CoCo还针对性地精选了六个最具代表性的案例,进行了详细拆解,给出宣传方案设计建议,最终以一个完整报告的形式交付。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/LGQ6R5BNCDVSBOHKFJQXZEWV3M/cocod/chatfiles/0a9f8a49-3130-4b1d-926b-4931c910220b/2/fruit_tea_market_analysis.html


当给出下一步任务,让AI帮忙根据上述的爆款分析,生成面向抖音、小红书、B站三大不同平台的宣传方案和文案时,CoCo也能输出一份与前述过程分析出的风格基本相符,且内容详尽的方案。不仅考虑了内容定位、目标受众、创意方向、具体宣传文案示例等,还在视觉呈现、互动与传播机制等方面都给出了详细建议。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/JCBGL2W3HEJRDU75CQLNLDTE5Q/cocod/chatfiles/0bc836f0-c112-44c8-82b4-c41c7ec77da4/16/multi_platform_promotion_plan.html


当然,更重要的是,CoCo能无缝接入企业原有的工作流、知识库、数据库,与企业内部各环节实现打通,使每次回答都能基于企业内部实际情况,提供准确、可靠的结果。且支持完全私有化部署,便于企业用户调用本地模型、接入企业内网工具和资源、完全运行于本地环境,所有分析过程均可在本地进行,对于有数据安全需求的企业来说十分友好。


只需在前述的CoCo配置中心的资源配置中,单独上传企业的相关知识库和数据库文件并配置后,即可基于企业的本地知识库和数据库让CoCo进行对应数据和经营情况的分析。


比如,在政务场景中,一位基层公务员在推动政策落地时,通常需要三个步骤:解读政策;制定落地方案;执行方案后分析效果、持续优化。在接入本地知识库和数据库后,CoCo不仅能顺利完成前两个步骤,也能在建设方案执行一个月后,根据最新数据,分析执行效果和改进方向,真正做到全流程跟踪,交付最终结果。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/aicoapi/fs/v1/api/download/5Y7SAMNI7IPK4USQCDBTSAHMXM/cocod/chatfiles/961b04ee-249e-4501-a2db-2dee092d3e85/4/index.html


CoCo也能接入企业的CRM系统,分析企业各部门销售情况,提供改进建议。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


完整报告链接:https://aiworker.aminer.cn/prod/api/download/6DXE6NSY35WT3ZAYJ6FUMJEL4Y/cocod/chatfiles/3d9e29d4-45b9-4504-9a08-ba14d0c2589b/2/index.html



04

一键封装工作流,重复任务不用愁



除了对全流程交付能力的需求,企业中还存在着一个巨大的痛点——大量的重复性工作需要完成,耗费员工大量精力和时间,极大影响整体的工作效率和产出。


针对这一痛点,智谱此次推出的CoCo中专门提供了一键将工作流封装为MCP的能力,形成可重复调用的MCP工具,供用户后续调用。


比如在快消场景,每逢新品上新,都需要进行大量的文案撰写,当我们在对话框中输入“工作流”的关键词后,CoCo自动就给出了对应的引导信息,简单进行要求补充后,CoCo开始自动输出工作流构建步骤。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


相关信息确认无误后,CoCo开始自动搭建工作流。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


期间,无需任何干预,很快就能输出一个完整的工作流,我们只需点击发布为MCP工具,这个工作流工具就会被内置到CoCo的工具集中,后续在相关任务执行时,可直接调用对应的工作流工具


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


比如,当我们上传最新的产品信息后,CoCo很快给出了对应的小红书文案。


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?


整个过程简单易用,全程通过自然语言方式即可完成工作流搭建和封装,即便普通用户也能零代码开发海量Agent。


05

一点小总结


总体试用下来,我们的感觉是,CoCo这个新产品对于智能体体验的确又带来了一波新的提升。


有着较强的任务拆解和规划能力,能迅速从用户给定的一个相对简单且概述性的Prompt中,较为准确地解析出背后代表的含义和要求,并条理清晰地拆分出对应的子任务


同时,它考虑事情的角度相对细致周全,即使对每个子任务,也能从多个角度进一步完善思考过程,有些时候甚至能补全真人一时无法思考到的角度。


在准确性上,它也有着不错的表现。尤其是在规划每一个任务时,都会注意加上复查信息、数据是否有误的环节,在每个子任务设计时,也会注意提示自己要注意准确性。


在能力的持续更新上,CoCo同样表现不错。发布仅3天,CoCo进行了一次大幅更新。当我们给到CoCo与几天前同样的任务时,不管是从思考维度、完成速度、输出结果的图文呈现形式上,都有了显著提升。比如几天前一个曾耗时18分钟的任务,最新的输出时长已经缩短到了12分钟。


这些优点,加上其交付导向、记忆机制和无缝嵌入的三大企业级特性,以及支持私有化的部署方式,决定了它能够适配各种对数据安全、全流程服务有着较高要求的企业级场景。尤其在智能体加速迈向规模化应用的当下,这些功能,或有望更快助推智能体走出实验室和单个试点项目,进入更多的核心业务流程。


业界普遍认为,2025年有望成为AI应用落地的元年和爆发年。目前,不少企业已经开始在各种实际的高价值场景中去探索如何用好智能体。随着CoCo等智能体产品的不断推新和功能迭代,不难预见,今年,将会有更多智能体能在企业真实的场景中产生价值。


从通用Agent到“懂你懂企业,能干又能交付”的企业级Agent,AI生产力时代正在加速到来。


©本文为数智前线(szqx1991)原创内容

未经授权,禁止转载

进群、转载或商务合作联系后台


一手实测:首个有记忆的企业级AI Agent,能否经得住实践捶打?




文章精选
  • 人工智能的下一步,走向时空智能

  • 大模型落地的 “确定性答案”,藏在知识库里?

  • 鸿蒙电脑的生态路,可能会比手机更难走

  • AI落地的现实主义:一家AI应用一线企业的业务观

  • 全球首个“L4级”高阶安全智能体背后,网络安全范式面临重塑

  • 千亿学习机背后,好未来的AI战局

  • 是时候重新审视小红书的种草力了

  • 天翼云如何将息壤打造成人工智能时代的基础设施

  • 前店后厂,浪潮云的大模型落地新解法

  • 一家AI原生国企,突破大模型行业落地新范式

  • 蚂蚁密算,可信数据空间的一种解法

  • 大模型生态困局,一场不得不打的战役

  • 安永中国,算力为何锚定华为云?

  • 一场热度空前的马拉松,人形机器人在祛魅还是加速?

  • 四张国产卡满血部署,讯飞星火X1直击三大行业痛点

  • 两个月的奇迹:DeepSeek如何加速政务的技术革新

  • Manus,为什么是一家杭州公司跑出来了?" data-itemshowtype="0" linktype="text" data-linktype="2">工业领域的Manus,为什么是一家杭州公司跑出来了?

  • 历史进程中的浙大

  • 松下电视的结局,藏着日本家电的宿命

  • 大模型五大“标王”与六边形战士

  • 枪响在2018:神秘东方力量,为何扎堆杭州


相关文章