时间像一把剪子,将我们这个技术飞速发展的时代剪成了一段段影像,并打了一个个标签——信息、数字、互联网、大数据、人工智能等等,似乎越来越接近数字文明的底色。而快步走来的数字文明,从不缺席时代发展的主线与历史运行的轨道。
一、从传统软件到Agent智能体
在人工智能大模型爆发之前,基于计算机系统设计开发的软件均由代码和数据构成,是一种我们输入指令“叫它干啥就干啥”的数字化应用工具,决定其服务能力的是执行的代码和后台的数据库,不可能衍生出除此之外的其他能力,比如我们手机经常使用的APP,就是一个个应用,你想购物、打车、订房、点餐……,一问一答,一个来回,有就有,没有就没有,最多加些类似推荐、可能喜欢和看似抓住人性弱点的算法诱导,也就仅此而已。
在人工智能领域,伴随大模型而生的一个英文名叫Agent的智能体“一夜成名”,越来越火,从英文Agent来理解是代理人,虽然是代理,但既然是“人”,想必一定很有智慧,而这智慧从哪里来?从当前情况来看,智能体背后另有“高人”,为新“网红”智能体“撑腰”的正是三个“大”——大数据、大模型、大算力。
无论是AgentGPT、AutoGPT、OpenAI的GPTs,还豆包、Kimi、DeepSeek的智能体,便于理解,我们还是称它为智能助手,其背后正是海量数据与超大算力在支撑其高效运行,这些智能体正在推动传统软件应用从“纯工具”向“自主智能体”转变,传统软件产业将面临新挑战,可能因此而重构,走向另一个发展新高地。
那么Agent智能体到底是什么?从规范定义来看,智能体指具备感知环境、自主决策并执行复杂指令,独立完成多步操作,实现任务目标的智能实体。其本质上是一个由大语言模型(LLM)支撑驱动的系统,利用数据治理和高质量数据集建设,通过集成规划、记忆、工具调用等能力完成复杂任务。如果以更简单的方式来表示,那就是:智能体=大语言模型(大脑)+记忆系统+工具调用+规划能力。
与传统软件应用相比,做好智能体的核心是规划、记忆和工具调用。
规划就是将复杂任务拆分为一个可执行的小任务,并动态调整执行的路径,平衡智能体的灵活性与确定性。记忆分短期与长期两类,短期记忆是将任务执行中的对话等上下文信息临时保存起来,而长期记忆则需要建立外部知识库,可用向量数据库存储行业知识、专家知识,并进行动态更新,确保知识准确性、及时性、完整性。工具调用,则是通过整合API、RPA机器人等外部资源,借以提升智能体应用能力。比如,网易CoreAgent通过调用电商平台接口外挂服务,完成对网上商品挖掘分析,进一步优化CoreAgen功能。
当前,Agent智能体应用,一个很突出的特征是从单一任务执行转向跨应用、多任务协作,强化文本、图像、音视频等多模态交互能力,整合完善感知手段与方式,其应用“智商”有了质的飞跃。
二、Agent智能体应用前景广阔
从Agent智能体的行业应用场景来看,企业服务、智能家居、金融、医疗、教育等发展前景非常看好,尤其是医疗领域。
有关报告显示,Agent智能体在医疗领域的应用场景主要有精准诊断与辅助治疗:一是医学影像智能分析,Agent智能体基于深度学习技术,可快速识别CT、MRI等影像中的异常区域(如肿瘤、血管病变),量化并精准分析病灶尺寸与形态特征,可将诊断准确率提升至95%以上。二是多模态数据融合诊疗,Agent智能体平台,整合电子病历、基因数据、体征监测信息,为医生提供有效的个性化诊疗建议,大大降低复杂病例的误诊风险。
每个Agent智能体背后,需要大模型与大数据提供支撑保障。近期,西湖大学发布多模态病理大模型,该模型历时5年,始于从海量文献书籍数据中“淘金”,取得令人瞩目研究成果:以0.25微米的精度扫描切片,结合基因数据、电子病历等材料,在几秒内完成对肺癌、乳腺癌等40个癌种的辅助筛查,并智能标记可疑病变,提升医疗诊断效率,可以说给人类战胜癌症、呵护健康带来了新希望。
Agent智能体在医疗领域的应用还有很多,如:病历生成与质量管控自动化、筛选临床试验受试者、药物疗效预测、动态健康监测与预警等等。医疗Agent智能体成为“预防-诊断-治疗-康复”链路上的“全科医生”。未来,大模型与 Agent智能体的创新应用,将为传统医疗领域带来全新变革,释放出巨大的潜能和价值。
但是,医疗数据涉及大量个人隐私、伦理风险和安全问题,如何确保患者信息在 Agent智能体处理和使用过程中的安全性,这是一个迫切需要解决的问题;同时,还要考虑医疗知识的迭代更新、最新医学研究成果和临床实践经验的运用,以此提升医疗诊断的准确性和可靠性,以及智能体自主决策失误可能引发的医疗事故责任界定。
因此,打造一个安全可信的Agent智能体尤为重要:一是场景设计:明确设计开发智能体要解决什么问题,需求有哪些?预计可能达到的效果,梳理确认所要解决的问题与需求清单。二是数据准备:收集、清洗并标记数据,通过治理、纠偏和对齐,为大模型提供高质量数据集和语料库,确保预训练效果。三是模型适配:设计、训练和优化算法,选择合适的大模型以及相对应的模型参数配比,不求“大而全”,而要“小而精”。四是结果验证:基于大模型提供的开放接口能力,设计开发智能体,结合数据集和第三方服务能力,通过结果验证和安全测试,完善智能体。
有人预言,一种专注于Agent智能体运营的新型数据运营公司将很快诞生,并越来越趋向“小而精”“专而深”,开发运营Agent智能体的公司可能只有两三个人、一间办公室,类似公司将越来越多,支撑Agent智能体安全运行的“后台”则是一支专业化、规模化的运营团队或大型人工智能公司,统一提供海量数据、超大算力和大模型的服务能力。传统软件产业将面临挑战或转型,现有格局被打破,为此重塑。
AI时代,Agent智能体和大模型将在更多行业领域实现深度融合与创新应用。基于多智能体的业务协同和数据驱动,在交通领域,推动交通流量控制更加高效优化和自动驾驶辅助;在教育领域,可能会打造出更加符合每个学生特点的智能学习助手;在工业制造领域,助力生产流程更加自动化、智能化,进一步提高企业的生产效率和产品质量;在智能客服领域,Agent可理解用户意图和需求,自动回答用户问题,提供24小时不间断服务,提升用户满意度和忠诚度。在智能家居领域,Agent智能体可通过与Agent智能体交互,轻松管理照明、温度、安全等设备,提升生活的舒适度和便捷性。
三、具身智能体的未来发展空间
可以预见,Agent智能体已经不是一次简单的从传统应用到智能应用的迭代升级,而是传统应用的一次美丽蝶变、一次具有历史意义的跃迁与进化。
Agent智能体,可以说是传统软件的智能化“变体”,是运行于电脑、手机、IPAD等终端之上的智能应用,也叫非具身智能体。未来,还有一种智能体,拥有“硅基生命”身体,就叫具身智能体,指的是拥有物理形态或存在于物理/模拟环境中,能够感知环境、理解任务、规划并执行动作来与环境互动,从而实现特定目标的智能系统。
这种具身智能体,必将深入人类的生产生活当中,成为我们的助手、朋友和离不开的合作伙伴,目前最典型的就是具身智能机器人,如人形机器人、工业机器人、服务机器人等,另外还有其他具身智能体,如无人机、自动驾驶汽车,以及具有一定自主决策和行动能力的智能家电、可穿戴设备等。有一天,你家里拥有多个具身智能体,听你指令帮你处理家务、协助工作,甚至你什么都不必操心。
具身智能体与非具身智能体(如软件应用)的区别在于“具身性”和“交互性”。一是具身性:智能体有一个具体的“身体”存在于某个环境中,这个身体拥有传感器,可感知环境,以及执行器,可用于环境。二是交互性:智能体不是被动地处理数据,而是主动地、持续地与它所处的环境进行闭环交互。
具身智能体应用领域非常多,如:机器人技术:仓储物流、家庭服务、医疗健康、危险环境作业、农业、太空与深海探索;自动驾驶:自动驾驶汽车是典型的具身智能体;人机交互:更自然、更物理化的交互方式(如社交机器人、协作机器人);智能家居/物联网:能够主动感知环境并执行物理任务的智能设备;VR虚拟现实/AR增强现实:在虚拟或混合现实中能与用户、环境进行物理交互的智能代理;游戏与模拟:打造智能、逼真的NPC或训练模拟环境等。
具身智能体,代表了未来人工智能发展的一个重要方向,旨在让AI走出纯数字世界,拥有在物理或模拟世界中“生存”和“行动”的能力,是迈向更通用、更实用人工智能的关键一步。研究开发一个具身智能体需要融合机器人学、计算机视觉、自然语言处理、机器学习、认知科学等多领域知识及成果。
谷歌首席未来学家雷·库兹韦尔预言了人工智能将在2029年超越人类智慧,并在2045年实现人机共生,达到所谓的“奇点”,AI将成为我们大脑的一部分。他认为在那个时刻,人工智能水平将提升100万倍,人类通过与机器的融合实现前所未有的跨越式发展。
随着通用人工智能AGI和新一代世界模型的到来,利用AGI能力和基于世界模型构建的智能体,试想不论是具身还是非具身的,如果都能做人类会做的所有事,那么,人类这个最伟大的“智能体”能干什么?世界又将会变成怎样?是不分彼此、世界大同,还是百花盛开、争奇斗妍。
看来,适应快速变化的AI时代,把握这个时代赋予我们的机遇,面对互联网世界的场景涌现与应用蝶变,尽快实现人类的自然智能与人工智能体的无缝衔接,让人类更有智慧、更能掌控未来,这或许是摆在每个人面前一堂别无选择的必修课。@