练习Agent时长两年半,对“百度百科”那可谓是觊觎已久。如今终于可以拿它当知识库了,且合理合法!
Hi,我是许键,
WayToAGI的Agent版主,探寻Agent落地的每一个可能。
最近有个酷炫的发现:现在可以将《百度百科》引入智能体(Agent)作为知识库啦!
在百度智能云千帆的Appbuilder上试了下真的爽,只要几个小技巧,轻松让Agent基于权威的百科知识推理回答。
同时,在文末我还会分享一些思考,探索如何让百度百科不仅限于AppBuilder的应用,而是能够广泛应用于所有智能体中,留给大家去探索。
“新知识”问答类智能体
目前的大部分大模型的知识还停留在2024年底,像类似labubu,zimomo,pippo这类对我们来说已经快“过气”的流行性信息,在大模型看来却还是“全新”的。
因此,我们往往会获得错误的答案(如图),聪明点的智能体可能会很委婉的告诉你,它不知道。

但是,只需要加入“百度百科”的数据(不用增加任何提示词),就能解决问题。

在百度智能云千帆的AppBuilder里就能轻松引入“百度百科”组件,答案立刻能变得准确无误。
估计此时,在读文章你90%都是第一次知道这个问题的答案。😁

从执行历史上可以看到,智能体分别查询了labubu和zimomo的词条,基于两者提供的信息,它正确的给出了答案。


能这么用,真的好爽,之前做agent共学的时候,每次遇到大模型不知道的知识,它就“胡言乱语”。
我们只能逐个解决,手动添加最新的知识到知识库中。但这种方式既痛苦又没有尽头,尤其是当模型突然对某些知识有了新的理解,而对另一些本应掌握的知识反而出错时,之前的补充工作似乎就白费了。
知识共享的未来
当时和一些朋友探讨了第一个可能性:共享型知识库,给智能体做参考书,大家共创这么一个开源可靠的信息库。
虽然GitHub上有不少类似项目,如中医类知识图谱等,但它们通常比较垂直,难以全面覆盖。后来我们意识到这类知识库维护起来难度很大,需要有人愿意无私奉献时间和精力来进行运维工作。
就在纠结是否要着手构建这样一个知识库时,有位朋友灵光一闪:“这不就是《百度百科》吗?”-- 啥时候《百度百科》能接入智能体多好!
期盼着,期盼着,它来了。
“知识类自媒体”内容创作
有了这样比较可靠的信源的基础上,很多之前碰壁的Agent的想法马上就变成了可能。
在2023年初我尝试做过的一个“知识up主”智能体:这是当时非常主流的一个想法,利用大模型的知识来写一些知识类的内容,然后自动找到素材剪辑成视频,自动发布。
我就做过一个游戏冷知识讲解类的。
以暗黑破坏神为例,这款游戏拥有大量情怀用户,用AI制作关于它的视频产量高且流量不错。

但是我很快就发现,由于我要求它写的是冷知识,结果有一半是错的,虽然大部分人无法判断真实性,但是很多资深玩家在下面留言:“up主什么也不懂,全是乱说!” 最终不得不下架视频。
因此这时一个靠谱且全面的知识库就非常有价值了。
来,一起快速做一个自动做内容生产的智能体。
此时《百度百科》这个组件就不够用了,因为它给的信息相对比较粗略。
我们改用另一个《百度词条》组件。由于这个组件输出是网址/url,需要配合网页内容读取的组件 -- 正好AppBuilder上提供了一个好搭档:网页内容总结。
依旧不需要任何初始提示词,加入这一对好搭档即可:

这里可以看到规划模型会先查询相关词条,然后通过网页内容总结获取词条上的详细信息。此时的内容质量就非常不错了,见下图。

再做点别的啥游戏的,无论是塞尔达传说历代纪、异度之刃编年史还是宝可梦冷门精灵的故事,都将肉眼可见地手到擒来!
当然,搜索引擎插件也能解决上面大多问题,但是相比之下,百度百科的内容数据更加权威可靠。毕竟互联网上鱼龙混杂,搜索出来的结果数据质量堪忧。再加上通过使用搜索插件会获得很多无关的非结构化信息,可能让大模型出现“牛头对上马嘴”的情况。
因此尤其在需要对内容相对比较严谨的情况下,使用百科数据会更合适。
此外,我还想到了些有趣的小玩法,时间所限未能尝试,欢迎各位共同探索,并在我们的共学直播中分享你的创意!
自定义词条
其实我们每个人都可以创建词条,只要词条通过,就等同于同时做了曝光+SEO。
而这些词条又可以反过来加持我们自己的智能体知识库,何乐而不为呢?

用于更多类型智能体
AppBuilder上提供了智能体和组件的发布成API和SDK,因此完全有可能通过提供API来作为知识库接入到其他平台或者你自建的智能体里,作为知识库。

如果小伙伴们你们也有什么有趣的想法和玩法,欢迎留言告诉我,或者直接来WayToAGI社区共学分享。
如果觉得本文对你有帮助,请点个小小的赞,给点反馈,谢谢。