联网搜索目前是使用大模型过程中,用于获取最新知识最有用的手段

之前有很多开源的解决方案
比如Searxng
官方地址:
https://github.com/searxng/searxng

我们常用的dify、fastgpt等开源工作流产品,均支持了这个插件


这是一个非常简单的解决大模型联网搜索的优秀解决方案。
但是这个产品本身并不是真正的搜索引擎,而是相当于一个搜索引擎的集合体
搜索的稳定性更多还是依赖真正的搜索引擎,比如bing、百度、谷歌等等产品。
那么在实际的使用过程中,想要调得又快又好用,是要花费不少功夫的。
尤其是受限于网络环境不那么友好的情况下,就经常出现搜不到的情况。

今天就介绍一个最近我这边常用的一个大模型搜索引擎。
我们的需求
我们的需求还是很明确
-
1. 更多的面对国内用户,绝大多数使用中文,英文搜索结果不是刚需 -
2. 搜索速度尽可能快,首token时间就更短,响应更迅速 -
3. 公司性质原因,能不用梯子尽量不用梯子 -
4. 搜索结果对大模型的输入友好 -
5. 价格便宜,最好能白嫖一些
看了很多Saas产品,比如Tavily、Perplexity,用起来也挺不错的
但是奈何都是国外的saas产品,响应速度还是比较慢,用起来还是挺难受的。
所以这里还是推荐一个我们现在正在使用的产品
阿里云信息查询服务-通用搜索
这真是一个非常朴实无华的名字
阿里起名字的水平一如既往的稳定,就像QwQ、QvQ
意如其名,这是阿里云基于夸克搜索提供的一个通用的信息查询服务

详细文档说明如下
https://help.aliyun.com/document_detail/2870227.html
可以看到这个搜索服务已经完成了大模型的适配工作
对我来说,更重要的是下面这个

平均响应时间不足1秒,P99也在2秒之内
换句话说,这个搜索的响应时间是非常快的
相较于前述的Searxng、Tavily、Perplexy,在大模型联网搜索的使用体验效果提升是非常明显的。
费用
可以在申请开通之后的15天内免费试用

测试使用默认限额:5QPS、1000次/天、15天有效期。
转为正式接口后,目前价格为42元/千次,也不算贵。
当然你量不大,也可以换账号一直白嫖阿里云,哈哈哈哈
接入使用
开通账号
你可以在官方文档中找到说明,注册并开通通用搜索功能
https://help.aliyun.com/document_detail/2870227.html

进入控制台,找到凭证管理,你就可以找到自己的测试API key了

Dify集成
-
• 使用 OpenAPI Specification 中的 API 定义,创建自定义工具;

-
• 配置鉴权方法 ;

-
• 测试接口;

你还可以通过在下面的代码仓库中
https://github.com/dongfangzan/dify-workflow
找到并下载文件:2. 通晓.yml

点击导入DSL文件,来直接使用工作流。

随后,你只需要打开这个工作流
并在HTTP请求节点中,填上你的API-Key即可。

最后,将工作流发布为工具,就可以在其他工作流中使用这个搜索啦!

测试
我们简单测试一下这个工作流,比如输入成都天气

可以看到内容是下面的方式进行组织的,非常适合直接给大模型当做知识库
-
• Title -
• URL -
• Snippet
这时,我们利用Dify的Agent能力,简单做一个可以联网搜索的Agent来测试一下搜索功能
就可以看到搜索的速度是非常快的,回答也相对准确。

Dify之外
看过之前文章的朋友可能知道,我们这边最常用的产品还是OpenWebUI

那么后面的文章里,我们会对针对这个搜索功能进行一点点改造
以适配OpenWebUI的联网搜索功能,如果有朋友感兴趣,我后面也可以分享出来
感谢你看到这里,如果你有什么好的大模型联网搜索的实际使用经验,欢迎来交流讨论