产品效果
上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。
企业生产环境下知识库管理者通过 可视化前端页面完成文档上传解析,并自动支持图文混排 ,效率将会大幅度提升。
文档上传完成后,在 RAGFlow 进行问答,便可以 自动显示文档里的图片 :
实现原理
图文混排 整体流程如下 :
暂时无法在飞书文档外展示此内容
文档 OCR 引擎
在之前发布的「RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码)」文中,我们是内置了 MinerU 和 PyMuPDF 两种 OCR 引擎,经反复对比后 PyMuPDF 效果很差,几乎不能用。所以 OCR 引擎层面本次升级只支持 MinerU 。少即是多,提供过多的选择未必是一件正确的事, 产品层面越简单越好 。
图片存储与读取
之前方案中我们采用了 docker 独立容器部署图片服务,虽然安全性上进一步提升。但考虑到图片的存储与读取性能以及部署的复杂度,本次我们统一将图片存储到 RAGFlow 的 Minio。从设计的角度来看,也更加紧凑,复用原有的框架能力,降低复杂度。
上传文档
后台管理系统新上传了文档接口,可以 实时显示文档解析的进度 。需要注意的是目前文档解析并未存储到文件系统里,上传功能并未做持久化。
未来展望
因近期有不少客户在询问企业微信对接场景,短期的目标会围绕 企业微信接入场景,目前功能已开发完毕也已经开源 ,后续将会回到知识库最核心的两点: RAGFlow 性能(回答速度)和准确率 进一步进行挖掘。
需要源码的同学,敬请关注微信公众号「 KnowFlow 企业知识库 」,回复「 源码 」关键词即可获取。
期望同行多多交流,共同促进企业知识库和智能客户产品行业的繁荣演进。