昨天晚上,涛思数据线上正式发布 TDengine IDMP,一款 AI 原生的物联网、工业数据管理平台。这是我在时序数据库上专注耕耘八年之后,推出的第二款产品。今天一早起来,看到各种留言,以及后台看到的下载量与注册用户数,我异常兴奋,觉得自己作为一个程序员,在 AI 时代不仅不会被替代,而是找到了可以再战八年的巨大机会。开发这款产品是继我 2019 年将 TDengine 核心代码开源后的又一重大决定。今天静下心来,花 2 个小时把我的心路历程写下来,分享给众多的创业者,特别是想在 AI 浪潮里冲浪一把的程序员们。
2016 年底,我看到万物互联的时代已经到来,各行业需要一个高效的处理海量时序数据的引擎,因此创立涛思数据,并且自己冲到开发第一线,2 个月就写下了 1.8 万行 C 代码,而且大胆的在 2019 年 7 月将 TDengine 核心代码开源。八年过去,TDengine 的全球安装量已经超 83 万套,日安装量超 700 套,付费客户超 500 家,遍布全球 60 多个国家和地区,集中在电力、新能源、石油、智能制造、汽车、交通等多个行业,这些数字让我相当开心。
海量数据有了,然后呢?
但过去几年,我走访了中国以及欧美的很多客户,了解到大家的数据量是真的大,比如某个新能源集控中心,测点数超过 5000 万,每天产生的数据量超过 5 TB。TDengine 时序数据库的高效写入、高压缩率的存储与低延时的查询很让客户满意,但大家都有一个共同的问题:数据已经采集和存储,下一步,怎么把数据的价值挖掘出来?我也一直在思考这个问题,希望可以用技术的方式来帮助大家。作为一个程序员,很直接的想法就是让 TDengine 提供更好的 SQL 查询,提供更好的流式计算能力。因此,今年 3 月,我们又推出 TDgpt 时序数据分析 AI 智能体,利用 AI 来提供时序数据预测、异常检测与数据补全、分类的服务。但即便有了这些,用户依旧还是在问如何挖掘数据的价值。
认真分析后,我们发现:最大的问题是业务人员与 IT 工程师、数据分析师之间存在“代沟”。一方面,业务人员需要的是能马上获得业务的实时洞察,但系统往往只提供固定的报表、看板,每次业务人员有什么想法,一定要找 IT 工程师或数据分析师先沟通,解释业务的逻辑和需求。另外,因为大多数 IT 工程师不懂业务本身,虽然知道怎么用数据库,知道怎么写 SQL,但要先理解业务、理解需求,才能写出来代码,因此往往几天之后才会有分析结果。一旦分析的结果不实时,大家对数据价值挖掘的兴趣就大幅下降。市面上已经有不少 BI 工具,通过拖拉拽可以缓解问题,但业务人员会直接操作 BI 工具的,比例很小,大多数还是严重依赖数据分析师或 IT 工程师。此外还有,业务人员的行业知识和经验积累还不够,特别是对新的领域,比如新能源,没有形成系统全面的知识和思考,因此他们也很难提出清晰具体的实时数据分析需求。

TDengine 核心代码在 GitHub 开源
“身上没有烟味 ……”,无解的局面
作为一个时序数据库厂商,我觉得自己进入了一个无解的局面,因为我比用户的 IT 工程师更不懂业务。当我与卷烟厂的工程师交流时,他们说“你身上都没有烟味”;当我去油田交流时,我都不知道油井采集了哪些物理量;当我去污水处理厂交流时,他们提到的一些专有名词我都完全没听说过。此外,我还发现,基于数据库做应用的厂商多如牛毛,每个行业都有一批应用公司,但没有一家能做到行业通吃,因为他们遇到了和我们同样的问题,对行业不了解,不具备行业知识,那自然不会被客户所接受。
我一直在把 TDengine 时序数据库作为人生最后一个产品在做,在这个细分赛道坚持了 8 年,希望这个产品给自己超过 40 年的程序员生涯画上一个完美的句号。但基于其产品的特性,行业知识的壁垒,除非做行业以及客户的定制化开发,否则我很难将 TDengine 产品做厚,进军到应用领域。我经常给团队鼓气,希望涛思数据能做到 100 亿 RMB 的市值,但其实背后,是我理性的思考,拼命努力做到极致的话,公司市值也就一百亿,至多两百亿 RMB。
但这一切,由于 AI 大语言模型,发生了改变,而且让我这个 57 岁程序员倒腾的历史又浓墨重彩的加上了一笔。
一开始,我也想开发Chat BI
2024 年 8 月,我在美国硅谷与做 Chat BI (对话式商业智能) 的公司交流,发现我们完全可以做,至少可以提供自然语言的接口让用户不用写 SQL 来查询数据。但仔细思考,发现 Text to SQL 不是一件容易的事。人类语言灵活、模糊、上下文依赖,而数据库 SQL 语言严谨、精确、结构化,两者之间存在巨大鸿沟。怎么将自然语言中的词语映射到数据库表名、列名,怎么确认多个表之间的关系,怎么将不同行业的业务语义匹配到计算函数,而且 SQL 的复杂性,比如嵌套查询、聚合函数、条件表达式等,让 Text to SQL 生成的准确性大打折扣。此时,我心里想的还是怎么找到顶尖的 AI 人才来解决这些问题。
所幸,我一直关注研究 Aveva 的产品 PI System,它是一款工业数据管理的软件,内核也是时序数据库,但带有数据采集、可视化、分析、事件管理等功能。不像 TDengine TSDB 更多被集成商所使用,PI 可以交付给最终用户直接使用,在发电、电网、石油、化工、制造等行业有相当大的用户群。带着 Text to SQL 的问题,我再看 PI System 的时候,豁然开朗。
我们必须建立数据目录,对于物联网、工业场景而言,最有效的数据目录就是树状层次结构,不仅让大家找数据资产时方便,而且符合企业管理的习惯;我们必须做数据的标准化,因为系统会对接众多的数据源,每个数据源的采集量的名称、计量单位都不一致,不先标准化,只会让 Text to SQL难上加难;我们必须做数据的情景化,数据没有足够的描述信息,业务上下文和语义,AI 无从帮你。因此我决定参考 PI,把数据目录、数据标准化、数据情景化做好,并提供工具让数据建模的过程变得简单高效,把 TDengine 改造为一个 AI-Ready 的数据平台。十月国庆节一结束,新的 IDMP ( Industrial Data Management Platform,工业数据管理平台) 研发小组正式组建,亚强带着丁博、秦冲好几个同学开干了。
IDMP 研发小组决定用 Java 开发,采用 Quarkus 框架。我是 C 程序员,因此逼迫自己也安装了整个 Java 开发环境,开始写 Java 程序。作为一家以技术、以产品立身的公司,我深知,产品必须亲自抓。但那个时候,我还是没有最大程度的投入,因为我觉得 Chat BI 提效了不少,但离问题的完美解决还有差距,因此只是边做边思考,想到更多的是利用 IDMP 的开发倒逼 TDengine TSDB 的开发,比如虚拟表,流式计算重构等,目的是让 TDengine 时序数据库更扎实,功能更强大,更有市场竞争力。
前所未有的机会
春节期间,DeepSeek 极其火爆,让我认真思考,作为一家时序数据库公司,我们在 AI 的浪潮里,到底能做什么?一天与搭档 Steven 讨论产品 IDMP 是否内嵌 Grafana 做可视化时,我们脑洞大开。我们不应该只支持自然语言去创建面板,而是应该借助 AI 大语言模型的能力将可视化面板主动推送给用户,像抖音一样。对于我们处理的物联网、工业场景,每个行业都有自己关心的指标、面板、报表与实时分析,AI 完全可以基于采集数据的上下文,智能感知出来是什么业务场景。感知场景后,AI 这个超级大脑自然知道应该创建哪些典型面板与报表了。我立即用 DeepSeek 做了一些测试,发现完全可行。我在把自己熟悉的 IT 运维场景,采集的物理量等写好一个提示词发给 DeepSeek 后,它给了我远超我自己经验的答案。
这一下让我兴奋到了极点,真正的机会来了。
因为如果我们能自动推荐可视化面板、自动创建实时分析任务给用户,那就意味着用户过去要花相当长的时间学习 SQL,学习做报表、面板,更要花时间学习行业知识,积累行业的运营经验,现在一概不需要或几乎不需要了。业务洞察不再强依赖于 IT 工程师,不再强依赖于数据分析师,甚至不再强依赖于业务专家,人人都可以随时获得。AI 已经能生成精彩的文章、图片、视频,甚至 PPT,如果能生成生产运营过程中所需要的可视化面板、报表,创建实时分析报警任务,那就等于将 AI 技术真正落地到了国计民生的主战场:工业场景。无论电力、新能源、石油、石化、智能制造、矿山,还是污水处理,都将迎来跨越式的数智化转型。特别是对于中国乃至全球的数百万家中小企业而言,相当于瞬间拥有了以前大公司才会有的数据分析工具和人才,能基于生产和运营数据实时做出最佳的商业洞察和决策。
这个市场远超我们已在的时序数据库市场,如果成功,至少可以做到 1000 亿 RMB 的规模。从我三次创业的经验来看,这个蛋糕实在是太大,太诱惑,对我们团队而言也可谓是万事俱备。资金、团队都不是问题,所要的只是我作为创始人与 CEO 的决心。

AI 驱动的工业数据管理平台整体架构图
一路狂奔
因此,我立即回到北京,将公司几乎所有的研发资源倾斜过来,全力投入到 IDMP 的研发中,而且在公司所有的会上强调“all in AI”。我自己身先士卒,每周七天,平均每天工作 14 个小时,除了无法推脱的客户交流,将自己的时间全部安排给了新的产品研发,全部投入到了产品定义、产品设计以及 AI Agent 模块上。
很快,我们就定出来 AI 驱动的物联网、工业数据平台的设计,大家就热火朝天的干起来。
我是一个注重细节的人,每个小小图标,每个页面的跳转,每段小小的提示语,无论中文还是英文,字体字号行距,都会细细琢磨,而且还要做开发进度、技术实现难度与细致度的平衡。虽然有 AI 帮助,但它无法代替原创性的思考和设计。相对于那些老掉牙还在 Windows 上跑的 PI System 以及众多的工业实时数据库软件,以及大堆粗制滥造的工业互联网平台软件,我们不仅用 AI 技术解决了业务洞察难以实时获取的难题,用户体验也得到飞跃提升——用户不必再翻查厚重的手册,这令我无比自豪。
我自己带着团队一路狂奔,唯恐被 Siemens, Schneider, GE, Aveva 这些工业软件巨头抢了先机。在亚强、胜亮、潘魏、王旭、丁博、元湃、营昭等几十位研发同学没日没夜的努力下,终于在 7 月 29 号发布了 TDengine IDMP 第一个正式版本 1.0,大家都可以用容器或虚机免费下载体验,而且为降低体验的门槛,我们同步推出相应的免费云服务。让我特别骄傲的是,涛思数据是全球第一家推出“无需提问,直接用 AI 自动生成可视化面板、生成实时分析任务”的公司。
奔跑了半年,终于可以缓一口气。
当然,这只是 IDMP 的第一个版本,产品后续还会快速迭代。在今年接下来要发布的版本中,将会包含我自主设计的、极具创新性的数据模型版本控制功能,同时还会新增一些行业必需的地图、组态等面板功能,以及事件根因分析报告自动生成、事件分析面板、数据质量报告等功能,并且会支持第三方时序数据库。
无问智推,数据消费范式的改变
TDengine 的创新突破与工程技术落地,正在推动数据消费范式的根本性转变(Data Consumption Paradigm Shift)。传统的数据分析模式中,始终是用户主动发起请求(比如通过 SQL 查询),再由系统响应并返回结果。而现在,借助 LLM 与 AI Agent 技术,数据能够实现 “主动开口”—— 业务分析的核心洞察会直接推送给用户,让分析模式从 “拉取(Pull)” 彻底转向 “推送(Push)”。这意味着用户的数椐消费变成了被动接收,数据分析由此迈入 “抖音时代”,门槛被直接降至零。如果说 Chat BI 的 “智能问数” 是 “有问才答”,那么 TDengine 这种从拉到推的模式,不妨称之为 “无问智推”。
通过一系列包括数据目录,数据标准化和数据情景化的基础性工作,以存储和计算为核心的数据库被改造成为 AI-Ready 的数据平台。借助 LLM,这个 AI-Ready 的数据平台成为了一个自治的数据平台(Autonomous Data Platform),一个自我驱动(Self Driving)的实时分析平台,数据自己就能说话,业务洞察不再依赖用户的行业知识积累和工具使用技能。而因为有了掌握人类所有知识的 LLM 加持,一个 2B 工具,就不会再局限于一个或几个行业,而是能运用到几乎所有行业。这样,在 AI 的驱动下,一个优秀的 2B 软件或云服务将拥有更为广阔的市场,将把传统碎片化的市场汇聚起来。
TDengine 将更进一步,将 AI-Ready 的数据通过开放的 API 给第三方应用提供。它提供的不再是传统的数据库的 SQL 查询结果,而是带有数据业务语义、带有数据上下文的 AI-Ready 的查询结果,赋能给众多的 AI 应用,让数据的拥有者能最大程度的挖掘出数据的价值。
TDengine 的创新与工程实践只是开了行业的先河,我相信今后会有很多类似“无问智推”系统的出现,并流行起来,数据库以及数据基础设施在 AI 时代将被重构,以适应 AI 应用发展的要求。希望 TDengine 能成为变革后的王者。
有了目标,就能一直跑
在创办涛思数据 TDengine 的前三年,我将自己视为产品研发的核心,写了太多行程序,解决了太多的 BUG,让自己在 50 岁的时候居然进入了研发的巅峰期。但过去的几年,节奏开始慢了下来。半年前,当我意识到 AI 技术能给数据库、数据基础设施行业带来新的重大变革,能解决物联网、工业数据处理领域的难题的时候,我一下又回到了巅峰状态,直接冲到产品研发的第一线,每天都有用不完的力气。
2016 年以前我从不跑步,但偶然的原因,跑起步来。而且这一跑就不可收拾,还越跑越快,越跑越远。第一次跑北京奥森,十公里气喘吁吁的花了 65 分钟,现在跑个半马,只要一小时 55 分。过去的 9 年,我累计跑了至少 2 万公里,北京到纽约一个来回的距离,我根本没想到自己还有这样的潜能。
从我个人的经验来看,做产品研发与跑步一样,巅峰不由年龄,而是由梦想和决心来决定。没有目标,每一步都是负担,多跑一步都会觉得累;有了目标,每一步都是希望,多跑一步,就多一份喜悦。一旦下决心开发出一款受人喜爱的产品,年龄不再是问题,你一定会有足够的精力去投入。

参加北京国际长跑节半程马拉松
我坚信,通过 AI 技术的加持,并充分利用中国巨大的工业制造市场,再辅以开源、云服务等手段,我们能将传统的工业数据管理平台彻底颠覆。相对于 PI System 以及传统实时数据库而言,TDengine 展现的是代际优势,一定能将他们逐步淘汰。工业软件的世界舞台,不再只属于 Siemens, Schneider, GE 等公司,也会有 TDengine 的身影,我们不只是追赶者,而是领航人。
我一直觉得自己很幸运,湖南农村长大,但在中国和美国都受到了很好的教育,并且赶上了互联网、移动互联网的浪潮,在本该游山玩水的年龄,又倒腾上了时序数据库,居然能有超 80 万套的安装量。如今AI浪潮席卷而来,庆幸自己还在牌桌上,而且手里抓的牌还不错,必须打出精彩。
虽然已经 57 岁,写程序超过 40 年,但继续奔跑,再来八年又何妨?Leave a dent in the world!
陶建辉
2025年7月30日写于北京望京