找回密码
 立即注册
首页 业界区 科技 清华大学软件学院院长王建民教授:AI 时代,如何从采数 ...

清华大学软件学院院长王建民教授:AI 时代,如何从采数到用数?

闰咄阅 昨天 13:11
7 月 5 日,2025 时序数据库技术创新大会在北京成功举办,收获强烈反响。本次大会以「下一站:DB + AI」为主题,汇集了超 30 位大咖嘉宾,学术界权威专家、企业代表、开发者围绕时序数据库 Apache IoTDB 的自研技术成果与应用落地实例,探讨工业物联网领域如何借助 AI 技术与数据库融合驱动智能化升级。
我们邀请到清华大学软件学院院长王建民教授参加此次大会,并做主题报告——《AI 时代,从“采数”到“用数”的跨越》。以下为报告核心内容总结。
01 AI 时代带来软件开发范式革命

王建民教授指出,当前 AI 时代数据库面临的核心挑战是如何实现从数据采集到数据价值挖掘的跨越式发展,引用大会上孙院士(中国工程院孙家广院士)的观点,认为评判一个产品成功与否的关键在于“用户用得好不好”,这一观点为后续演讲奠定了基调。
王建民教授提到 OpenAI 创始成员、特斯拉前 AI 总裁安德烈·卡帕斯的观点,深入剖析了 AI 时代软件开发的三大演进阶段。软件 1.0 时代以传统编程语言为基础,从汇编到 C、Java、Python 等高级语言,完全依赖程序员编写算法;软件 2.0 时代则以大模型为核心,通过数据训练和参数化实现智能推理;而软件 3.0 时代,则实现了用自然语言提示词直接生成软件的革命性突破。
王建民教授特别强调,这三个阶段并非简单的线性替代,而是呈现出并存共生的生态格局,指出这种变革使得"人人都是程序员,人人都是创造者"正在成为现实,极大地拓展了软件创新的可能性边界。
1.png

在探讨 AI 对计算机学科的影响时,王建民教授提到了 MIT 教授塞缪尔·马登的研究成果,指出虽然计算机科学的基础架构(如硬件设备、系统类型等)保持相对稳定,但应用层面正在发生深刻变革:计算范式从 CPU 向 GPU 迁移,操作系统从单进程向并行集群演进,AI 技术正在重塑整个应用开发生态。王建民教授认为,这种变化不是简单的技术迭代,而是整个学科范式的重构,将为计算机科学带来全新的发展机遇。
2.png

02 工业终端的智能化趋势

而在工业领域的发展方面,王建民教授特别强调了工业终端设备的智能化发展趋势。他指出,智能制造的核心变革正发生在终端设备层面,现代工业终端已经实现了计算能力和通信能力的深度融合。试飞场景中,国产大飞机内部大量采用智能联网设备;在军事装备和储能行业,终端设备的智能化升级正在带来战斗力和业务模式的本质性改变。
王建民教授认为,这种终端变革将引发更深层次的产业重构。当工业终端完成智能化转型后,将打破传统产业边界,推动第一、二、三产业的深度融合。
3.png

03 采数:工业大数据的多源体系

王建民教授系统梳理了工业数据的三大核心来源:首先是智能终端数据,如飞机、储能设备等物联网设备产生的时序数据;其次是企业信息化数据,包括 CAD 系统数据、客户终端数据等;第三类是互联网跨界数据,涵盖气候、地理、环境等方向。
他特别以波音公司的理念为例,强调数据在制造流程中的核心地位,数据能够支撑赋能生产、管理流程,并指出工业数据来源广泛,通过 IT 和 OT 的融合,多源异构数据能够有效整合,为生产优化、质量管控等关键业务场景提供数据支撑。
4.png

04 用数:从产业数字化到数字产业化

多源数据构成了现代工业的"价值图谱",但关键在于如何将这些数据资源转化为实际生产力。王建民教授提出了数据应用的两个阶段:产业数字化阶段实现基础的数据查询、监测、预警等功能;数字产业化阶段通过商务智能(BI)与人工智能(AI),实现“数据控制设备”,让数据价值真正赋能业务系统,优化工业流程。
同时,王建民教授深入剖析了数据应用落地的关键成功要素,强调成功的数字化转型需要软件工具、领域知识和数学方法的深度融合。这三个要素不是简单的叠加关系,而是乘积效应——任何一个要素的缺失都会导致整体效果归零。他特别提出“以终为始”的方法论:首先要明确数据解决方案如何嵌入实际业务流程形成闭环,然后逆向推导所需的业务支持,最后才考虑数据和技术实现,以需求牵引、业务驱动为思路,避免陷入"为技术而技术"的误区。
5.png

05 时序数据库 IoTDB 的技术创新

王建民教授重点介绍了时序数据库 IoTDB 面向 AI 与工业智能化趋势的突破性实践。IoTDB 不仅是一款数据库管理系统,通过合并嵌入式终端 IoTNode 与训练推理节点 AINode,并将 TsFile 作为建立工业数据集的底层文件格式,用户能够实现从设备数据采集到智能应用的全流程无缝衔接。
这一架构使得工业数据在源头即可按标准化格式存储,避免了繁琐的数据转换过程,同时用户能够通过内置的 AI 能力,低成本地完成时序数据分析、模型训练和实时推理。
6.png

目前,IoTDB 已实现 MCP 功能,可以通过提示词直接实现时序数据的查询与分析,该功能已被 MCP 官网收录。
7.png

在时序大模型应用方面,王建民教授强调,数据质量和算法同等重要,算法确定以后,数据决定了模型的高度。时序数据体量庞大,历史数据往往无法有效使用,存储即“沉睡”。王建民教授认为,这些历史数据能够参与形成时序大模型的底层数据集,提升大模型训练与预测质量,IoTDB 也能够更好地激活"沉睡"的历史数据,挖掘其潜在价值。
8.png

结合时序大模型,IoTDB 实现了“AI in DB”的能力,使得用户可以直接通过 SQL 语句完成模型的后训练工作。这意味着在未来,只要掌握 IoTDB,任何使用者都能胜任数据分析和模型调优的工作。
9.png

IoTDB 也实现了通过 SQL 语句完成数据推理与预测的能力。王建民教授认为,从商业智能(BI)到人工智能(AI)的范式转变,其本质是从历史数据分析转向未来态势预测,这种转变正在推动业务系统逐步实现预测性控制和智能决策。
10.png

06 未来展望

展望未来,王建民教授描绘了工业数据应用的三大发展趋势:终端设备将具备更强的智能化水平;云端功能将从单纯的数据存储进化为模型知识提炼;伴随多源数据的智能融合,时空大模型将在工业领域得到广泛应用。未来的工业系统将实现真正的“人机共融”,数据必将成为推动工业转型升级的核心动能。
11.png


来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册