在一次工业数智化直播中,听众朋友留言想了解机理模型与统计模型的结合方法,鉴于这个话题与直播主题差别很大,当时没有详细展开,故写此文兼做探讨。
机理模型的范畴:定性与定量机理
很多朋友想了解的是深度学习与微分代数方程组(包括常微分方程、偏微分方程,或非线性方程组等)的结合方式,这个话题将在下一节讨论。本节对概念范畴做简要辨析,避免过度追求技术方法,以偏概全。
从字面上讲,机理模型就是描述过程机制或原理的模型。不仅仅包括定量的数学模型,也应该包括定性的描述变量间的驱动关系模型。定性机理模型和专家规则通常都是用非数学语言刻画的,但定性机理模型描述是变量间的驱动关系,而很多专家规则描述是研判逻辑或处理逻辑。把通过数值计算获得宏观结果的仿真模型也归为机理模型。把用微分代数方程组描述的机理模型暂称为“数学模型”。因此,本文中的机理模型分为三类,数学模型、仿真模型和定性机理模型。
机理是分层次的。以锅炉管道结垢为例,从微观层面上看[1],水中的钙镁等盐类受热、分解、蒸发浓缩等变化,在受热面上生成一层固态附着物,如图a所示,这样的机理对与降低结垢工艺与药剂的研发有帮助;对于结垢成份及其特性的机理,如图b所示,对于结垢厚度检测装置或除垢工艺有帮助;结垢后锅炉状态变化的定性机理,对于开发锅炉状态维修模型有帮助。从上面的讨论可以看出,机理不一定是因果,或者说因果也是分层次的。应该从待解问题的工程可解性角度选择合适的颗粒度。
统计模型与数学模型的4种融合范式
(1)分析模型为机理模型做模型校准,提供参数的点估计或分布估计,如Kalman滤波。
(2)分析模型为机理模型做后期处理或补充。例如,利用统计方法对WRF(Weather Research and Forecasting Model)天气预报模型的结果进行修正;或者利用统计方法综合多个机理模型,提高预测的稳定性。机理模型由于未建模因素、参数不精准造成精度低。机理模型的系统辨析需要有效激励输入,但实际的工业系统为了安全和寿命,会限制激励信号的形式。这造成了机理模型与物理过程存在一定偏差。分析模型虽然是数据自适应,但在参数维度高的时候对训练数据集要求过高,泛化能力差。通常做法是分析模型去拟合机理模型的残差[2]。