世界微动态丨物理信息深度学习:一种有潜力的系统可靠性评估技术

,参数动态反映在 t 时刻从状态 i 转换为状态 j 的转换率。表示时刻 t 对应的状态转换率矩阵Q(t)如公式(1)所示:其中,。每个时刻 t 的系统状态由概率向量表示,即,其中表示系统在时刻t处于状态j的概率,因此。系统的状态概率根据由一组微分方程组成的前向Kolmogorov方程导出,其中参数由公式(2)中的转换率矩阵和状态概率向量决定,通过汇总认为系统是正常运行的状态概率来确定系统的可靠性。其中,p"(t)是p(t)关于系统运行时间t的导数;p(t=0)为初始条件,表示零时刻的系统状态。

2.1系统可靠性评估的深度学习框架


【资料图】

如下图所示,将系统属性编码到神经网络的配置和训练中:

作为系统可靠性估计p(t)的近似,其中表示由参数化的神经网络,全局时间t作为神经网络输入,输出层中的神经元数量与系统状态数量相等,并且在输出层使用SoftMax激活函数提供关于每个系统状态的概率,这隐含满足了系统所有状态概率和为1的约束;

建立诱导神经网络获得系统状态概率p"(t)的导数,其中 是一个采用自动微分法的基于的诱导神经网络。

约束神经网络训练过程以满足公式(2,3)所示的系统初始条件和系统状态转换模型,因此结合两个残差项构造复合损失函数:其中,第一项强制神经网络与公式所给的初始条件相同,第二项通过惩罚配置点强制执行与系统状态转换一致的训练过程,是平衡损失项的权重因子,将此表述为最小化问题并通过基于梯度的优化训练算法训练神经网络:

学习最佳的参数以便对系统可靠性评估的解决方案进行参数化。利用公式(6)评估任何时刻的系统状态概率,其中表示时刻t的第j个状态概率。如公式(7)所示,通过聚合一组系统可靠工作的系统状态集合U中的概率得到系统可靠性R(t):

2.2系统可靠性评估物理信息生成对抗网络

如下图所示,将系统属性和数据约束编码到网络配置和训练中,在生成器和判别器之间形成对抗性博弈。

设计为在给定的随机噪声向量Z和时刻t的情况下产生假数据集,其中Z是具有多变量高斯分布的随机潜变量的集合,用来构建系统状态概率的概率表示,假数据近似满足由公式(2)描述的基本状态转换。与2.1部分相同,生成器有额外的损失项来约束学习过程与测量数据保持一致。系统真实测量数据用表示,其中,系统的初始条件也被视为一种测量数据,二者结合为,其中,。生成器的损失函数如下公式(8)所示。第一项欺骗判别器将假数据集标记为真实数据,第二项约束生成的假数据与测量数据一致,第三项根据领域知识施加约束:判别器旨在区分生成模型生成的假数据集和从测量中收集的真实数据集。判别器损失函数如下方程(9)所示,第一项最大化以正确分类真实测量数据,第二项最大化以正确检测生成器产生的假数据集:在生成器与判别器间分别使用与两个相互博弈的损失函数,推导出对抗训练规则来更新向量与中包含的未知模型参数,通过交替优化公式(10,11)中的两个目标来训练PIGAN:可被用来模拟系统的可靠性。其中,系统的可靠性评估是通过生成器随机前向通道抽取N个样本来完成的,通过公式(12)中关于每个样本的预测平均值来确定第j个状态概率的点估计,用公式(13)中的双标准偏差的区间来描述第j个状态概率的不确定性:);③状态2,系统在降级状态下运行,另一个处理器故障导致安全关闭(概率);④状态3,由于两种情况,系统出现不安全的故障:两个处理器中的任何一个出现故障,但未被发现(概率)与当系统在退化状态下运行时,另一个处理器故障导致系统进入不安全状态(概率)。不同状态间转换遵循威布尔分布,并且转换率为,其中t是系统的运行时间。因此形成了一个非齐次的连续时间马尔可夫过程,其中的转换率取决于系统的运行时间。设定,,和。相应的转换率矩阵为:

3.1 不确定性量化预测

下图分别展示了对系统状态概率和系统可靠性的不确定性量化的预测结果,利用所提出的方法和利用蒙特卡洛模拟方法所取得的结果保持一致。虽然在每个状态概率的平均预测和不确定性约束中都观察到了一些偏差,但这种偏差可以归因于蒙特卡洛模拟和神经网络配置所带来的不确定性。可以通过增加蒙特卡罗模拟的重复次数和迭代次数,以及加强网络配置和训练过程进一步减少这种不一致性。

3.2 融合测量数据后的可靠性演化趋势预测

根据2.2节中所提方法将合成测量数据纳入系统可靠性评估,这将反过来导致系统的可靠性演化,在不同的检测时间段产生合成测量数据来反映与基线系统的性能偏差(更好或或更差)。据此可以启发式地评估模拟系统的可靠性演化趋势,如果更新的可靠性演化趋势与用于生成这种合成测量数据的假设一致,那么可以认为所提出的方法在纳入系统服务寿命期间收集的测量数据方面是有效的。下图分别展示了性能较差系统和较好系统在纳入合成测量数据后的可靠性演化。

由图可知,该方法一般可以捕捉到系统的可靠性低于或大于基线情况的趋势;且随着两个系统融合更多的检测数据,模拟的系统可靠性曲线和基线系统可靠性曲线之间的距离逐渐变大,说明更多的测量数据使模型更有信心推断出模拟系统与基线情况不同。

4

总结

针对马尔科夫系统,作者提出了一种基于物理信息的深度学习方法将深度学习和系统可靠性评估联系起来,通过数据约束和描述系统可靠性演化的物理模型之间的对抗博弈制定深度概率设置,将不确定性量化和测量数据纳入系统可靠性评估。为了约束神经网络的训练过程,设计了相应的损失函数,并与蒙特卡洛模拟等基线方法进行了广泛的实验比较,结果验证了该方法在融合测量数据方面的有效性及在计算效率方面的优越性。

撰稿|丁永杰

内容校对|葛世寅 陈晖萱

排版|郑楠

责任编辑|郭旦怀

关键词: