PHM算法与智能分析技术

1147-柳同学

发表文章数:600

热门标签

首页 » 算法 » 正文

一、 智能维护技术引述

1.智能维护技术的发展与问题(PHM技术产生的背景)

​ 智能维护的目标是为了解决生产制造中出现的问题,包括设备的停机、部件的损坏,质量的不良以及能量的低利用率。我们要解决这些问题并不能从这些问题产生的表象入手,而是要关注产生这些表象的原因,我们一般称这些原因为不可见问题。不可见问题包括零件的磨损、腐蚀、泄露、人为操作甚至是环境因素,这些因素有多种多样的表征形式,这些因素很可能会互相耦合、交叉,共同作用产生这些失效。对于这种情况,我们要从源头入手来避免这些问题。 要避免这些问题,需要利用监控、分析甚至是决策支持手段来去解决这些问题。那么,如何避免不可见问题的发生呢?很重要的一点就是做预测。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cAKjfF2F-1638515313963)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638340174842.png)]

​ 维护策略的演进按照上面几个步骤进行:

  • 传统反应式维护(RM):等待设备出现问题再进行维修
  • 高可靠性设备过维护(PM):对于高可靠性设备不能被原有的传统反应式维护来满足可靠性的要求,所以,我们需要做过维护,这种过维护纯粹是基于时间的,频繁的更换尚未损坏(仍能使用一段时间)的零件,这种维护方式成本非常高昂
  • 基于状态监测的维护(CBM):这种维护不再单纯依赖于时间,而是通过从设备里面测量得到的物理量来发现故障出现的早期现象,从而避免严重故障的发生
  • 故障预测与健康维护(PHM):在状态监测基础上预测设备的使用寿命

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GVdit4w8-1638515313964)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638340790252.png)]

随着维护技术的发展,设备生命周期内的维护成本是逐渐降低的,但是模型的复杂程度会逐渐升高,即系统的智能化程度不断升高。

2. PHM概念与方法论

2.1 PHM概念

​ PHM是一种系统工程学科,它聚焦于对复杂工程系统健康状态的检测、预测与管理。PHM所关注的问题可概括为以下几个方面:

  • 降低成本:比如通过对非预期的停机事件进行预测并且避免;
  • 减少过度维护,最大化部件的使用寿命;
  • 减少生产制造中不良的产品;
  • 提高设备的可靠性

2.2 MTBD(Mean-Time-Before-Degradation)

​ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tD4IC78Z-1638515313965)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638341502163.png)]

 失效发生的平均时间(MTBF)是可靠性里面的重要概念。这个概念所针对的是被大批量生产、重复性比较大的设备,我们单纯基于时间就可以统计出可靠性的指标(MTBF)。在PHM中,我们关心的不是失效的平均间隔时间,而是失效发生之前发生衰退的时间(MTBD)。

2.3 常见概念分析

  • Prognostics :预诊断;在工业中,我们称其为故障诊断,狭义上,指的是对设备使用寿命的预测
  • Health prediction:健康预测;指的是在近期的时间段内,预测设备健康值的走向,起到趋势预测的作用,还达不到对剩余使用寿命的预测。
  • Failure:失效;分为硬失效与软失效,硬失效:比如组件的损坏,设备的停机、不良产品;软失效:比如:设备的可靠性降低即设备仍然能运转,但是发生了衰退
  • Run-to-failure data:全生命周期数据
  • Measurements:测量:来自状态监测的数据。系统输出:行为数据;系统输入:操作条件数据
  • Features:特征:从原始数据中提取的信息。
  • Health index:健康指数

2.4 故障预测的主要方法

​ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nopMC3dx-1638515313965)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638344243920.png)]

  • 基于机理进行建模,控制学科衍生对故障的检测与分类

  • 混合方法

  • 基于可靠性统计分析来做故障预测

  • 数据驱动方式

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-612UWyEp-1638515313965)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638344551542.png)]

从特征空间中我们可以看到,如果设备处于一个健康的状态,它会处于一个特定的分布范围内;如果设备失效的话,则会在特征空间发生漂移,如果我们的设备的状态进行实时监测,我们就可以预测出什么时候跑出失效边界,从而预测剩余寿命。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oD3BYwHh-1638515313966)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638344771961.png)]

那么,是不是所有的系统都可以做剩余使用寿命预测?做剩余使用寿命预测需要全生命周期的数据。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aYu3m14r-1638515313967)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638345039587.png)]

上图展示了不同层次的PHM系统功能

  • 健康评估:基于健康状态数据
  • 故障诊断:基于故障数据
  • 故障预测:基于全生命周期数据

2.5实现PHM建模的方法论

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tRN20TCp-1638515313967)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638345343270.png)]

  • 数据采集
  • 信号处理、降噪、清洗
  • 特征提取与特征选择
  • 建立健康评估与故障诊断的模型来描述当前对象的健康状态
  • 对健康状态做预测
  • 将评估结果可视化的呈现给用户

3. PHM系统设计

​ 开发流程如下:

  1. 需求定义:对象是否适合做PHM,如果适合的话,关注哪一类故障模式,关注什么具体问题
  2. 监控层次定义:要做组件级的还是设备级的还是产线级的还是工厂级的
  3. 分析模型选择:分析是强数据弱机理还是弱数据强机理,甚至是强数据强机理,取决于使用什么模型
  4. 关键参数选择:与第一步、第二步相对应,业务目标与关键参数是关联的
  5. 部署策略和实验设计:采集能进行可行性分析的数据,尽量采集完整的工况,并且尽量覆盖到不同的失效模式。如果能有全生命周期数据是最好的
  6. 技术和经济性可行性研究
  7. 技术开发与线上应用

二、数据预处理与特征提取方法

1.数据预处理

​ 为什么需要进行数据预处理?

  • Broken:数据分散在多个信息系统中,碎片化问题严重
  • Bad Quality:工业现场环境恶劣,数据质量差
  • Background:数据受到设备参数设定、工况、环境等背景信息的影响

​ 数据预处理的目标:降低工业数据“3B”问题对建模的影响

  • 检测数据质量,降低异常数据的干扰
  • 识别数据的背景信息,对不同工况下的数据分别进行标准化处理
  • 整合碎片化数据,并准备建模和验证所需的数据集
  • 通过数据变换强化“建模线索”

2.数据预处理常用方法

​ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-quomiwks-1638515313968)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638350535813.png)]

  1. 工况分割

    工况分割目的:将设备在不同运行状态下的数据能够分割出来,来做后续有针对性的特征提取

    常见的工况参数:速度(流速、转速)、环境参数(湿度、温度)、负载、Task/Recipe

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-z1u6TWnu-1638515313968)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638350804794.png)]

  2. 数据清洗与平滑

    数据清洗:将数据中的异常点尽可能去除,降低其对模型训练的干扰

    4种基于数据分布的异常点检测算法:

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U7eH8V9d-1638515313969)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638351045049.png)]

    针对时间序列数据,往往采用数据平滑的方法降低噪声的影响

  3. (振动)数据质量检测

    分析振动信号数据是否正常,对不正常的振动信号做一些特别的处理

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MKFXrqk6-1638515313969)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638351374948.png)]

  4. 数据归一化

    数据归一化:将数据中不同的变量/特征值转换到同样的分布或者取值区间中

    目的:提高数据建模的精度;加速模型训练的参数优化求解过程

    典型案例:将CNC机床主轴振动信号的不同特征值做归一化处理以便训练神经网络异常检测模型

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M4K7K7tP-1638515313970)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638351625570.png)]

  5. 数据样本平衡

    通过数据过采样、重采样或者欠采样改善数据不同类别的平衡性,提高建模的精度

    典型案例:通过过采样增加电力电子器件故障预测模型的故障样本数据

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZKY6RNSp-1638515313970)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638351854065.png)]

  6. 数据分割

    将数据集分割成训练集、验证集与测试集,以用作不同的目的。尤其是对于分类模型,需要采样分层抽样的方法,来确保各个数据集之间不同类型的样本的比例是基本保持一致的

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qoebapIR-1638515313970)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638351959975.png)]

3.特征提取

​ 特征提取的目的是通过采用合适的特征提取方法从原始数据中提取与建模相关的有效特征来建立模型。常用的特征提取方法包括:

  • 时域特征提取
  • 频域特征提取
  • 时频域特征提取

3.1 时域特征提取

​ 时域特征包括:RMS、峰峰值、峭度、裕度、歪度、均值、均方根、脉冲因数、波形因数、波峰因数。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-78A884K4-1638515313971)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638358445593.png)]

上图(a)展示了四种不同健康条件下的轴承振动信号,从振动信号波形图中可直观看出轴承健康程度不同对应信号波形特征以及幅值大小也不同。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4FrLt1u9-1638515313971)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638358582941.png)]

上图(b)展示了柴油机四种不同健康状态下振动信号的特征参数,可以看出:不同状态下特征参数存在差异。

3.2 频域特征提取

​ 频域特征提取主要包括:

  • 频带能量提取:在频谱指定频段内,提取该频段内所对应的能量
  • 特征频率提取:在特定的频率点,提取该频率点所对应的幅值

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xerrSFpo-1638515313972)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638358888430.png)]

上图一是轴承正常状态下所对应的FFT频谱,上图二是轴承出现磨损情况下所对应的FFT频谱,从这两个图中,我们可以清晰的看到:当轴承出现磨损的时候,会在4000Hz8000Hz这个区间出现共振频带,所以,我们可以将4000Hz8000Hz这个频段的能量作为区分发电机轴承磨损与正常状态下的特征参数。另外,我们可以对这个共振频带进行解调得到包络谱,在包络谱中,我们可以看到轴承对应的故障特征频率,如:下图一与下图二。从包络谱中,我们可以看到外圈故障特征频率(BPFO)与内圈故障特征频率(BPFI),因此,我们可以将特征频率作为特征参数来提取特征频率所对应的幅值。

3.3 时频域特征提取

​ 常用的时频域分析方法包括:短时傅里叶变换(STFT)、小波分析。时频域分析适用于分析非平稳信号,针对非平稳信号的特征提取可考虑时频域分析。时频域分析的优点在于可以从时域、频域、幅值三个维度来观察信号的特征。

​ 某典型非平稳信号的STFT结果如图所示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kmNlx4MK-1638515313972)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638362235089.png)]

在E1、E2、E3、E4这四个位置出现了能量比较集中的区域,对应的频率、时刻均不相同,所以,我们可以将E1、E2、E3、E4所对应的能量作为该信号的一个特征用于后续分析。可以将该区域所对应的幅值相加来作为该区域所对应的能量。

​ 小波对齿轮箱高速端振动信号时频域分析如下图所示:(选用不同的小波。分析结果不同)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZYYSV190-1638515313973)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638362681265.png)]

小波分析不同于短时傅里叶变换(STFT),小波分析所采用的的基函数是一种幅值衰减、可伸缩、可平移的一种小波基;而短时傅里叶变换(STFT)是基于FFT进行的,FFT的基函数是一种不限长的正弦函数,所以,通常情况下,小波分析要优于短时傅里叶变换,但是小波分析也有自身的缺点,比如小波基比较难以选择,当我们选择不同的小波基时,最后所产生的结果不相同。如上图一,采用Cmor3-3小波进行分析,我们可以在A这个位置清晰的发现齿轮箱啮合频率,而上图二并没有提取出齿轮箱啮合频率。对比上面两图,我们可以发现:采用不同的小波对最后的结果会产生比较大的影响。在实践中,我们可以尝试多种小波,选择分析效果最好的小波作为小波基。

4.特征选择

特征选择的目的:

  • 减少数据量,避免数据量多大
  • 为后续数据处理提供更好地理解
  • 减少传感器安装数量
  • 提高算法计算效率

特征选择的常用方法:

  • 基于经验方法

    利用专家领域知识选择相应的变量(如:轴承特征参数通常选RMS、峰峰值、峭度值、歪度,与风电机组振动相关的参数包括:功率、转速、风速)。当轴承出现磨损时,轴承的RMS、峰峰值、峭度值、歪度就会发生变化,所以,我们可以将轴承的RMS、峰峰值、峭度值、歪度作为有效特征来进行选择。风电机组同理

  • 基于封装的特征选择方法

    • 尝试多个变量的组合,选择模型性能最优的变量组合,如:分类模型
    • 全局优化及搜索算法,如遗传算法,适用于解决大规模特征选择问题
    • 启发式变量选择方法,如:前向选择法、后向消除法
  • 过滤法

    • 互信息法:某个特征与某类之间的互信息越大,表明该特征越有效,后续选择该特征进行建模

    • Fisher score:选择得分高的特征作为有效特征。

      Fisher score原理是通过判断每个特征和各类样本之间方差大小来对各特征进行评分,若该特征与某类样本方差小,与其他类样本方差大,则该特征得分高,属于有效特征,利于数据分析。

      Fisher score的计算方法如下:

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JEvheXp1-1638515313973)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638365574466.png)]

      式中,

      n

      k

      n_k

      nk表示第

      k

      k

      k类样本的个数,

      f

      j

      ,

      i

      f_{j,i}

      fj,i表示第

      i

      i

      i个特征在第

      j

      j

      j个样本里的值,

      u

      f

      i

      u_{f_i}

      ufi表示第

      i

      i

      i个特征

      f

      i

      f_i

      fi的均值,

      u

      f

      i

      k

      u_{f_i}^k

      ufik表示第

      i

      i

      i个特征

      f

      i

      f_i

      fi在第

      k

      k

      k类中的均值。

4.1 案例:柴油机燃爆故障特征选择

柴油机燃爆故障检测:

  • 对四冲程柴油机的四个冲程进行分割

  • 定义燃烧段:从喷射燃油到排气冲程开始

  • 测量信号:缸内压力信号、柴油机振动信号

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cv6iu9iJ-1638515313974)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638366183878.png)]

  • 下图给出了柴油机不同故障状态下特征参数的Fisher Score,柱状图给出了各特征参数的得分,得分越高表明该参数的有效性越高

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0QDbePml-1638515313974)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638366282409.png)]

5.降维

降维的目的:

  • 减少计算量,提高计算效率
  • 提高模型泛化能力

常用的降维的方法是基于PCA的降维,通过空间转换将高维数据转化为低维数据,通过PCA降维可减少原参数之间的相关性。PCA降维是寻找能代表原特征参数绝大部分信息的主成分。

三、健康评估建模方法

1.健康评估基本概念

健康评估的目标是将高维特征向量转换为单个健康指数(健康状态、健康置信度CV等)。健康指标类型有

  • 以物理量作为健康指标

    • 例如桥梁裂纹、刀具磨损量等
    • 可以使用回归模型拟合,例如神经网络等
  • 基于概率的健康指标

    • 0到1之间的概率值
    • 例如由逻辑回归模型或t平方统计得到的概率
  • 虚拟健康指标

    • 数学意义上的标量
    • 例如马氏距离,SOM的MQE

数据驱动的健康评估分为两个阶段:训练阶段与验证阶段。训练阶段是基于历史数据训练健康评估模型。验证阶段是将当前转台与已训练好的健康评估模型计算得到健康值。

2.健康评估常用算法

  1. 逻辑回归

    • 线性回归:自变量线性组合估计因变量

      y

      =

      α

      +

      β

      1

      x

      1

      +

      β

      2

      x

      2

      +

      .

      .

      .

      +

      β

      i

      x

      i

      y=/alpha+/beta_1x_1+/beta_2x_2+…+/beta_ix_i

      y=α+β1x1+β2x2+...+βixi

    • 逻辑回归:自变量线性组合估计因变量的概率

      I

      n

      (

      P

      r

      (

      y

      =

      1

      )

      1

      P

      r

      (

      y

      =

      1

      )

      )

      =

      α

      +

      β

      1

      x

      1

      +

      β

      2

      x

      2

      +

      .

      .

      .

      +

      β

      i

      x

      i

      In(/frac{Pr(y=1)}{1-Pr(y=1)})=/alpha+/beta_1x_1+/beta_2x_2+…+/beta_ix_i

      In(1Pr(y=1)Pr(y=1))=α+β1x1+β2x2+...+βixi

    训练:需要健康和故障的带标签数据

    最终的健康值为:

    C

    V

    (

    x

    )

    =

    e

    x

    p

    (

    α

    +

    β

    1

    x

    1

    +

    β

    2

    x

    2

    +

    .

    .

    .

    +

    β

    k

    x

    k

    )

    1

    +

    e

    x

    p

    (

    α

    +

    β

    1

    x

    1

    +

    β

    2

    x

    2

    +

    .

    .

    .

    +

    β

    k

    x

    k

    CV(x)=/frac{exp(/alpha+/beta_1x_1+/beta_2x_2+…+/beta_kx_k)}{1+exp(/alpha+/beta_1x_1+/beta_2x_2+…+/beta_kx_k}

    CV(x)=1+exp(α+β1x1+β2x2+...+βkxkexp(α+β1x1+β2x2+...+βkxk)

  2. 统计模式识别(只有健康数据而没有故障数据时,会使用这个方法来计算健康值)

    计算当前特征分布和健康特征分布的偏移程度(假设符合高斯分布)。 对于非高斯分布的情况,使用高斯混合模型进行拟合

    • L2距离:两个高斯分布(H1,H2)的重叠部分

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oNPGSugH-1638515313974)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638426867992.png)]

    • 健康指标:当前特征分布和健康特征分布的正则化L2距离

      C

      V

      =

      H

      (

      x

      )

      G

      (

      x

      )

      L

      2

      H

      (

      x

      )

      L

      2

      G

      (

      x

      )

      L

      2

      CV=/frac{||H(x)·G(x)||_{L_2}}{||H(x)||_{L_2}||G(x)||_{L_2}}

      CV=H(x)L2G(x)L2H(x)G(x)L2

  3. 高斯混合模型(GMM):一种混合分布密度估计的概率模型

    H

    (

    x

    )

    =

    i

    =

    1

    n

    p

    i

    h

    (

    x

    ;

    θ

    i

    )

    H(x)=/sum_{i=1}^np_ih(x;/theta_i)

    H(x)=i=1npih(x;θi)

    • 每个分量模型可以用以下参数表达:

      • h

        (

        x

        ,

        θ

        i

        )

        h(x,/theta_i)

        h(x,θi):分量概率密度函数

      • p

        i

        p_i

        pi:样本来自这个分量模型的概率

    • 健康值CV:多个高斯模型L2距离的平均值

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c39V0BYW-1638515313975)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638427670819.png)]

    在高斯混合模型中,模型选择的个数是一个重要的超参数,会用到一些参数选择的指标/准则-AIC准则与BIC准则,会用于平衡模型的复杂度与模型的准确度,惩罚过多的模型变量。

    A

    I

    C

    =

    2

    K

    2

    l

    n

    (

    L

    )

    B

    I

    C

    =

    K

    l

    n

    (

    n

    )

    2

    l

    n

    (

    L

    )

    AIC=2K-2ln(L)//BIC=Kln(n)-2ln(L)

    AIC=2K2ln(L)BIC=Kln(n)2ln(L)

  4. 自组织映射神经网络(SOM)

    将高维数据转化为U-matrix,数据可视化效果突出,可用于无监督或有监督问题

    • SOM健康指标:最小量化误差方法(MQE)

      M

      Q

      E

      =

      D

      w

      b

      m

      u

      MQE=||D-w_{bmu}||

      MQE=Dwbmu

      • 数据训练出U-matrix,用当前状态的特征向量放入U-matrix中,查看位置处于何处,找到离它最近的best matching unit(bmu),当前位置与bmu的欧氏距离即为MQE,MQE用于评估其健康状态

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A6HvshKS-1638515313975)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638428514633.png)]

      从图中可以看出:当出现故障时,MQE值大幅上升。所以这种方法需要故障数据

  5. 自联想神经网络:数据重构,用于挖掘多维特征之间的非线性关系

    基本思想是训练出健康状态的模型,将当前状态的数据放到模型中,计算出模型拟合的残差,残差值越大表明离健康状态的偏移值越高

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TVEy0XyB-1638515313975)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638428677595.png)]

    • 三层结构:映射层、瓶颈层、解映射层

    • 常用健康指标:模型残差

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kKbJ0W5Q-1638515313976)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638429007319.png)]

      图中可以看出:相较于健康的风速仪,衰退的风速仪对模型拟合的残差较大

3.案例分析:风速仪健康评估

三杯风速计是风资源评估研究的行业标准。风力资源评估是风场开发的第一步。风电开发商将其用于估算拟建场地的未来能源产量。风速仪受损或者超出公差范围都将影响到对风场能源产量的准确评估,尤其是无法及时监测到受损风速仪将会严重影响投资回报率的评估,例如,年平均风速估计值的2%误差可能导致发电量差异达到6%,这直接影响投资回报率。

数据( 2011年PHM数据竞赛-风速仪健康评估数据)结构:

  • 三个不同高度的风速仪测量数据
  • 只有健康状况的数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OTlOSRxY-1638515313976)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638435213962.png)]

将训练数据进行数据过滤、数据归一化后,放入自联想神经网络(AANN)中进行训练,并将训练的模型保存进来。将测试数据经过同样的处理后也放到训练好的模型里,计算得到残差。最后,做一个残差的聚类,观察有没有工况的变化,最后就可以得出风速仪是否是正常的。

​ 这里的数据归一化是将不同高度的风速转换到相同高度

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QBbExotu-1638515313976)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638435586537.png)]

​ 这里的模型集成了多个AANN模型,降低了不确定性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nrK9M7Sk-1638515313977)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638435684555.png)]

​ 残差信号的K-Means聚类:双峰分布

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3ExYlQNS-1638515313977)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638435887940.png)]

上图是残差的频次统计直方图,从直方图上可以看出是双峰的分布,因此,可以猜想这是由于连个工况导致的,需要计算当前状态的风速仪偏移某一个状态的距离,即计算残差和正常分布的偏移度,设定失效阈值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hnKCunjC-1638515313977)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638436167917.png)]

四、故障诊断建模方法

1.故障诊断基本概念

故障诊断是通过检查观察到的症状来确定问题的本质。故障诊断的目标是将高维特征向量转换为状态标识(健康状态、失效模式1、失效模式2、…、失效模式N)。在数据驱动的故障诊断中分为两个阶段:

  • 训练阶段

    基于历史数据训练故障诊断模型

  • 测试阶段

    利用已训练好的故障诊断模型与当前状态的特征向量来计算当前状态标识

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MvkhSvv3-1638515313978)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638442884963.png)]

2.故障诊断常用算法

2.1 支持向量机(SVM)

支持向量机的核心思想:找到最优分类面将正负样本分开,使得样本到分类面的距离尽可能远。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并且能够推广应用到函数拟合等其他机器学习问题中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-79JKGAEE-1638515313978)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638443183493.png)]

SVM对于二维空间非线性可分数据,可以引入核函数技巧,利用核函数把低维特征映射到高维空间,实现线性可分。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BgkX5wxL-1638515313978)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638443436706.png)]

同时,它也可以解决多分类的故障诊断问题。

​ 机器学习中也有其他常用的分类算法:

  • 随机森林
  • 集成学习
  • 神经网络

2.2 自组织映射神经网络(SOM)

​ “自组织”指的是学习和组织信息的能力,不需要为输入模式提供相应的依赖输出值,是一种无监督式学习。SOM是一种常见的神经网络技术,优点在于能够不断学习训练数据的内在模态与模式,形成神经网络的模型,将一些高维的特征矩阵转化成二维的蜂窝状的映射图(SOM可视化效果非常好),实现故障的分类。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RLkG4O6D-1638515313979)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638446920156.png)]

​ SOM的核心机制是竞争学习,训练过程为:根据训练数据样本大小与特征维度来构造初始的SOM网络的模型结构,数据训练出U-matrix,用当前状态的特征向量放入U-matrix中,查看位置处于何处,找到离它最近的best matching unit(bmu),当前位置与bmu的欧氏距离即为MQE,MQE用于评估其健康状态。

  • U-matrix

    颜色表示相邻神经元之间的距离,颜色越浅表示距离越近,颜色越深表示距离越远。距离较大表示分类的边界

  • Hit map

    将测试数据放到训练好的U-matrix中,实现故障诊断分类

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UG8I9GMK-1638515313979)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638447228179.png)]

SOM在做故障诊断与健康评估是有区别的。

  • 在做故障诊断时,我们会把当前状态的样本放到已训练好的SOM模型里面去,计算出bmu以后,找到它所属的类别,认为是当前状态的故障类别。
  • 在做健康评估时,需要在故障诊断的基础上进一步计算当前状态与bmu之间的距离即MQE值,来作为健康状态的评价指标。

SOM优点:

  • SOM的主要优点是能够进行无监督学习
  • 可以将数据分类到不同的集群中,不需要数据的先验知识
  • SOM在许多不同的场景中得到了广泛的应用,并具有广泛的用途

SOM的缺点:

  • 为了生成一个没有缺失值的映射图,需要为每个样本的每一维度设置一个值
  • 每个SOM模型都是不同的,从同样的样本向量中可能会出现不同的相似性
  • 为了得到一个好的映射图,需要构建许多映射图
  • 需要非常多的计算量

2.3 贝叶斯网络

​ 前面两种方法都是从数据本身出发,不要数据本身的先验知识;而在工业大数据场景下,有一些非常重要的机理,贝叶斯网络可以将这些机理统计起来形成条件概率。

P

(

A

B

)

=

P

(

A

,

B

)

P

(

B

)

P(A|B)=/frac{P(A,B)}{P(B)}

P(AB)=P(B)P(A,B)

​ 贝叶斯网络是一种图模型结构将复杂系统内所有可能发生的情况结构化的表达出来。有向无环图如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LdneWwWR-1638515313979)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638448148980.png)]

  • 节点表示随机变量
  • 箭头表示条件依赖,指向节点

这样就会得出统计所有的图上的依赖关系,去得到一个条件概率分布图(表)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gYHqEz9i-1638515313980)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638448346165.png)]

​ 构建贝叶斯网络的流程如下:

  • 定义图模型的结构、节点数、形式和状态
  • 定义每个节点的条件概率分布
  • 利用测试数据,使用多种算法训练BBN网络
  • 分析输出并确定网络中最敏感的因素
  • 使用不同的算法进行对比

3.案例分析:轴承故障诊断

​ 轴承是一种典型的旋转机械,它具有多种模式的振动信号,有可能是多种故障耦合在一起,所以无法直接从数据中得到。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mu2aOT6b-1638515313980)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638448713345.png)]

对于振动信号,我们一般采用频域分析与时频域分析,提取频域上与时频域上的特征来进行故障诊断。

​ 常见的故障类型有:

  • Inner + roller fault
  • Inner race fault
  • Normal
  • Outer race fault
  • Outer + Inner Fault
  • Outer+Inner+Roller
  • Outer+Roller Fault
  • Roller Fault

轴承故障诊断步骤(自组织映射神经网络故障诊断步骤):

  1. 准备数据集,确定类标签

  2. 根据需要的详细程度确定显示大小

  3. 选择SOM模型的网格样式

  4. 设置超参数

    • 初始权重向量,默认0.5
    • 初始学习率,默认0.6
    • 学习率衰减速率
    • Neighborhood type
    • Training delay,默认0.05
  5. 训练数据生成SOM模型

  6. 用Hit-point来测试SOM模型

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NH7ckdVF-1638515313980)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638450733283.png)]

五、剩余寿命预测建模方法

1.剩余使用寿命预测概念

​ 剩余使用寿命预测就是估计监测对象从当前到失效的时间。每一个设备或部件都有一个额定的运行时长,当使用到一定程度时,部件就会失效。所以,剩余使用寿命预测的目标就是根据当前已经积累的运行数据来预测部件接下来的衰退模式即该部件距离某一种故障模式还有多长时间,来指导部件的预测性维护,实现更精准的部件备件的管理。

​ 与故障诊断模型不一样的是,在做剩余使用寿命预测时,故障还没有完全发生,还在演进期的过程中,所以,我们在做剩余使用寿命预测时,往往采用回归的建模方法。

​ 从机理上讲,大部分机械设备的衰退都是符合“浴缸”曲线的。大约90%都是处于性能平稳期,在寿命剩余10%时,寿命会快速衰退直到最后的失效。所以,剩余使用寿命预测通常在快速演进期内做预测。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AyhKWu3R-1638515313980)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638452231585.png)]

在建立剩余使用寿命预测模型有三种技术路径:

  1. 第一种技术路径是将特征数据融合成健康指标(适用于复杂的系统,比如CNC机床),单一的测量量不能表现设备的性能,需要将特征数据融合成健康值,用健康值代表设备的运行风险;接下来,再用曲线拟合的方法预测健康值的走势,再将健康值的情况对应到剩余寿命预测中。一旦,健康值超越了某一个阈值,我们就认为其进入了一个快速衰退期。
  2. 第二种技术路径是用特征本身的趋势性特性来反映设备的性能衰退的情况。比如:可靠性试验中的电子元器件,其本身功率信号的RMS值就能够反映元器件衰退的情况,所以,我们就可以通过预测RMS值的未来变化情况来直接映射到剩余使用寿命预测的指标上面。
  3. 第三种技术路径是直接建立(剩余寿命)RUL的连续标签,然后用监督性学习的方法直接建立特征值与剩余使用寿命标签之间的关系映射。这个方法要求特征与剩余寿命之间有非常强的相关性,并且不易受到外界其他因素的影响,否则,会影响模型的准确性。

2.剩余使用寿命预测常用算法

  1. 线性回归与非线性回归

    在使用回归算法时,会使用健康值或者特征值作为自变量来预测未来的健康值。即使用过去的数据来预测未来的数据

  2. 自回归积分滑动平均(ARIMA),ARIMA的本质也是线性的多项式

    X

    t

    =

    j

    =

    1

    p

    a

    j

    X

    t

    j

    +

    j

    =

    0

    q

    b

    j

    ϵ

    t

    j

    X_t=/sum_{j=1}^pa_jX_{t-j}+/sum_{j=0}^qb_j/epsilon_{t-j}

    Xt=j=1pajXtj+j=0qbjϵtj

    这个模型常用于短时预测,好处是针对带有随机波动的时间序列会有好的预测效果,预测使用的数据较少。

  3. 基于轨迹相似度的剩余寿命预测方法(TSBP)

    ​ 该方法通过多组全生命周期的数据来构建性能衰退曲线。测试时,滑动的寻找测试数据在曲线上的最相似的区间,以此作为测试数据当前的运行状态,并通过测试曲线剩余的时间作为设备的剩余使用寿命。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-clVrirMJ-1638515313981)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638509010610.png)]

    TSBP算法流程:

    • 依据全生命周期的数据来建立衰退模式库
    • 当新的测试数据进来后,会与库中的每一条衰退曲线做对比,找到最匹配的分段,计算出剩余寿命值
    • 采用信息融合的方式,将库中得出的剩余寿命值做加权平均,得到设备的剩余使用寿命

    TSBP算法的优点:

    • 非参数模型,不依赖于对参数模式的假设,不需要衰退机理的先验知识
    • 预测时,将不同的模型进行信息融合

2.1 剩余寿命评估指标

​ 剩余寿命评估指标用于衡量算法预测结果与真实值之间的偏差

  • MSE:MSE越小,越精准
  • R2:R2越接近于1,算法得到的越精准
  • Adjusted R2

3.案例分析(2010年PHM数据竞赛)

​ 航空发动机寿命预测,训练数据是多条发动机全生命周期的数据,测试数据是发动机一部分时间的衰退数据,而且在测试数据中缺少工作条件信息,在这种情况下,我们无法建立全局通用的模型来解释数据中存在不同的衰退模式,而且很难找到一个标准的失效阈值来设定发动机是否失效。所以,我们采用了基于轨迹相似度建模的TSBP算法来建立剩余使用寿命模型。

案例流程:

  1. 数据准备,对数据做一些预处理

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NCJf0elH-1638515313981)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638509624266.png)]

  2. 得到不同的轨迹衰退趋势,放到衰退模型库中

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ulcIbyzA-1638515313981)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638509669959.png)]

  3. 对于新的测试数据,在不同的衰退轨迹上寻找最匹配的部分,得到剩余使用寿命的值

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sXfO3Oon-1638515313982)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638509703950.png)]

  4. 将得到的剩余使用寿命的结果做一个加权平均

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2zZwrCED-1638515313982)(C:/Users/admin/AppData/Roaming/Typora/typora-user-images/1638509809261.png)]

​ 剩余寿命评估指标用于衡量算法预测结果与真实值之间的偏差

  • MSE:MSE越小,越精准
  • R2:R2越接近于1,算法得到的越精准
  • Adjusted R2

3.案例分析(2010年PHM数据竞赛)

​ 航空发动机寿命预测,训练数据是多条发动机全生命周期的数据,测试数据是发动机一部分时间的衰退数据,而且在测试数据中缺少工作条件信息,在这种情况下,我们无法建立全局通用的模型来解释数据中存在不同的衰退模式,而且很难找到一个标准的失效阈值来设定发动机是否失效。所以,我们采用了基于轨迹相似度建模的TSBP算法来建立剩余使用寿命模型。

案例流程:

  1. 数据准备,对数据做一些预处理

    [外链图片转存中…(img-NCJf0elH-1638515313981)]

  2. 得到不同的轨迹衰退趋势,放到衰退模型库中

    [外链图片转存中…(img-ulcIbyzA-1638515313981)]

  3. 对于新的测试数据,在不同的衰退轨迹上寻找最匹配的部分,得到剩余使用寿命的值

    [外链图片转存中…(img-sXfO3Oon-1638515313982)]

  4. 将得到的剩余使用寿命的结果做一个加权平均

    [外链图片转存中…(img-2zZwrCED-1638515313982)]

标签:

未经允许不得转载:作者:1147-柳同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《PHM算法与智能分析技术》 发布于2021-12-03

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录