IEEE 2012 PHM数据挑战赛
Sutrisno E, Oh H, Vasan A S S, et al. Estimation of remaining useful life of ball bearings using data driven methodologies[C]// Prognostics and Health Management. IEEE, 2012:1-7.
IEEE 2012 PHM数据挑战赛比赛的目标是在实验负荷条件下提供滚珠轴承剩余使用寿命的最佳估计。实验数据集由FEMTO-ST研究所提供。数据集涉及三种不同的负载条件。 条件1有七个滚珠轴承转速为1800转/分钟,径向负荷为4000N。 七个轴承中有两个轴承提供了用于算法训练的从开始运行至故障的完整数据,并为其他五个轴承提供了用于算法测试的截断数据。 条件2的特点是七个滚珠轴承以1650转/分钟的转速运行,径向载荷为4200N。 在7个轴承中,提供了两个用于训练的从开始运行至故障的完整数据,并为五个轴承提供了测试数据。 条件3的特点是三个轴承以1500转/分钟,径向载荷5000N运行。提供了两个轴承的数据用于训练,另有一个轴承的数据用于测试。
在轴承箱上安装两个加速度计,用于测量垂直和水平方向的振动。数据采样间隔为10秒,采样率为25.6 kHz,持续时间为0.1 s; 因此,每个观察值包含2560点。
1.1 轴承的剩余使用寿命估计方法
1.1.1 方法1:谱峰度和马尔可夫蒙特卡罗法
图1:六个轴承训练数据的平均移动峰度谱:通过频率范围为5.5至6.0 kHz的带通滤波
利用spearman相关系数评估峰度和实验持续时间之间的相关性,当两个变量完全单调递增时,斯皮尔曼相关系数为+1;两个变量完全单调递减时,斯皮尔曼相关系数则为−1。
通过spearman相关系数评估认为振动信号的谱峰度被认为是最具有随时间增加而单调递增特性的特征,在比较了三种类型的退化信号模型与轴承的MAS峰度的拟合结果后,选择指数模型
对轴承谱峰度的退化数据进行拟合,其中a和b是模型常数,y是退化信号的大小,t是时间。表I显示了指数模型的拟合程度
指数模型a和b的常数使用马尔可夫蒙特卡罗方法(MCMC)进行更新,马尔可夫蒙特卡罗是一种通过在概率空间中随机采样来接近感兴趣参数的后验分布的方法。每个测试轴承的剩余使用寿命通过指数模型预测MAS峰度的幅度超过预定义阈值的时刻来估计。 在实验中,基于对图1所示的六个训练轴承的峰度的观察,将故障阈值设定为4。
图2:利用MAS峰度和贝叶斯蒙特卡罗方法估计剩余使用寿命:轴承2_5
图2显示了测试轴承2_5的故障时间预测直方图。 估计在20,000秒的方位2_5的剩余使用寿命(RUL)为3,580秒。 轴承2_5的实际剩余寿命为3090秒。 测试轴承2_5的估算剩余寿命和真正剩余寿命之间的误差为-15.9%。 错误中的负值意味着轴承的剩余使用寿命被高估了。误差计算公式:
1.1.2 方法2:支持向量回归机模型
本方法使用最小二乘支持向量回归机的方法估计轴承的剩余使用寿命(RUL)。其具体步骤如下图所示
图3:支持向量回归机模型预测过程
从轴承中测量得到的垂直和水平方向的振动数据中提取特征,每个垂直或水平信号提取十七个特征,共三十四个特征,使用移动平均滤波器对其进行平滑以抑制测量中的噪声。 在平滑之后对数据进行规范化处理,由此减小大动态范围的特征而导致的偏差。利用主成分分析法对数据进行降维处理,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,将PCA应用于从训练轴承提取的特征集,前三个主成分占数据可变性的99.5%以上。 因此,我们将特征集从34个特征减少到3个主要分量。 图4示出了轴承2_2的前三个主要分量的时间序列图。
图4:平滑和归一化后轴承2_2的前3个主要成分时间序列图
将训练集的三个主要成分作为最小二乘支持向量机的输入,轴承的剩余使用寿命作为目标
图5:LS-SVR进行剩余使用寿命估计说明
在预测模式下,从振动信号中提取测试轴承特征,并且利用在训练模式期间获得的变换矩阵计算相应的三个主要分量。将得到的三个主要成分作为输入给训练的LS-SVR,以产生剩余使用寿命的估计值。
1.1.3 方法3:振动频率特征异常检测和存活时间比
本方法利用异常检测,退化特征推断和生存时间比估计测试轴承剩余使用寿命(RUL)。
利用快速傅里叶变换生成对应频谱,当频谱中的峰值振动的频率发生变化时,认为检测到异常,轴承频率特征变化的物理解释是轴承内裂纹,剥落或其他表面缺陷的发生,导致轴承结构以新的频率和模式进行振动。
左上方图为轴承1_1的水平特征图。在#1218处观察到水平特征逐渐增加,检测为异常,此时轴承进入第一个异常区域。在#2747处轴承进入第二个异常区域。测试轴承1_3与轴承1_1的退化趋势相似,利用指数曲线对轴承1_1的第一次异常数据进行拟合,第一次异常结束时的拟合值除以异常开始检测值得到5.47。通过轴承1_3的频谱数据可知(左下角图),在#822处水平方向最初存在于2500Hz附近的频率消失,#822处的异常检测被认为是第一个异常区域的开始,通过#822处的水平特征值乘以先前获得的5.47因子得到阈值5.99,通过曲线拟合预测水平特征在#2115处达到此阈值。
对轴承1_1来说,第一次异常区域是从#1218到#2747。通过2747减去1218,我们获得了异常1的持续时间为1529个观测值,图上的每个观察值之间的间隔为10秒,即15,290秒。轴承1_1进入第二个异常区域560秒后失效。 第二次异常持续时间除以第一次异常持续时间比率:
对于轴承1_3来说,#822处被认为是第一次异常区域的开始。 通过曲线拟合预测在#2115处为第一次异常区域的结束,则第一次异常的持续时间为1293个观测值,即12,930秒。通过将异常1的持续时间乘以从方位1_1获得的异常比来估计异常2的持续时间
通过将两个异常持续时间加在一起来计算从第一次异常检测开始到失效的时间:
由于轴承1_3在实验中存活了9800秒,因此轴承1_3的RUL估计为:
根据比赛组织者提供的实际RUL数据,方法3估计轴承的剩余使用寿命实际误差如下图所示
1.2 RUL估计方法的比较
上述三种方法使用了轴承退化的不同特征来估计其剩余使用寿命。
在方法1中,振动信号的谱峰度被认为是具有随时间增加而单调递增的特征。利用贝叶斯蒙特卡洛方法对指数模型的系数进行更新,但在轴承临近失效时间点,其特征会发生剧烈的改变。利用贝叶斯蒙特卡洛方法进行模型系数的更新未考虑这种情况,有高估RUL的趋势。
方法2,引入了支持向量回归机模型,对输入特征没有单调趋势的要求。 但由于六个训练轴承在失效时间前特征变化剧烈,且训练样本有限,LSSVR高估了部分测试轴承的RUL。如果在每种条件下提供更多的训练轴承,则算法精度能以更高的精度执行。
方法3,将轴承的退化分为了多个阶段,RUL的估算是基于对轴承退化阶段之间的持续时间比值而进行预测,本方法其优点在于RUL估计过程简单,计算复杂度小。但其缺点是通过分析频率特征的变化来检测异常,但在某些轴承中,频率可能不发生变化或频率中有噪声,异常不能清楚地被识别。
以上提出了三种估算轴承剩余使用寿命的方法。有限的训练数据使得三种方法都具有高度的不确定性,比赛根据评分函数计算每个轴承的剩余寿命估计得分,取所有轴承得分的平均值为最终结果,最终第三种方法获得了2012年PHM数据挑战赛优胜。
图7:根据预测值与实际值的百分比误差估算RUL的评分函数
IEEE 2012 PHM数据挑战赛的更多相关文章
- SQL Server 2012 数据库数据导出为脚本
转自:http://blog.csdn.net/ituff/article/details/8265822 将高版本的的SQL Server数据库移到低版本的SQL Server是一件十分蛋疼的事,最 ...
- Windows Server 2012重复数据删除技术体验
在企业环境中,对磁盘空间的需求是惊人的.数据备份.文件服务器.软件镜像.虚拟磁盘等都需要占据大量的空间.对此,微软在Windows Server 2012中引入了重复数据删除技术.重复数据删除技术通过 ...
- 【转载】SQL Server 2012将数据导出为脚本详细图解
前记: 从SQL SERVER 2008开始,我们就可以很方便的导出数据脚本,而无需再借助存储过程,但是SQL Server 2012和SQL Server 2008的导出脚本的过程还有一点细微的差别 ...
- 使用Sqlserver 2012 导出表数据为SQL脚本
目录 前言 具体步骤 前言 很多时候,我们需要把数控库中的表的数据导出成SQL脚本的情形.然后,在别的库执行的情况. 以下,总结使用Sqlserver 2012数据库中表数据导出成SQL脚本的步骤. ...
- SQL Server 2012大数据导入Oracle的解决方案
在实际工作中需要把SQL Server中的表导入Oracle.之前尝试过直接用SQL Server的DTS进行都没问题.但这次因为数据量在千万级所以报虚拟内存不足.最后通过SQL Server导出tx ...
- kesci---2019大数据挑战赛预选赛---情感分析
一.预选赛题------文本情感分类模型 本预选赛要求选手建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」.所提交的结果按 ...
- [paper]MaskFusion: Real-Time Recognition, Tracking and Reconstruction of Multiple Moving Objects
Before 近期在调研关于RGBD在室内移动机器人下的语义导航的研究.目前帝国理工的Andrew Davison在这边有两个团队在研究,分别是Fusion++ 和 这篇 MaskFusion.这篇是 ...
- Visual Basic 2012 借助DataGridView控件将SQL server2012 数据导入到Excel 2010
摘 要: SQL Server 2012 数据和Excel 2010之间的连接和数据的传输,本篇文章主要针对的是SQL Server 2012 数据导入到Excel 2010文件中.Excel软件对 ...
- SQL Server 2012数据导入SQL Server 2008
SQL Server 2012可以降级到2008吗?没有找到方法,似乎也不支持.整理了一个变通的方法,把2012的数据和结构导出,然后再导入2008. 在 SQL Server 2012 使用 Sql ...
随机推荐
- EF Code-First 学习之旅 继承策略
Code First中有三种不同的方法表示继承层次关系 1.Table per Hierarchy (TPH): 这种方法建议用一个表来表示整个类的继承层次关系,表中包含一个识别列来区分继承类,在En ...
- HBase协处理器的使用(添加Solr二级索引)
给HBase添加一二级索引,HBase协处理器结合solr 代码如下 package com.hbase.coprocessor; import java.io.IOException; import ...
- ural 2016 Magic and Science
2016. Magic and Science Time limit: 1.0 secondMemory limit: 64 MB Scientists who specialize in witch ...
- android自定义日期组件之双DatePicker
1.效果图(两个DatePicker放在一起,同时选择起始与结束时间): 2.实现 2.1布局文件: <?xml version="1.0" encoding="u ...
- tlflearn 编码解码器 ——数据降维用
# -*- coding: utf-8 -*- """ Auto Encoder Example. Using an auto encoder on MNIST hand ...
- JProfiler连接weblogic
转 http://blog.csdn.net/xu1314/article/details/7737236
- Python压缩脚本编辑
这真是一点小问题,搞死人了.主要还是两个问题, 1WinRAR,这要配置到环境变量里去.不然无法实现功能. 2 其次就是转义 r'D:\FISRT' 3 source = [r'D:\ONE'] ...
- 27 python 网络基础之网络协议
一.操作系统基础 操作系统:(Operating System,简称OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才 ...
- LeetCode OJ:Unique Binary Search Trees(唯一二叉搜索树)
Given n, how many structurally unique BST's (binary search trees) that store values 1...n? For examp ...
- XMLSchema验证
一.什么是Schema(XSD) XML Schema是微软定义的一套用来验证XML技术.是一套预先规定的XML元素和属性创建的,这些元素和属性定义了XML文档的结构和内容模式. DTD的局限性: 1 ...