基于支持向量数据的故障诊断方法研究文献综述
2020-04-24 09:57:44
1.1目的及意义
支持向量数据描述(SVDD)是一种重要的数据描述方法,它能够对目标数据集进行超球形描述,可以被用于数据的分类以及异类点的检测。SVDD的主要思想是,将原始的训练样本通过非线性映射,映射到高维的特征空间,并在其中寻找一个包含全部映射至空间的训练样本的最优超球体,之后将超球体投射回原本的空间中,就能得到一个浪费空间最小,且尽可能多包含训练样本的“球体”;若通过非线性映射的新的样本点落在超球体外,则新样本点被视为异类点。基于这一思想,SVDD能够被用于故障检测,当机器运行出现异常时,新检测到的样本点落在超球之外,便能狗判断机器运行出现了异常。
本文旨在通过对现有的基于SVDD的故障诊断方法的研究,来进一步了解SVDD在故障诊断中的具体算法以及其语言代码的实现。同时了解针对传统SVDD方法的缺点,现在的SVDD相关方法有何改进。
1.2基于SVDD的故障诊断方法在国内外的研究现状:
近年来,作为一种数据描述方法,SVDD得到了极大的关注,关于SVDD的研究取得了大量的研究成果。1999年,Tax和Duin首次提出了SVDD。2004年,Tax和Duin又对SVDD进行了拓展和更完整的研究,分别得到了不带负样本和带负样本的SVDD。SVDD是一种基于边界数据(支持向量)的描述方法,其目标是寻求一个包含所有或几乎所有的目标样本且体积最小的超球体或域。SVDD的边界函数可通过一个超球面(Hypersphere)进行刻画,通过将目标样本点映射到能够更容易进行球形描述的高维空间(或特征空间),可能会减弱超球面所受到的限制。这就是统计学和机器学习领域著名的核技巧(Kernel Trick)和方法。Scholkopf等人提出一种与单类分类有着概念性差异的方法,该方法的超平面被用于将目标样本与原点分离开来。当使用径向基扩展(Radial Basis Expansions)时,该方法的解等价于具有径向基扩展的SVDD的解。Lee等人提出了一种改进的支持向量数据描述方法,即密度诱导的支持向量数据描述。D-SVDD首先对每一个目标数据点的密度进行估计,并对所估计的密度进行加权,再将加权的密度引入到SVDD,从而改进了SVDD,每个目标数据点的密度通过K-最邻近或者Parzen窗方法得到。实验结果表明,D-SVDD优于SVDD和K-最邻近或者Parzen窗口得到。实验结果表明,D-SVDD优于SVDD和K-最近邻数据描述。基于SVDD,Guo等人提出一个异常检测的边界方法,这种边界方法试图通过对SVDD边界的调整,以获得一个紧的数据描述而不需通过核白化(Kernel Whitening),即通过在样本空间中引入一个样本与其最近邻边界点之间的距离,在SVDD边界的基础上,该方法能够有效地构造一个新的决策边界。Zhang等人得到了一种基于SVDD方法的模糊多类分类器,这种分类器改进了可能性C一均值聚类。
{title}2. 研究的基本内容与方案
{title}2.1设计的基本内容:
故障诊断的主要任务有故障检测、故障类型判断、故障定位及故障恢复等。故障检测是利用各种检查和测试方法,发现系统和设备是否存在故障的过程;而进一步确定故障所在大致部位的过程是故障定位。要求把故障定位到实施修理时可更换的产品层次(可更换单位)的过程称为故障隔离。故障诊断就是指故障检测和故障隔离的过程。
基于SVDD的故障诊断就是利用SVDD的思想,对机器运行的实时数据进行处理,利用SVDD进行异类点检测,判断出采集样本点是否属于机器正常运行时的数据类,从而判断机器运行是否发生故障。
2.2设计的目标:
所需设计课题要求通过MATLAB或python来实现基于SVDD或其衍生方法的故障诊断方法,能够根据测量的机器运行时的各个数据得到样本点,并通过算法实现,判断样本点是否位于包围已经采集到的正常样本的超球面内,从而判断机器是否出现故障。