质谱数据寻峰算法设计与实现毕业论文
2021-11-06 23:01:35
摘 要
日常生活中,农药残留、非法添加剂、毒品对我们具有很大的影响,所以需要利用质谱来检测。由于质谱检测的分析速度主要取决于分析时区别出十强峰和计算出棒状图能量值的速度,所以本设计就是研究如何快速寻找出十强峰和计算出棒状图能量值。本设计主要由质谱数据模拟器、数据前处理、数据分析三部分组成,主要用到的有移动均值滤波、中值滤波、SG滤波和二阶求导法寻峰以及梯形法求面积,对于快速进行质谱检测具有重要意义。
论文主要研究了SG滤波和二阶求导寻峰算法,计算了峰值位置以及棒状图能量值。
结果表明:本设计SG滤波对于有凸刺的波的滤波效果较好,二阶求导法寻峰稳定性较高,梯形法能够比较快速的求得棒状图能量值并且对于比较他们的大小没有影响。
本设计的特色:将SG滤波加入到质谱数据前处理中,以及比较十强峰和棒状图能量值来达到检测的分析。同时对于那些噪声干扰产生的波,由于普通的二阶倒数法对于干扰波没有辨别作用,加入了峰值判断。
关键词:SG滤波;质谱数据模拟器;二阶求导法寻峰;棒状图能量值
Abstract
In our daily life, pesticide residues, illegal additives and drug detection have a great impact , so the mass spectrometry is need to use to detection. Since the analysis speed of mass spectrometry mainly depends on the speed of distinguishing the top ten peaks and calculating the energy value of the bar graph during the analysis, this design is to study how to quickly find out the top ten peaks and calculate the energy value of the centroid. This design is mainly composed of mass spectrometry data simulator, data pre-processing and data analysis. The main used are moving mean filtering, median filtering, SG filtering, second order derivative peak-finding and trapezoidal area finding. It has important guiding significance for mass spectrometry detection.
This thesis mainly studies SG filter and second order derivative peak searching algorithm, and calculates the peak position and the energy value of the bar graph.
The results show that the SG filter has a good filtering effect on the wave with protruding spines, and the second order derivative method has high peak searching stability. The trapezoid method can obtain the energy value of the bar graph quickly and has no influence on the comparison of their size.
The feature of this design is to add SG filter to the pre-processing of mass spectrometry data, and the energy values of the ten peaks and bar graphs are compared to achieve the detection analysis. At the same time, for those waves generated by noise interference, since the ordinary second-order reciprocal method has no discrimination effect on interference waves, the judgment that the peak value is bigger than 1 is added.
Key Words:SG filtering;Mass spectrometry data simulator; Second order derivative method to find the peak; Bar chart energy value
目录
第1章 绪论 1
1.1 研究的背景、目的和意义 1
1.2 国内外研究现状 1
1.3 研究内容以及预期目标 2
第2章 方案选择 4
2.1 模拟器方案的选择 4
2.2 滤波方案选择 4
2.3 波峰定位方案选择 5
第3章 质谱数据模拟器 6
3.1 模拟器生成函数 6
3.1.1 间隔部分 6
3.1.2 峰值部分 7
3.1.3 生成文本文件部分 8
3.2 MFC窗口设计 9
3.2.1 窗口界面设计 9
3.2.2 生成XML文件部分 10
第4章 数据前处理 12
4.1 读取数据 12
4.2 中值滤波 13
4.2.1 中值滤波算法设计 13
4.2.2 滤波后效果 14
4.3 移动平均滤波 14
4.3.1 移动平均滤波算法设计 14
4.3.2滤波后效果 16
4.4 SG滤波 16
4.4.1 SG滤波算法设计 17
4.4.2 滤波后效果 20
第5章 寻峰及计算棒状图能量值 21
5.1 寻峰算法 21
5.2 棒状图能量值的计算 23
5.2.1 棒状图能量值计算原理 23
5.2.2 验证梯形法的可行性 25
第6章 实现算法库DLL及封装 26
第7章 结论 27
参考文献 28
致 谢 29
第1章 绪论
质谱虽然与我们的现实生活接触较少,但是其在我们生活中应用确实十分广泛。比如毒品检测、农药残留检测、非法添加剂检测等都需要用到质谱,所以本设计就是给这些质谱检测提供依据,研究质谱数据的峰值寻找算法,用于快速确定质谱十强峰,并计算棒状图能量值,达到对质谱的数据的十强峰筛选与棒状图能量计算来达到质谱分析的目的。
1.1 研究的背景、目的和意义
在我们日常的生活中,农药残留和非法添加剂以及毒品对我们的身体健康有很大的危害。如果长时间接触或食用的食物含有农药残留,农药或添加剂会在体内长期蓄积滞留,造成慢性中毒。大棚内的农药消解速度比露地慢,这样就直接导致大棚内蔬菜农药的残留量高,人们发生食物中毒的情况比露地蔬菜严重[1]。长期食用带有农药的食品,会破坏肾脏和肝脏的功能,造成肝硬化、肝积水等,严重的还会造成生理障碍。滥用非法添加剂也会对我们的健康造成很大危害,比如说三聚氰胺、“瘦肉精”、苏丹红等,在社会上也会引起不良影响。而毒品进入体内,会对健康造成严重的损害,甚至吸毒过量会导致死亡。此外,由于毒品对消化系统、呼吸系统、心血管系统、免疫系统的影响,滥用毒品可导致多种并发症的发生。毒品不仅会对躯体造成伤害,对心理也会造成很大危害,使吸毒者产生依赖性,对吸毒者家庭也会造成很大危害。
质谱能够快速准确的检测食品中的农药残留、非法添加剂,鉴别农药真假以及农药检测,测量下限可达ppb量级,因此广泛适用于食品安全现场分析、农资打假,和毒品快速筛查等领域。质谱技术主要是使用带电粒子质荷比的不同排列所形成的图谱进行定性定量分析。利用这一技术进行质谱寻峰,有助于我们的检测,使检测更加的方便快捷。本设计可以更有效的帮助我们分析质谱数据,帮助我们快速寻找出十强峰来,对于元素分析、图谱定性分析都有积极作用,而棒状图能量值的计算对于图谱的定量分析也有积极作用。所设计的软件能够快速求得峰值所在位置和棒状图能量值,能够方便客户使用,节约人力分析成本,对于质谱分析具有重要意义。
1.2 国内外研究现状
此次的设计就是设计一个质谱数据寻峰算法,来帮助质谱分析。尤其是数据的前处理特别重要,如果处理不好,就会出现峰识别位置出现错误或者识别到干扰峰等。在滤波方面,国外的研究都是采用SG滤波,如参考文献[2]中所提到的利用SG进行分析前的前处理,其基本思想是围绕每个数据点创建一个数据平滑窗口,利用平滑窗口中的数据确定一个贯穿中心数据点的拟合多项式,然后计算拟合多项式的二阶微分值[2]。在寻峰上,国外最新的如参考文献[3]中提到的设计了一种基于自适应阈值的峰值检测算法,峰值识别率达到100%[3]。