多维数据中的异常点识别方法研究开题报告
2020-05-28 23:19:47
1. 研究目的与意义(文献综述包含参考文献)
文 献 综 述
1.本课题研究背景、目的及意义
现代社会高速发展,科学技术蓬勃发展。自第三次工业革命不久之后,全球就处于信息爆炸的时代。”大数据”这个名词也应运而生。生活中大数据随处可见,然而由于收集大数据过程中的种种随机的影响因素与误差,数据中总会出现部分不合逻辑,缺乏正确性,可靠性的数据。我们为了提高数据的质量,进行异常数据剔除。由于目前大多是一维数据的异常数据处理,但由于大数据日益多元化,包含的信息很可能不止一种,且一个信息中的几个数据彼此之间都存在联系。因此我们本课题拓展为多维数据的异常数据的处理,从而为大数据处理提出高效,比较准确的多维异常数据的方法。
在数据处理的过程中偶尔会出现一些异常的,不合逻辑的统计结果,这种结果的出现很可能是由于所处理的数据中包含异常数据造成的.但目前测量学中所提供的异常数据识别方法,即只针对单一测量指标进行数据检查.然而,在统计实践中我们经常会感到仅仅使用单指标进行数据检查不能有效发现测量数据包含的全部异常.解决此类问题的方法,提高统计数据的准确性和可靠性.
2. 研究的基本内容、问题解决措施及方案
目前在测量学中所提供的异常值的方法,都是针对一维数据,即只针对单一测量指标对数据进行异常值的识别。
在统计实践中我们经常会感到仅仅使用单指标进行数据检查不能有效的发现测量数据包含的所有异常值。
为了探索解决此类问题的方法,提高统计数据的准确性和可靠性,在对常用异常数据识别方法进行分析的基础之上,尝试寻找一种可应用于多指标情形下的异常数据的识别方法,为数据分析提供便利的辅助工具。
最新文档
- 性能优化的FRP护套用于钢筋混凝土框架的抗震改造外文翻译资料
- 圆形截面的FRP约束混凝土:审查和评估应力应变模型外文翻译资料
- FRP约束混凝土的轴向压缩行为:实验测试数据库和面向设计的新模型外文翻译资料
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 利用污泥和低质粉煤灰制备高强度陶粒外文翻译资料
- 表面活性剂改性疏水性Cu2O量子点作为高效钙钛矿太阳能电池顶部空穴传输材料外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- Nb 和 Ni 共掺杂 Mg(0001)氢解离扩散的理论研究:外文翻译资料
- 基于 Jetson Nano 深度学习平台的学生课堂学习评估系统—–学生的人脸检测与识别外文翻译资料
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- 皇后大道大桥——NEXT梁外文翻译资料
- 连续梁桥支座附近的波纹钢腹板抗剪性能评估外文翻译资料
- 在200至300℃的温度下纤维素的水热降解外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 注蒸汽井中硅含量对水泥石抗压强度的影响外文翻译资料
