空间数据挖掘算法集成系统的设计与实现开题报告
2022-01-05 21:48:48
全文总字数:4550字
1. 研究目的与意义及国内外研究现状
数据挖掘(data mining即dm)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、事先不知道的但又是潜在有用的信息和知识的过程【2】,它是一个多学科交叉研究领域,囊括了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果。随着人类活动的不断发展,各行各业均增加了大量的信息数据,由于数据量巨大,数据结构复杂,传统的统计方法无法满足日益增长的数据分析需求【3】,联机分析处理(on-line analytic processing,olap) 、决策支持(decision support)以及分类(classification)、聚类(clustering)等复杂算法应用成为必然,具有能对过去的数据进行查询,找出过去数据之间的潜在关系并进行更高层次分析来做出理想的决策和预计未来发展趋势等功能的挖掘新型算法的实践成为了解决问题的有效途径【4】。空间数据挖掘技术是数据挖掘技术的分支,是数据挖掘的主要研究内容之一。空间数据挖掘,或称”从空间数据库中发现知识”,是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征, 它是kdd 技术在空间上的应用。
本课题对预处理之后的数据进行空间数据挖掘,实现空间数据分类与聚类算法的实现,可以在很领域中得到应用与发展,如地理信息系统、图像数据库、信息融合、遥感、医疗图像处理、导航等。由于其正值新兴发展阶段, 目前只是取得了一定的初步成果,大量的理论与方法需要后续的深入研究,希望通过本次课题对空间数据挖掘进行研究和开发,以便后续实现更多的算法与功能。
2. 研究的基本内容
本课题依据空间数据挖掘算法的相关理论以及对所获得的的空间数据进行预处理之后的结果,结合空间分类、聚类方法理论和c#计算机编程语言,对所需要处理的空间数据进行基于三类算法的挖掘,并构建出可进行两类分析的集成系统软件。在此系统中实现空间分类、聚类中三个算法的实现:朴素贝叶斯、决策树算法以及k-means算法,来对给定的空间数据进行数据间关系的分析。论文中涉及内容概括为:
◆ 空间数据挖掘的研究背景、研究现状、应用与挑战
◆ 数据挖掘的相关技术、一般步骤
3. 实施方案、进度安排及预期效果
1.实行方案:
本研究在visual studio 2010 c#的支持下,通过空间数据分类算法、空间数据聚类算法挖掘分析房屋基本信息中数据间的关系。
数据来源:美国king country的房屋销售价格以及房屋的基本信息
4. 参考文献
[1]《数据挖掘原理与spss clementine应用宝典》元昌安 主编,邓松、李文敬、刘海涛等 编著 电子工业出版社 2009
[2] 《数据挖掘导论》 朱 明 编著 中国科学技术大学出版社 2011
[3] 《数据挖掘前沿问题》 吴喜之、马景义、吕晓玲、闫洁 著中国统计出版社 2009