基于数据挖掘中决策树算法对降雨的预测开题报告
2022-01-09 22:43:39
全文总字数:1762字
1. 研究目的与意义及国内外研究现状
近年来,由于全球气候的不断变化,世界各地遭受各种异常天气的影响十分严重,给国家与人民造成了巨大的损失。全球领域面积广大且地形复杂,南北跨度较大,形成了气候情况不尽相同的气象系统。面对灾害时,及时的应对措施显得尤为重要,因此要求能够准确及时的对天气进行预测,并且准确度也需要进一步的提高。
随着计算机技术的不断发展,人们能够有力地利用计算机技术进行搜集和分析气象数据,大量的气象数据飞快地成堆积累。海量的气象数据中包含了很多隐藏的有用信息,借助数据挖掘技术挖掘这些气象数据背后的潜在规则,对预测天气未来发展趋势具有很大的帮助。
对于天气的预测,本文采用决策树预测算法,决策树易于理解和实现,在学习和使用的过程中不需要使用者掌握很多的专业背景知识,同时,决策树能够直接体现数据的特点,通过解释后都有能力理解决策树算法所要表达的现实意义。而且决策树能够同时处理常规型和数据型属性,在相对较短的时间内可以对数据集得出良好的结果。决策树已规则形式对数据进行自动分类,常用的算法有c4.5、cart和c5.0等。
2. 研究的基本内容
本文首先阐述了数据挖掘技术的基本概念以及一些基本的数据挖掘方法,简单介绍了数据流程、数据挖掘功能与任务和技术应用等相关知识。然后对气象资料进行预处理,使气象数据更便于挖掘。详细提出了介绍了决策树的相关理论知识,,同时利用了一种简单的决策树算法对数据集进行决策,从而得出对降雨的准确预测。本文主要做了以下三大工作:
1. 详细介绍了气象数据的基本特征、数据预处理方法以及对气象数据进行预处理的方法;
2.其次对实例气象数据实现异常天气的预测。采用cart模型对气象数据建立气象—降雨预测模型。
3.对决策树模型进行预测准确度的考察,验证模型的可靠性。
3. 实施方案、进度安排及预期效果
首先对2015.12`2018.4期间的气象数据资料进行数据预处理,使连续属性的气象数据便于数据挖掘,其次利用CART算法对数据集进行建模分析,得到一个降雨决策树模型,然后利用2000~2014年间的气象数据进行规则验证,得出此降雨模型的可靠性。
4. 参考文献
[1]左爱文,数据挖掘技术在气象数据中的应用[d].西安:西安电子科技大学,2006.
[2]王红霞.气象数据仓库的建立及其上数据挖掘[d].太原:太原理工学院,2006.
[3]戴光丰.模糊神经网络在气象短期预报中的应用研究[d].广州:中山大学,2007.