基于空间聚类算法的中国温度区划分文献综述
2020-04-15 15:48:03
中国幅员辽阔,地形复杂多样,气候类型极为丰富。同时,我国位于东亚季风区,降水量有区域性分布特点,降水时空分布特征的研究有助于对大气运动规律的深入理解。由此,根据降水量分型是划分我国气候特征区域的有效方法。气候分区结果不仅可用于资源与环境的评价、生态系统的变化和管理、生态系统模型建立、植被生产力计算和生态区划等方面的研究,还可以为生态学、地学等学科的发展提供重要的基础数据。
国内外对地区气候分区评价已有很多研究。地区气候分区评价一般是结合自然资源环境(如气候、土壤、植被、水文等)、经济环境(如经济水平、产业结构等)和社会环境(如人口状况、基础设施、生活质量等)等来评价的,根据单一因素的气候评价很少。为了详细研究中国不同地区的降水量变化特征,国内很多学者已做了许多关于气候分区的工作,尤其是针对某个地理区进行更加详细的气候分析。李栋梁等[1]根据西北地区夏季降水的异常特征将其划分为6个敏感区。就全国的气候分区来说,有大致按气候区将全国分为8个区[2,3],陈兴芳等[4]采用降水指数根据地理位置和气候特征将全国分为15 个区,江志红等[5]指出,全国降水量场可明显划分成10区域。
定义气候带最常用的方法包括Koeppen气候分类,聚类分析等。Koeppen气候分类及其修改版本已被广泛用于定义全球不同的气候类型。在中国,只有少数方案被定义为使用Koeppen气候分类。一般来说,中国的气候区根据气候区划划分。通过诸多区域化工作,形成了一定的区域化方法,并说明了中国的区域气候多样性。聚类分析是研究样品和变量进行分类的一种方法,通过建立一些统计法则算法来进行比较客观的分类。作为用于定义气候带的标准方法,聚类分析已在若干国家使用。 许多气候相关的研究问题,如气候区的确定和天气气候类型的分类已经通过聚类分析得到解决。然而,这种方法在定义中国的气候带方面使用尚不广泛。因此,作为一种替代方法,聚类分析在各类资源环境评价及分类区划等领域将更广泛的应用。本课题在此背景下,拟收集近年来全国各气象站年降水量数据,采用空间聚类分析方法,对近年来全国各气象站年降水量数据进行聚类分析,找出各地区降水的空间聚集模式,总结我国气候区域特点,从而对我国气候进行分区。{title}2. 研究的基本内容与方案
{title}2.1基本内容:
在以上的研究环境和背景下,本课题的主要内容是基于采集的近年来全国各气象站年降水量数据,采用多种聚类方法分析(如K-means法、分层聚类法等),并通过R语言进行实现,对我国气候进行分区,并将结果与最新中国气候区划对比,以对比多种聚类方法的优劣并评价聚类分析结果,为人们根据自己的需求选择适合的聚类分析方法提供依据,同时验证基于空间聚类分析的气候分区的可行性。在本课题中,拟使用的聚类方法为快速聚类法(K-means法)及分层聚类法。
其中快速聚类法(K-means法)步骤为:
(1)选取K个样本为初始的类中心;
(2)计算每个样本与各中心的欧几里得距离,将每个样本赋给最近的类;
(3)计算每一类的平均值,以其为中心,计算每个样本与中心的距离,将每个样本重新赋给距离最小的类;
(4)重复步骤(3) ,直到方差不再发生变化。
分层聚类法步骤为: