基于随机森林的SRTM-1高程误差修正毕业论文
2022-01-26 12:14:32
论文总字数:18457字
摘 要
中国区的SRTM-1数据已于2015年免费开放,这为中国地理科研工作提供了极大的便利,填补了中国某些地区的数据空白。然而,中国地区的SRTM-1免费开放的时间较晚,虽然有免费获取的优点,但是却缺少足够的精度分析,仍需要检验精度。本文以我国陕西省1:5万参考DEM为真值,分析陕西省SRTM-1数据的精度,并建立随机森林模型,对陕西省SRTM-1误差进行修正。通过中误差模型,计算了SRTM-1和我国1:5万参考DEM的高程最小值,最大值,平均高程和标准差,以及垂直误差的平均误差和标准差。结果显示,SRTM-1误差的中误差有十分明显的空间分布特征。进一步建立随机森林模型后,对4个研究区的7个特征因子进行重要性分析。结果显示,7个特征因子的重要性呈现4个梯度。其中坡向和坡度的影响最为明显,也是最重要的两个特征因子。除此之外,还利用随机森林模型对SRTM-1的误差进行修正。结果显示,随机森林模型出错率低,过拟合度低,结果具有可靠性。误差修正结果质量极高,MAE仅为3.5m。经随机森林模型误差修正后的SRTM-1数据质量远超原SRTM-1数据,在某些区域几乎达到了我国1:5万参考DEM的精度标准。
关键词:SRTM-1 数据质量 随机森林 误差修正
SRTM-1 elevation error correction based on random forest
Abstract
The SRTM-1 data in China has been opened free of charge in 2015, which has greatly facilitated the work of geography research in China and filled the gaps in data in some areas of China. However, the SRTM-1 in China is open for free at a later date. Although there are advantages of free access, it lacks sufficient accuracy analysis and still requires verification accuracy. The paper analyzes the accuracy of SRTM-1 data in Shaanxi Province with the 1:5 million reference DEM in Shaanxi Province of China, and establishes a random forest model to correct the SRTM-1 error in Shaanxi Province. Through the root mean square error model, the elevation minimum, maximum value, mean elevation and standard deviation of SRTM-1 and China's 1:50,000 reference DEM, and the root mean square error and standard deviation of vertical error are calculated. It turns out that the root mean square error of SRTM-1 has a very obvious spatial distribution. After establishing a random forest model, the importance of seven characteristic factors in the four study areas was analyzed. The results show that the importance of the seven feature factors presents four gradients. Among them, the influence of aspect and slope is the most obvious, and it is also the two most important characteristic factors. In addition, the paper uses random forest model to correct the error of SRTM-1 and it turns out that the random forest model has low error rate, low over-fitting and reliable results. The error correction result is extremely high, and the MAE is only 3.5m. The SRTM-1 data quality corrected by the random forest model error far exceeds the original SRTM-1 data, and almost reaches the accuracy standard of 1:5 million reference DEM in some areas of China.
Key Words:SRTM-1, Data quality, Random forest, Error correction
目 录
摘要 i
Abstract ii
第一章 绪论 1
1.1 选题的背景和目的 1
1.1.1 选题的背景 1
1.1.2 选题的目的 2
1.2 国内外研究现状 2
1.2.1 数字高程模型的建立 2
1.2.2 SRTM-1精度的研究 3
1.2.3随机森林的相关研究 3
1.3研究内容和论文结构 4
1.3.1 研究内容 4
1.3.2 论文结构 4
第二章 研究区概况和数据源 6
2.1 陕西省概况 6
2.1.1 地形地貌特征 6
2.1.2 气候与水文 6
2.2 数据源 7
2.2.1 参考DEM 7
2.2.2 SRTM数据 7
2.2.3 研究区选择 7
2.3 数据预处理 8
2.4实验方法 11
第三章 SRTM-1 高程精度分析与评价 12
3.1垂直精度评价 12
3.1.1神木研究区精度评价 12
3.1.2绥德研究区精度评价 13
3.1.3 延川研究区精度评价 15
3.1.4 宜君研究区精度评价 16
3.2 中误差空间分布规律 17
第四章 基于随机森林模型的高程精度 18
4.1 随机森林概述 18
4.2 回归模型的建立 18
4.2.1 编程环境 18
4.2.2 软件包和函数选择 18
4.2.3 几个重要变量 19
4.2.4 建模过程 19
4.3 预测结果分析 19
4.3.1 mtry和ntree的取值 19
4.3.2 SRTM-1精度的影响因子 20
4.4 误差修正的质量 22
4.4.1 神木研究区误差修正精度 22
4.4.2 绥德研究区误差修正精度 23
4.4.3 延川研究区误差修正精度 24
4.4.4 宜君研究区误差修正精度 24
第五章 结论 26
参考文献 27
致谢 28
第一章 绪论
1.1 选题的背景和目的
1.1.1 选题的背景
2000年2月11-22日 ,美国奋进号航天飞机测得地球表面 60°N 至 56°S 、覆盖陆地表面80% 以上的三维雷达数据——SRTM-1。该测量任务由美国国家宇航局(NASA)和国家影像制图局(NIMA)等机构联合开展,利用InSAR雷达测量技术,对两幅同名图像进行光的干涉处理。处理的方法包括图像配准、干涉图生成、去除平地效应、相位解缠、基线确定和地面高度确定等[1]。随后是各方的不懈努力,终于完成了SRTM-1数据的各种编辑,检查和验收工作,生成了覆盖面极广的SRTM DEM。这是一次里程碑式的突破:人类历史上第一次在太空中利用航天平台获得数据;第一次超广范围的三维信息获取;第一次短周期的航天测绘任务……SRTM为空间遥感技术开创了三维信息获取的新纪元。
SRTM仅用十一天就成功地获取了覆盖陆地表面80%以上的数据,再加上数据处理的耗时,总共仅用了三年时间。而利用通常的测量技术进行测量,仅测量时间至少需要八年。因此,SRTM将极大降低陆地三维数据的获取难度。虽然测绘时间仅有十一天,但SRTM也保证了数据质量。SRTM-1标称垂直精度是16m,分辨率是30m,可用于地理科研工作,具有较高的可靠性[2]。中国区的SRTM-1数据已于2015年免费开放,这为中国地理科研工作提供了极大的便利,填补了中国某些地区的数据空白。以陕西省为例,SRTM DEM提供了黄土塬,高山和树林等地区的数据。
请支付后下载全文,论文总字数:18457字