多光谱LIDAR的随机森林地物分类研究开题报告
2022-01-05 21:06:16
全文总字数:8481字
1. 研究目的与意义及国内外研究现状
机载激光雷达(lidar)是近年来发展起来的一种新型遥感装置,是一种机载激光测距探测系统,在地物调查、地形测绘等领域有着广泛的应用[1]。lidar能够精确地测量出地面激光足点的空间位置,同时也能获得激光反射强度。通过在测区内部署高密度激光测点,lidar可提取地面高度信息,重建地表三维结构。传统遥感数据源通常难以直接获得垂向观测数据,提取受高度控制的地表分异信息比较困难。利用lidar高度数据进行地物分类工作不仅能弥补传统遥感分类在这些方面的不足,而且基于高度分异的地表信息 在许多实际工作领域内也有很高的应用价值[2]。
利用 lidar独立数据源进行地物判定和分类,本质上是从lidar数据所描述的“垂向结构”到“地物属性”的推理过程,这也导致常规的遥感分类方法往往在lidar地物分类工作中无法取得令人满意的精度。有学者试图从lidar 数据特征描述和智能学习方面来提高lidar 地物分类精度,如mass[3]最早使用了高度纹理来描述地物分布的空间结构、格局、自相关关系等,并用以构成地表属性判别的证据系统;dimitrios[4]提出了一种多尺度的高度纹理特征并用于基于地貌形态特征的图像分割。也有学者试图利用机器学习方法来解决这种复杂证据系统推理,如 poonam[5]利用专家系统知识库对lidar高度纹理进行判定;junghoi[6]等利用决策树方法对12 种lidar 高度纹理和反射强度图像进行训练并用于地面对象和覆盖物的类型划分。这些研究大多利用了地表先验知识来缩减问题规模,在地面条件复杂或地面先验知识不足的情况下,分类规则往往难以推广,分类精度也有待提高。
由于传统的分类模型往往精度不高,且容易出现过拟合问题。因此,很多学者通过聚集多个模型来提高预测精度,这些方法称为组(ensemble)或分类器组合(classifier combination)方法。首先利用训练数据构建一组基分类模型(base classifier),然后通过对每个基分类模型的预测值进行投票(因变量为分类变量时)或取平均值(因变量为连续数值变量时)来决定最终预测值。为了生成这些组合模型,通常需要生成随机向量来控制组合中每个决策树的生长。bagging是早期组合树方法之一,又称自助聚集(bootstrap aggregating),是一种从训练集中随机抽取部分样本(不一定有放回抽样)来生成决策树的方法[7]。在bagging方法中,随机向量Θ可以理解为通过随机扔n把飞镖在n个箱子上扔中的结果生成,其中n是训练集中的样本记录数。在生成许多决策树后,通过投票方法或取平均值作为最后结果,我们称这个为随机森林(random forest)方法。随机森林(rf)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。大量的理论和实证研究都证明了rf具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合[8]。
2. 研究的基本内容
机载多光谱lidar能够快速获取地面点的三维坐标信息,结合地物表面材质的强度信息转化为图像数据并提取植被信息,通过数字地面模型(dsm)的高度特征获取地物的纹理和光谱特征。然后对每个波段的lidar数据按随机森林算法进行分类研究,对分类结果进行精度评价,并将基于随机森林算法的地物分类精度与利用支持向量机(svm)进行分类的精度相互比较。本论文将共分为六章,各章安排如下:
第一章引言。主要阐述本论文的研究的目的和意义,并介绍机载lidar技术以及lidar数据处理的国内外研究现状。
第二章基于多光谱lidar数据的植被信息提取方法的综述。通过阅读文献,并根据多光谱lidar数据的波段特点,结合相应的数学公式,来进行植被信息的提取。
3. 实施方案、进度安排及预期效果
实施方案:首先查阅相关文献资料,了解什么是lidar数据以及随机森林算法的原理。然后利用matlab进行影像读入,提取植被信息和光谱特征,基于随机森林算法对每个波段的lidar数据进行分类并给出随机森林对每个目标地物的特征贡献度,最后利用所选择出来的特征,利用支持矢量机进行分类比较。
进度安排:2017年12月25日前,完成选题;
2018年2月26日前,了解课题,填写毕业论文任务书;
4. 参考文献
[1]wehr a,lohr u. airborne laser scanning——an introduction and overview[j]. isprs journal of photogrammetry and remote sensing,1999,54( 2) : 68-82.
[2] bork e w,su j g. integrating li dar data and multi-spectral imagery for enhanced classification of rangelandvegetation: a meta analysis[j]. remote sensing of en-vironment,2007,111( 1) : 11-24.
[3] maas h g.the potential of height texture measures for the segmentation of airborne laser scanner data [c]∥proceedings of 4th international airborne remote sensing conference and exhibition.ottawa:[s.n.],1999:154-161