基于Sentinel遥感数据的作物分类及种植面积提取研究毕业论文
2020-04-15 20:17:42
摘 要
在现代精准农业中,采用遥感手段对大范围农作物的各生长阶段的情况进行监测是一种高效的方法,其中对作物混合种植区域进行作物精细分类识别是业界的一个主要研究方向。在当今业界,传统的遥感作物分类往往存在多源遥感数据丰富,但地面实地踏勘样本种类与数量因经济成本、时间成本和人力成本而缺乏的情况,且目标分类作物之间的光谱特征接近,难以以常用方法进行正确分类并进一步提取种植面积。另一方面,光学雷达无法在研究区上空多云情况下发挥良好效果,雷达数据弥补这一缺点但无法获取更多的光谱信息。为了寻求解决这一难题的途径,本文首先研究基于Sentinel系列光学与合成孔径雷达(SAR)遥感数据不同波段组合下的分类结果,在此基础上,采用一种基于随机森林与决策树模型的差值自然指数二次分类方法,与单一随机森林分类法进行对比,得到如下结论:(1) 多源遥感数据的分类精度同时受波段数与具体目标作物的物候学最佳分类时相的影像的影响,且受物候学最佳分类时相的影响较大。在6波段多时相雷达数据的基础上,增加2018年4月与5月光学遥感数据组成的14波段多源遥感数据精度最高,总体分类精度达98.1595%,Kappa系数达0.9678;(2) 基于随机森林与决策树模型的差值自然指数二次分类法在冬小麦与油菜的精细分类中具有一定的可靠性,Kappa系数达到0.3021,总体分类精度达64.2105%,表明此方法能在一定精度范围对出现同谱异物现象的作物进行分类。
关键词:多源遥感数据 同谱异物 作物分类 面积提取
Research on Crop Classification and Planting Area Extraction Based on Sentinel Remote Sensing Data
Abstract
In modern precision agriculture, it is an effective method to use remote sensing method to monitor the situation of each growth stage of crops, among which fine classification and identification of crops in mixed planting areas is a major research direction of the industry. Nowadays, the traditional crop classification in the industry is often rich in multi-source remote sensing data. However, due to the lack of type and quantity of field survey samples owing to the economic cost, time cost and human cost, and the close spectral characteristics between the target classification crops, it is difficult to correctly classify and further extract the planting area by common methods. On the other hand, optical remote sensing data can not perform well in cloudy sky over the study area. Radar data makes up for this shortcoming, but cannot obtain more spectral information. Therefore, aiming at the difficulties and pain points of target crop classification in this common situation, this paper researched the classification results based on Sentinel series multi-source remote sensing data band permutation and combination, and based on this, adopted a differential natural index classification method based on the random forest and decision tree model to compare with the single random forest classification method, so as to evaluate its accuracy and further obtain the planting area of target crops of winter wheat and rape. It is concluded that: (1) the classification accuracy of multi-source remote sensing data is affected by both the number of bands and the images of the phenological optimal classification phase of specific target crops, and is greatly affected by the phenological optimal classification phase. On the basis of the 6-band multi-temporal radar data, the 14-band multi-source remote sensing data composed of optical remote sensing data in April and May 2018 has the highest accuracy, with the overall accuracy of 98.1595% and Kappa coefficient of 0.9678.(2) The differential natural index classification based on the random forest and decision tree model has a certain reliability in the fine classification of winter wheat and rape, with Kappa coefficient reaching 0.3021 and overall accuracy reaching 64.2105%, indicating that this method can classify crops with the foreign bodies of the same spectrum matter within a certain range of precision.
Key words: multi-source remote sensing data; the foreign bodies of the same spectrum matter; crop classification; area extraction
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1研究背景及意义 1
1.1.1研究背景 1
1.1.2研究意义 1
1.2作物遥感监测的国内外研究现状 2
1.2.1多源遥感数据利用研究近况 2
1.2.2分类算法研究近况 2
1.3研究内容与路线 3
1.3.1研究内容 3
1.3.2研究路线 3
1.3.3论文架构 5
第二章 数据源与预处理 6
2.1数据源 6
2.1.1 Sentinel-1雷达数据 6
2.1.2 Sentinel-2光学数据 7
2.1.3地面矢量数据 8
2.2数据预处理 9
2.2.1 Sentinel-1数据预处理流程 9
2.2.2 Sentinel-2数据预处理流程 11
2.2.3地面作物样本预处理流程 12
2.3本章小结 13
第三章 基于多源遥感数据的作物初分类 14
3.1研究区域 14
3.2分类精度评定参数 15
3.3波段组合分类与精度分析 16
3.3.1 6波段多时相雷达遥感数据 16
3.3.2 10波段多源遥感数据 20
3.3.3 14波段多源遥感数据 21
3.3.4 18波段多源遥感数据 23
3.5本章小结 24
第四章 目标作物种植面积提取 25
4.1材料与方法选取 25
4.1.1单一随机森林分类法 25
4.1.2基于随机森林与决策树模型的差值自然指数二次分类法 26
4.2目标作物面积提取 30
4.3误差分析 30
4.4本章小结 31
第五章 结论与展望 32
5.1结论 32
5.2创新点 32
5.3存在的问题与展望 33
参考文献 34
致 谢 37
第一章 绪论
1.1研究背景及意义
1.1.1研究背景
油菜与冬小麦这两者作为东亚与东南亚这一占世界一半以上人口地区的最主要经济作物之一,其生长状况和产量是该地区经济与食品安全的重要组成部分。早期研究多利用单极化的SAR数据对农作物种植面积进行提取,不过大量研究表明使用单极化的SAR数据进行农作物种植面积提取很难达到较高的识别精度,因此目前多极化与全极化SAR数据 的运用研究也日益增加,如Lu Xu等探讨了紧密型极化SAR(CPSAR)与全极化SAR(FPSAR)数据在RF分类下的结果,证明CPSAR与FPSAR在分类结果上有良好的一致性,今后可将CPSAR运用于RF分类[1]。目前,国内外众多的研究集中在利用光学影像遥感与SAR(synthetic aperture radar)两者独立或结合对农作物分类识别,并进一步对作物进行估产[2]以及能源作物生物量估算[3]等信息加工处理。
另一方面在分类结果精度优化领域,针对传统阈值法农作物识别过程中阈值设置存在灵巧性差和自动化程度低等缺陷,有研究将全局优化算法应用于阈值模型中阈值优化选取,提出利用时序NDVI数据开展阈值模型阈值参数自动优化的空间制图方法(郭文茜等,2018)[4]。在特定的环境模型中,地图质量通常使用混淆矩阵的标准方法在全局或者类特定级别进行评估。针对准确性度量方法不能提供分类质量的空间可变性信息,Lien Loosvelt等提出一种基于类隶属度局部概率的分类不确定性评估分析方法[5]。与之相反,有研究针对传统方法较难将季节性作物生长造成的土地覆被变化与土地利用区分开,对此研发了一套基于先验知识的作物物候自动识别系统用以提供分类结果的精度[6]。以上皆是通过外部方法解决分类结果精度优化,也有少部分研究关于高分辨率SAR图象分割方法,如Yongke Ding等提出一种通过测量SAR图象网格层上的局部标签结构进行建模的新型SAR分类方法[7]。以上研究表明,当前需进一步探索基于多源遥感数据的作物精细分类在实际应用上的可靠性与稳健性
1.1.2研究意义
目前农作物SAR遥感方面有如下不足:一是对在地面实地踏勘样本种类与数量缺乏的情况下对光谱特征接近的地物分类研究缺少;二是对散射机理研究较少,导致合理性与通用性不强,;三是对多种不同极化方式SAR与光学遥感数据等多源数据融合的研究较少[8]。本研究通过对不同极化方式与光学遥感波段组合并进行精度评定对比,在江苏省研究区获取实地踏勘数据,选择一部分点进行实验另一部分点进行交叉验证以确保达到预期精度要求。针对旱地作物研究较少这一近况,选择冬小麦与油菜作为目标作物,研究其后向散射特征与多光谱反射率特征。此外通过两种分类方法进行对比以确保分类结果的稳健性,以期本研究对光谱特征接近且研究区样本种类与数量缺乏的农作物种植范围分类与提取提供一定的借鉴。
1.2作物遥感监测的国内外研究现状
1.2.1多源遥感数据利用研究近况
在SAR与光学遥感数据结合分析领域,周涛等将种植结构复杂的都市农业区作为研究区域,利用支持向量机(support vector machine,SVM)获取冬小麦作物面积,结果表明当SAR影像与光学影像结合时总体精度对比单独使用SAR后向散射数据或者光学数据时显著提高[9]。更进一步,Dimo.D等先通过在分组单独运用极化SAR数据、光学数据以及SAR与光学多源数据,再进一步运用不同的机器学习算法在农作物分类领域,增加了新的变量,发现斑块滤波时间序列SAR数据精度较低,而融合数据集的总体准确性得分较高[8]。在实际运用层面,加拿大已经进行了一项多时段多区域的项目,通过SAR与光学遥感数据结合对大面积的作物进行分类并库存,取得了良好的效果[10]。综上所述,在多源遥感数据越来越丰富的背景下,充分利用不同遥感数据综合进行作物分类前景十分广阔。
1.2.2分类算法研究近况
在遥感的分类算法领域,被称为“硬分类”的监督分类和无监督分类多年来得到广泛应用,监督分类与无监督分类都依赖于经典的集合理论,但这些传统的分类方法在作物样本混合且光谱特征接近的情况下往往不能得到满意的分类结果,例如某些不完全被单一同类类别所占据的像素,这时例如模糊系统分类、人工神经网络和进化算法等“软算法”会发挥其作用[11],近年来业界在分类算法上的成果颇丰,例如Zhongle Ren等提出一种基于补丁分类的深度神经网络以实现无监督分类特征识别学习的方法。其中随机森林(Random forest,RF)作为近年来运用最广泛的分类算法之一,在实际遥感影像分类中表现突出。在评价RF分类器的分类结果准确率方面,Kenichi Tatsumi等利用RF分类器对八种作物进行分类,分类结果的评价基于几个标准:对训练数据集大小的敏感性,变量的数量,以及映射的准确性,研究结果表明,训练数据集的大小对分类准确率影响极大,而分类器的准确率随着训练数据的增加而降低[12]。而在处理多源数据集方面,Sybrand van Beijma等利用RF分类器,分析了s波段和x波段四极机载SAR的组合,高程数据和光学遥感图像,采用两种主题分辨率的随机森林分类器进行分类,生成了盐沼植被的一般映射和盐沼植被生境的主题详细映射。结果表明,随机森林模型能够处理多源数据集,并产生较高的分类准确率[13]。因此,在此基础上业界对RF分类过程也进行了不同的优化,使其能够适应不同的目标区域与时序阶段条件。其中,对于农业土地覆被较短间隔时间变化剧烈的特点,Damian Bargiel提出一种结合物候变化知识的分类方法,该方法基于密集的Sentinel-1数据和和有关作物的物候学准确信息,形成识别作物类型的物候序列模式,在这种模式上的标准分类方法要优于经典标准分类方法(RF分类法,最大似然法),且对田野中杂草的比例等细微变化更加敏感[14]。综上所述,基于不同数据类型、不同目标作物的分类算法提出与优化也是当今业界的热门研究方向。
1.3研究内容与路线
1.3.1研究内容
本研究针对农作物遥感分类中所存在的难点,在地面样本种类与数量缺乏的情况下,对某些同谱异物的农作物如何进行正确精细分类展开研究。研究内容主要包括以下两个方面:
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: