遥感影像分类方法研究文献综述
2020-03-13 09:52:57
遥感影像分类是影像分析的一个重要内容,它是利用计算机通过对影像中不同地物的空间信息和光谱信息进行分析,选择特征,并将特征空间划分为互不重叠的子空间,然后将影像中各个像元划归到子空间去。高分辨率遥感影像信息提取是从含有丰富的纹理信息和空间结构信息的高分辨率遥感影像上进行地物信息的分类及判别。
传统的遥感影像分类是基于像素、利用影像中像素的光谱值进行分类,一般分为两种方法:监督分类和非监督分类。其中,监督分类的思想是:首先根据已知的样本类别和类别的先验知识,确定判别函数和相应的判别准则,利用一定数量的已知类别的样本的观测值求解待定参数的过程成为学习或训练,然后将未知类别的样本的观测值带入判别参数,再依据判别准则对该样本的所属类别做出判定)。非监督分类是指不施加任何先验知识,仅凭遥感影像地物的光谱特征的分布规律进行盲目的聚类,其分类结果只是对不同类别达到了区分,但不能确定类别的属性。目前国内国际上对影像分类的研究主要集中在应用具体的物理的、数学的方法等对影像进行的分类研究方面[1 - 8 ] ,对于影像分类方法的研究,从不同的方面可以划分为不同的类型. 按照利用图像要素的不同,影像分类大体可以分为三种:一是基于图像灰度值的分类,二是基于图像纹理的分类,三是基于多源信息融合的分类[9 ] . 用计算机对影像进行分类应用的主要是模式识别技术,根据具体应用的数学方法不同又可分为:统计法(决策分类法) 、语言结构法(句法方法) 、模糊法以及神经网络法. 在影像分类过程中,根据是否已知训练样本的分类数据,影像分类方法又可以分为监督分类和非监督分类. 本文主要从分类原理、分类过程、分类方法等方面来探讨这两种分类方法的区别与联系。
1 监督分类的主要方法
最大似然判别法. 也称为贝叶斯(Bayes) 分类,是基于图像统计的监督分类法,也是典型的和应用最广的监督分类方法. 它建立在Bayes 准则的基础上,偏重于集群分布的统计特性,分类原理是假定训练样本数据在光谱空间的分布是服从高斯正态分布规律的,做出样本的概率密度等值线,确定分类,然后通过计算标本(像元) 属于各组(类) 的概率,将标本归属于概率最大的一组. 用最大似然法分类,具体分为三步:首先确定各类的训练样本,再根据训练样本计算各类的统计特征值,建立分类判别函数,最后逐点扫描影像各像元,将像元特征向量代入判别函数,求出其属于各类的概率,将待判断像元归属于最大判别函数值的一组. Bayes 判别分类是建立在Bayes 决策规则基础上的模式识别,它的分类错误最小精度最高,是一种最好的分类方法.但是传统的人工采样方法由于工作量大,效率低,加上人为误差的干扰,使得分类结果的精度较差. 利用GIS数据来辅助Bayes 分类,可以提高分类精度,再通过建立知识库,以知识来指导分类的进行,可以减少分类错误的发生[1 ] ,这正是Bayes 分类的发展趋势和提高其分类精度的有效途径.
神经元网络分类法. 是最近发展起来的一种具有人工智能的分类方法,包括BP 神经网络、Kohonen 神经网络、径向基神经网络、模糊神经网络、小波神经网络等各种神经网络分类法.BP 神经网络模型(前馈网络模型) 是神经网络的重要模型之一,也是目前应用最广的神经网络模型,它由输入层、隐含层、输出层三部分组成,所采取的学习过程由正向传播过程和反向传播过程组成. 传统的BP 网络模型把一组样本的输入/ 输出问题作为一个非线性优化问题,它虽然比一般统计方法要好,但是却存在学习速度慢,不易收敛,效率不高等缺点. 采用动量法和学习率自适应调整的策略,可以提高学习效率并增加算法的可靠性[3 ] .
模糊分类法. 由于现实世界中众多的自然或半自然现象很难明确划分种类,反映在遥感影像上,也存在一些混合像素问题,并有大量的同谱异物或者同物异谱现象发生,使得像元的类别难以明确确定. 模糊分类方法忽略了监督分类的训练过程所存在的模糊性,沿用传统的方法,假定训练样本由一组可明确定义、归类,并且具有代表性的目标(像素) 构成. 监督分类中的模糊分类可以利用神经元网络所具有的良好学习归纳机制、抗差能力和易于扩展成为动态系统等特点,设计一个基于神经元网络技术的模糊分类法来实现. 模糊神经网络模型由ART 发展到ARTMAP 再到FasART、简化的FasART 模型[4 ] ,使得模糊神经网络的监督分类功能不断完善、分类精确度不断增加.
最小距离分类法和Fisher 判别分类法. 它们都是基于图像统计的常用的监督分类法,偏重于几何位置.最小距离分类法的原则是各像元点划归到距离它最近距离的类别中心所在的类, Fisher 判别分类采用Fisher 准则即#8220;组间最大距离#8221;的原则,要求组间距离最大而组内的离散性最小,也就是组间均值差异最大而组内离差平方和最小. 用这两种分类法进行分类,其分类精度取决于对已知地物类别的了解和训练统计的精度,也与训练样本数量有关. 针对最小距离分类法受模式散布影响、分类精度不高的缺点,人们提出了一种自适应的最小距离分类法,在训练过程中,将各类样本集合自适应地分解为子集树,定义待分类点到子集树的距离作为分类依据[2 ] ,这种方法有效地提高了最小距离法的分类正确率和分类速度,效率较高. Fisher 判别分类也可以通过增加样本数量进行严密的统计分类来增加分类精度.
2 非监督分类的主要方法
动态聚类。 它是按某些原则选择一些代表点作为聚类的核心,然后将其余待分点按某种方法(判据准则)分到各类中去,完成初始分类,之后再重新计算各聚类中心,把各点按初始分类判据重新分到各类,完成第一次迭代。 然后修改聚类中心进行下一次迭代,对上次分类结果进行修改,如此反复直到满意为止。 动态聚类的方法是目前非监督分类中比较先进、也较为常用的方法. 典型的聚类过程包括以下几步:选定初始集群中心;用一判据准则进行分类;循环式的检查和修改;输出分类结果. 聚类的方法主要有基于最邻近规则的试探法、K- means 均值算法、迭代自组织的数据分析法( ISODATA) 等. 其中比较成熟的是K - means 和ISODATA算法,它们较之其他分类方法的优点是把分析判别的统计聚类算法和简单多光谱分类融合在一起,使聚类更准确、客观. 但这些传统的建立在统计方法之上的分类法存在着一定的缺点:很难确定初始化条件;很难确定全局最优分类中心和类别个数;很难融合地学专家知识. 基于尺度空间的分层聚类方法(SSHC) 是一种以热力学非线性动力机制为理论基础的新型聚类算法[10 ] ,它与传统聚类算法相比最大的优点是其样本空间可服从自由分布,可获取最优聚类中心点及类别,可在聚类过程中融合后验知识,有更多的灵活性和实用性.
模糊聚类法。 模糊分类根据是否需要先验知识也可以分为监督分类和非监督分类. 事实上,由于遥感影像的复杂性和不精确性等特点,预先很难获得所有有代表性样本的各类别的精确含量,因此很多情况下用纯粹的监督方法作模糊分类并不现实. 模糊聚类属于非监督分类的一种,它根据样本间的统计量的相似程度作为模糊隶属度,在无预知类别的前提下对数据集中各点作含量划分. 模糊聚类算法有多种,如基于模糊等价关系的模糊聚类分析法、基于最大模糊支撑树的模糊聚类分析法等[11 ] ,最典型的模糊聚类法是模糊迭代自组织的数据分析法#8212;#8212;#8212;Fussy - ISODATA. 但纯粹的非监督分类对影像一无所知的情况下进行所得到的结果往往与实际特征存在一定的差异,因此聚类结果的精度并不一定能够满足实际应用的要求,还需要地学知识的辅助,也就是部分监督的Fussy - ISODATA 聚类.