基于深度学习的植物叶片识别系统文献综述
2020-05-04 21:17:50
1.1、研究背景及意义
地球上植物种类繁多,多样性丰富,已发现的植物总数约有50多万种。我国幅员辽阔,植物资源丰富,种子植物30000余种,隶属于3400余属,301科。植物为人类提供了丰富的生态资源,是人类赖以生存和发展的物质基础。因此,对于植物的分类和识别是十分必要的。而实现植物叶片的自动识别,对于植物的管理和保护有着重要意义。
随着现代科学技术的发展,由计算机视觉研究发展而来的植物识别系统帮助植物学家更快的识别未知的植物种类。计算植物学将植物数据和物种概念结合到一起,利用计算机方法对植物或部分植物分类。
由于植物叶片具有容易采集保存、生理特征明显等优点,因此在植物分类学中,叶片常被作为植物分类的重要依据。此外,植物叶片关键特征的自动提取及发现对于植物性状识别及育种研究工作具有重要意义。
1.2、国内外研究现状
近年来,国内外很多学者都致力于运用基于图像数字处理技术来进行植物叶片的识别,植物叶片的分类基本特征包括形状、纹理和脉络:
(1)形状 大多数的研究都使用形状识别技术来模拟和表现叶子的轮廓形状。2006年,Neto等人介绍了椭圆傅里叶和判别分析,根据它们的叶子形状来区分不同的植物。2007年,Du等人提出将几何和不变矩的特征结合起来,提取出叶子的形态结构。2010年之后,一种基于n方差距和劳合模型的两种形状建模方法提出。SC和HOG也被用来尝试创建叶子形状描述符。2015年,Akif和Khan提出使用不同形状的特征,比如形态学特征,傅里叶描述符和一个新设计的形状定义特性(SDF)。尽管该算法在像Flavia这样的基准数据集中显示了它的有效性,但SDF仍高度依赖于叶子图像的分割结果。Hall等人提出手工制作形状(HCS)和曲率直方图(HoCS)来分析树叶。Zhao等人提出了一种新的基于形态的形状描述符,即独立的IDSC(I-IDSC),识别简单和复合叶。
(2)纹理 纹理是植物识别的另一重要研究领域。它是根据一个区域的像素分布来描述叶的表面。最早的研究之一应用了多重分形维度的植物分类。接着,在2010年,Cope等人提出在植物纹理分类中使用Gabor的方法。2011年,Rashad等人使用一种组合的分类器----学习矢量化LVQ和径向基函数RBF,基于植物纹理进行分类和识别植物。之后,在2015年Olsen等人提出使用旋转和一种尺度不变的HOG特性来表示叶图像中的纹理区域。Tang等人介绍了一种新的纹理提取方法,基于灰度水平共生矩阵(GLCM)和LBP的组合,对茶叶进行分类。2016年,Naresh和Nagendrawswamy修改了传统的局部二进制模式LBP方法,考虑相邻像素之间的结构关系,取代了基本LBP的硬阈值方法。
(3)脉络 植物学家对叶类植物的识别具有广泛的应用价值。2014年,在计算机视觉方面,Charter设计了一个名为“EAGLE”的新描述符。它由五个样本块组成,用来捕获和提取局部区域之间的空间关系。他们认为EAGLE和SURF组合能够提高特征表征的识别能力。同年,Larese等人进行了基于叶脉的识别。他们首先使用命中或失误转换(UHMT)分割静脉模式,然后使用LEAF GUI测量标准来提取一组用于静脉和区域的特征。在2016年,最新的研究尝试使用静脉形态学模式对植物识别进行深度学习。他们首先利用UHMT提取静脉模式,然后培训CNN用一块中心叶片图像来识别它们。此外,相当数量的研究使用特征组合来表示树叶。例如:尝试将形状和纹理结合起来,再加上颜色。
{title}2. 研究的基本内容与方案
{title}2.1、基本内容
首先使用卷积神经网络(CNN)来学习叶子图像的健壮的表征。然后通过特征可视化技术深入地探索、分析和理解特征子集;基于研究结果分析,为叶子数据提供一个新的全局-局部特征提取模型,并证明新的特征提取模型可以进一步提高植物分类系统的识别能力;最后,集成一套能够运行于windows环境或者Android环境的植物叶片识别系统原型。
2.2、目标
基于研究成果,设计一个新的基于CNN方法的混合全局-局部特征提取模型;集成一套能够运行于windows环境或者Android环境的植物叶片识别系统原型。
2.3、拟采用的技术方案及措施
(1)深度学习模型在叶片识别中的研究:利用Alexnet、VGG等前沿人工神经网络模型,在Flavia等主流叶片数据集上进行叶片识别。分析在不同数据集合上,不同网络模型的结构及初始化方式等方面对识别结果的影响。并于据此自行设计一个人工神经网络结构,使其能够在叶片识别中达到高效、准确的效果。