基于机器学习的图像分类研究文献综述

2020-04-30 16:12:22

1．目的及意义

1.1研究的意义及目的

由于互联网、新媒体的兴起，人类社会进入了读图时代。网络图片在信息传播中占的比重越来越大是读图时代的一个重要表现。试验证明：人类获取的信息83%来自视觉，11%来自听觉，其他来自嗅觉、触觉和味。由此可见，图片信息以其包含信息量大，传播速度快，表达直观易懂的优势成为现代信息传播中的极其重要的媒体之一。但是，如此大量的图片又给人们提出了一个新的问题，那就是对图片的管理问题。同时在互联网如此发达的当今社会，如何运用计算机对这些图片进行管理，成为了一个亟待解决的问题。利用计算机对图片进行识别、分类等是图像管理的一个重要方。数字图像的分类就是让计算机用类似人类的理解方式、视觉识别和图像处理将数字图像分类到不同类别中。目前，图像分类已成为机器学习和计算机视觉中一个非常热门的研究课题，在实际中有特别广泛的应用，包括航空预警、场景识别、目标跟踪、图形检索、医学图像处理、智能交通等。可见，在国防安全、工业信息化、互联网科技和日常生活的各个方面都应用了图像分类，其极大的改善了人们生活和工作的方式，减轻了负担，给人们带来了方便。

由于计算机视觉、数据库、图像处理等多项领域的技术成果被应用于数字图像分类中，并且数字图像分类也包含了机器学习的技术结晶，所以总体来说，数字图像分类的发展必将带来其他领域的发展，也必将带动应用技术的进步。

图像的数学模型是高维和多变的信号函，容易受到拍摄视角、上下文变化、尺寸放缩、物体遮挡或者噪声、曝光以及光照条件等因素的影响，进而产生强烈的变化，投射到频域就会看到有高频的信号等一系列干扰，对数字图像的分类造成困难。并且，有些情况下，不同的人在看一幅图像的时候可能产生不同的结果或者有区别的理解。更何况计算机在处理一张图片的时候，肯定会产生一些不同于人类的差异，这种差异也将影响对图像分类的衡量。类似这样的问题，都会成为数字图像分类中需要考虑和解决的技术问题。

所以，如何将人类所看到的图片内容正确转化为计算机识别的图片信息是至关重要的。在实际问题中，为了使计算机能够正确的对图片进行分类，首先应该进行的操作是从图片中提取有效的特征表示。如何在图片中提取有效的特征和提取哪种特征，是决定数字图像分类准确率的关键。此外，一个好的分类器也是实现数字图像分类的决定性因素。

1.2 国内外研究现状

目前国内外学者对图像分类进行了大量的研究，其中国外学者对图像分类的研究主要是作为商业或者学习交流之用的。如伊利伊诺大学厄巴纳-香槟分校（UIUC）开发的MARS（Multimedia analysis and retrievalsystem）系统、IBM公司开发的QBIC（Query by image content）系统、哥伦比亚大学的VisualSeek系统和WebSeek系统、麻省理工大学的Photobook系统和UC Berkeley的Digital Library Project等这些典型的系统都应用了图像分类。另外，最近图像分类的研究主要是关于图像特征提取方面的。Fatemh Zamani和Mansour Jamzad于2017年发布的一篇论文中讲解了一种新的特征处理办法，特征融，来处理通常图像分类中单一的特征造成的面对复杂图像时分类准确率低的情况。由于通常图像在颜色、形状和纹理等方面具有丰富的信息，描述具有多个特征的图像而不是单一的特征，结果会是一个更精确的分类器。Nidhin Prabhakar T V和Geetha P于2017年9月发布的一篇论中为了解决高维度问题，提出了多特征挖掘技术，这是一种基于二维经验小波变换特征提取的高光谱分类方法，有效的降低了数据的维度，产生了较好的效果。Sevcan Aytac Korkmaz和Hamidullah Binol于2018年初发布了一篇论，论文中计算了图像的局部二进制模式（LBP）和定向梯度（HOG）特征的直方图，并且采用了Sammon映射、随机邻域嵌入（SNE）、异构ap、经典多维标度（MDS）、局部线性嵌入（LLE）、线性判别分析（LDA）、t分布随机邻域嵌入（t-SNE）和拉普拉斯特征映射来减少特征，降低维度，用人工神经网络和随机森林进行分类，最后得到结果是LBP_MDS_ANN和LBP_LLE_ANN方法获得了最好的精度结果。但是，神经网络在应用的过程中存在难点，输入层的数量的确定和隐含层数量的确定需要一定的经验才能使用好它，使用层数较深的神经网络会遇到很多问题，比如：容易过拟合、参数难以调整、梯度弥漫等。

而国内的学者们也在展开图像分类的研究，以武汉大学为首的利用机器学习对遥感图像的分类发展很快。近期的一篇名为《Remotesensing image classification based on the optimal support vector machine andmodified binary coded ant colony optimization algorithm》的论，给出了把智能算法-蚁群算法和支持向量机结合的遥感图像分类方法。还有在支持向量机的核函数和参数选择上进行研究，应用于高光谱的遥感图像分类等。华中科技大学的博士毕业论针对具有丰富的空间和光谱信息的高光谱图像在实际中样本少的特点，提出了一种高斯加权的局部均值算子来解决此问题。此外，由中科院开发的ImageSeek就是多年研发的成果。并且，针对图像特征提取的研究，西北工业大学的博士毕业论中对用于噪声高光谱的图像分类的线性特征提取方法进行了对比性研究，得出了在分类操作之前，用偏最小二乘-SB的特征提取方法和偏最小二乘的特征提取方法对图片进行操作会使分类结果最好，改进了具有对偶性扩展形态轮廓特征，提出了具有对偶性扩展形态轮廓特征（EMPD）。

目前发展很快的分类方法主要有神经网络法、支持向量机分类法、专家分类法、模糊集结合分类法和粗糙集分类法等。同时，为了提高分类精度，还引进了小波分析思想，分区分类思想等。各种分类方法各有优劣，其中支持向量机是目前研究的热点之一。由此可见，图像分类领域的目前和未来主要研究方向将是基于统计学习理论的支持向量机。并且，对图像的特征的提取以及处理也将是研究热点之一。

根据图像的特征的提取和分类器的设计，本文将采用现有的图像特征提取方法方向梯度直方图（Histogram of Oriented Gradient,HOG）和分类算法K-最近邻（K-Nearest Neighbor，KNN）分类算法和支持向量机（Support Vector Machine，SVM）来完成图像的分类工作。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码