基于机器学习的图像分类研究毕业论文
2021-04-19 00:13:05
摘 要
在多媒体技术成熟运用的今天,图像分类在许多领域都占了一席之地,如在图像检索、网络信息过滤、遥感系统定位、视频分类、可视场景目标跟踪等领域发挥着巨大作用。
本文首先介绍了研究图像分类的背景和意义,并分析了目前国内外的研究现状,其次简述了图像分类的技术方案和具体的实验方案;详细介绍了用于图像特征提取的HOG特征原理,说明了选择HOG特征的原因以及它的优点;介绍了两种用于图像分类的分类算法——KNN和SVM,详细说明了它们的原理;为了提高分类器的分类性能,给出了优化KNN算法的K值和SVM核参数的粒子群优化算法;接着将Caltech101标准图像数据库中具有相似体态,且都是猫科动物的美洲狮和豹子作为分类样本,在Visual Studio 2013软件上利用OpenCV2.4.9对所使用的算法进行实现并对分类的结果进行了对比。分析仿真结果,在两种算法没有经过参数优化时,SVM的分类结果优于KNN算法,但是分类的正确率都不高,为84.375%。对两种算法的参数优化之后,SVM的分类结果依然优于KNN算法,但分类的正确率有明显的提高,为93.75%。并且,通过对仿真结果的对比分析,在分类正确率相当的情况下,SVM的RBF核函数是最好的选择,它的效率要比其他核函数高,节约时间,提高工作效率;最后对本文的工作进行了总结。
关键词:梯度方向直方图(HOG);K-最近邻;支持向量机;粒子群算法(PSO)
Abstract
In the mature use of multimedia technology, image classification has occupied a place in many fields, such as image retrieval, network information filtering, positioning of remote sensing systems, video classification, and tracking of visual scene targets.
This paper first introduces the background and significance of the research on image classification, and analyzes the current research status at home and abroad. Then it briefly describes the technical scheme of image classification and the specific experimental scheme. The HOG feature principle for image feature extraction is introduced in detail. The reasons for selecting HOG features and its advantages are described. Two classification algorithms for image classification, KNN and SVM, are introduced, and their principles are explained in detail. In order to improve the classification performance of classifiers, an optimized algorithm that is the particle swarm optimization algorithm is presented for the K-value and SVM kernel parameters; then, the similar physiques in the Caltech 101 standard image database, all of which are feline puma and leopards are used as classification samples. The OpenCV 2.4.9 computer vision open source library is used to implement the algorithms used in the Visual Studio 2013 software. Analysing the simulation results, when the two algorithms have not been optimized by parameters, the classification result of SVM is better than KNN algorithm, but the correct rate of classification is poor, which is 84.375%. After optimizing the parameters of the two algorithms, the classification result of SVM is still better than that of KNN, but the correct rate of classification is obviously improved, which is 93.75%. Moreover, through the comparative analysis of the simulation results, the RBF kernel function of SVM is the best choice when the classification accuracy is quite equal, and its efficiency is more effective than other kernel functions, saving time and improving work efficiency; finally,the work is summarized.
Key words: Histogram of Oriented Gradient;K-NearestNeighbor;Support Vector Machine;Particle Swarm Optimization
目 录
第1章 绪论 1
1.1研究背景及意义 1
1.2国内外相关课题的研究现状 1
1.3本文的主要工作 3
1.4本文组织结构 4
第2章 理论基础 5
2.1梯度方向直方图 5
2.2 K最近邻算法 7
2.2.1 KNN算法介绍 7
2.3 支持向量机分类算法 9
2.3.1 分类标准的起源 9
2.3.2 支持向量机线性可分 10
2.3.3 支持向量机线性不可分与核函数 13
2.4 章节小结 14
第3章 分类算法的参数优化 15
3.1基于粒子群算法的SVM核参数选择 15
3.1.1粒子群算法介绍 15
3.1.2利用粒子群算法优化SVM核参数 16
3.2 KNN算法的K值选择 17
3.3本章小结 17
第4章 仿真实验 18
4.1 仿真实验步骤 18
4.1.1 仿真实验环境 18
4.1.2 仿真实验数据集 18
4.1.3 仿真实验过程及仿真结果 21
4.2 仿真实验结果比较 25
4.3 章节小结 29
第5章 总结 30
5.1本文工作总结 30
5.2未来展望 30
参考文献 31
附录 33
致谢 34
第1章 绪论
1.1研究背景及意义
由于互联网的发展,人类社会进入了识图时代。识图时代的一个显著特征就是图像在信息传播中占了很大的比重[1]。试验证明:在人们通过各种渠道获取的信息中,有83%来自视觉,听觉占了11%,其他来自触觉、嗅觉和味觉[1]。由此可见,图片信息以其包含信息量大,传播速度快,表达直观易懂的优势成为现代信息传播中的极其重要的媒体之一。但是,如此大量的图片又给人们提出了一个新的问题,那就是对图片的管理问题。利用计算机对图片进行识别、分类等是图像管理的一个重要方面[2]。数字图像的分类就是让计算机用类似人类的理解方式将数字图像分类到不同类别中。目前,图像分类已成为机器学习和计算机视觉中一个非常热门的研究课题,在实际中有特别广泛的应用,包括目标跟踪、图形检索、医学图像处理等。
图像的数学模型是高维和多变的信号函数[3],容易受到拍摄视角、物体遮挡或者噪声、曝光以及光照条件等因素的影响,进而产生强烈的变化,投射到频域就会看到有高频的信号等一系列干扰,这些问题对数字图像的分类造成困难。并且,有些情况下,不同的人在看一幅图像的时候可能产生不同的结果。更何况计算机在处理一张图片的时候,肯定会产生一些不同于人类的差异,这种差异也将影响对图像分类的衡量。