基于特征和SVM的图像场景分类毕业论文
2021-03-22 22:48:48
摘 要
在物联网飞速发展和大数据时代到来的趋势下,大量的图像信息涌入人们的日常生活中,如何对这些图像数据进行高效的处理是计算机视觉领域的一个问题。将图像根据场景的不同而划分成不同的类别加以研究是图像处理的一个重要的方向。场景分类作为对图像高层语义的理解,在图像检索、模式识别等方面扮演着重要的角色。
本文主要基于SIFT特征和支持向量机来对图像场景进行分类,同时应用了目前比较流行的视觉词袋模型(BoVW)技术。SIFT特征对图像的平移、旋转、缩放等保持不变性,同时具有很好的显着性和鲁棒性,是应用广泛的局部特征。BoVW模型可以将每一幅图片的N*128维SIFT特征向量转换为1*K维的词频向量,简化了计算量的同时,也使图像特征更加直观。支持向量机作为分类器之一,错误率低,可以直接使用,被认为是最好的现成的分类器。本次设计的实验环境为Python,简洁易懂,同时使用OPENCV开源库,可以很方便快捷地对收集的图像数据集进行场景分类。
本文主要内容包括:首先对场景分类、SIFT特征、视觉词袋模型、SVM的研究背景和现状作了简要介绍,然后重点介绍了SIFT特征提取算法,视觉词袋模型原理和SVM算法,最后对实验结果的准确度进行了分析。
关键词:SIFT特征;K-Means聚类;BoVW模型;SVM分类
Abstract
In the trend of rapid development of Internet of things and the arrival of big data age, there is a large amount of image information in people's daily life, how to deal with these image data is a problem of computer vision field. It is an important direction for image processing to divide the image into different categories according to the different scenes. Scene classification plays an important role in image retrieval, pattern recognition and so on as an understanding of high-level semantics of images.
In this paper, we mainly classify image scenes based on SIFT feature and support vector machine (SVM), and apply the popular technology of In this paper, we mainly classify image scenes based on SIFT feature and support vector machine (SVM), and apply the popular technology which is Bag of Visual Words (BoVW). SIFT feature preserves the invariance of the translation, rotation, scaling and so on of the image, and has good significance and robustness, and is widely applied. The BoVW model can transform the N * 128 dimensional SIFT feature vector of each picture into a 1 * K-dimensional word frequency vector, which simplifies the computation and makes the image feature more intuitive. Give the reason that error rate is low, and it can be used directly, Support vector machine as one of the classifiers, is considered the best ready-made classifier. The design of the experimental environment is Python, simple and easy to understand, while is using OpenCV ,the open source library, you can quickly and easily classify the image data set for scene classification.
The main contents of this paper are as follows: Firstly, the background and present situation of scene classification, SIFT feature, Bag of Visual Words and SVM are briefly introduced. Then the SIFT feature extraction algorithm, Bags of Visual Words model principle and SVM algorithm are introduced in detail. Finally, The accuracy of the results was analyzed.
Key words: SIFT feature;K-MEANS clustering;BoVW model;SVM classification
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 场景分类的研究意义及现状 1
1.2 视觉词袋模型的研究背景及现状 2
1.2.1 研究背景 2
1.2.2 存在问题及改进 2
1.3 支持向量机的研究背景及现状 3
1.3.1 研究背景 3
1.3.2 研究现状 3
第2章 SIFT特征介绍及其算法分析 5
2.1 SIFT特征介绍 5
2.2 SIFT特征提取算法 6
2.2.1 尺度空间的生成 6
2.2.2 兴趣点(关键点) 8
2.2.3 描述子 9
第3章 视觉词袋模型 12
3.1 K-Means聚类 12
3.2 词袋模型 13
3.3 视觉词袋模型(BoVW) 15
3.3.1 视觉词袋模型介绍 15
3.3.2构建BoVW码本步骤 15
3.4 本章小结 16
第4章 支持向量机的算法与分类介绍 17
4.1 支持向量机简介 17
4.2 算法分析 18
4.2.1 风险最小原则 18
4.2.2 常规SVM形式 18
4.2.3 核函数 20
4.3 本章小结 23
第5章 场景分类系统的实现结果 24
5.1 实验环境 24
5.2 数据集 24
5.3 实验过程 25
5.4 结果分析 26
5.4.1 SIFT特征点显示 26
5.4.2 系统结果展示 27
5.4.3准确度分析 28
第6章 总结与展望 30
6.1 论文工作总结 30
6.2 未来工作展望 30
参考文献 31
致 谢 33
第1章 绪论
1.1 场景分类的研究意义及现状
伴随着科技的不断发展,物联网时代和大数据时代已经到来。人们每天都在海量的图像数据包围之中,网上也充斥着各种图片分享的博客,论坛,APP等。而使用计算机对这些图像进行处理属于计算机视觉领域对的范畴。场景分类是计算机视觉领域中一个比较热门的研究方向。对于一张图像,大脑会自动判断它是属于室内还是室外,是自然风光还是人造建筑等,但是对于计算机而言,是不会自动分类的。这就需要我们根据目前的学习算法来进行研究。就像要判断一辆汽车是不是正在行驶,就要看它的场景是道路还是车库,如果仅仅根据车的局部特征来判别的话,会出现很大的偏差。这时候就需要用到场景分类了 [1]。
场景分类指的是按照场景内容的相近性将图片分门别类,属于图像分类中基于高级语义模型的一个比较活跃的分支。而同一场景由于光照、遮挡、位置等因素而具有可变性,因此快速且鲁棒地理解图像场景成为近些年计算机视觉领域研究的重要内容。2006年在麻省理工学院首次召开了关于场景理解的研讨会,会上指出了 “场景分类是图像理解的一个新的有前途的研究方向” [2]。这些年,关于场景分类的研究,许多科研机构在这方面投入了大量的精力。