基于可变形部件模型的快速目标检测算法研究毕业论文
2021-03-22 22:25:09
摘 要
本文首先介绍了梯度方向直方图(HOG),然后据此引出论文核心研究内容可变形部件模型(DPM)。论文主要研究基于DPM的快速目标检测算法,包括训练算法和检测算法。其中,用于目标检测的模型是利用隐变量支持向量机(LSVM)训练得到的。本文还通过行人检测这一实例将基于HOG的目标检测和基于DPM的目标检测这两种检测方法做了对比研究。
研究结果表明:基于可变形部件模型的目标检测方法具有更强的可行性和稳定性,它能够应用于各种复杂背景的环境中。而且检测目标广泛,对于快速对象如车辆,以及刚体对象如行人等,都可作为检测对象。本文从理论和实验两个方面阐述了基于可变形部件模型的快速目标检测算法,多角度分析其性能。论文的研究结果对于目标检测具有重要意义。
关键词:梯度方向直方图;可变形部件模型;隐藏变量支持向量机;目标检测
Abstract
This paper first introduces the histogram of oriented gradient (HOG), and then leads to the deformable part model (DPM). The DPM is the core content of the paper, and the paper focuses on the fast object detection algorithm based on the DPM, including training algorithm and detection algorithm. Among them, the model for the object detection is trained by the latent support vector machine. In this paper, the HOG-based object detection and DPM-based object detection are compared by pedestrian detection experiments.
The results show that the object detection based on the DPM has better feasibility and stability, and it can be applied to all kinds of complex background environment. And the detection has a wide range of targets such as fast objects and rigid objects. In this paper, the object detection algorithm based on the DPM is expounded from the theoretical and experimental ways, and its performance is analyzed from multiple angles. The research results are of great significance to the object detection.
Key Words:Histogram of Oriented Gradient,Deformable Part Model,Latent Support Vector Machines,Object Detection
目 录
第1章 绪论 1
1.1 目标检测的研究背景和意义 1
1.2 国内外研究现状 1
1.3 课题研究内容 2
1.4 论文组织结构 2
第2章 可变形部件模型的基本原理 4
2.1 HOG特征 4
2.1.1 HOG特征理论描述 4
2.1.2 HOG特征算法实现 4
2.2 可变形部件模型简介 6
2.3 DPM检测算法 9
2.4 DPM训练算法 11
2.4.1隐藏变量支持向量机 11
2.4.2半凸 12
2.4.3 随即梯度下降 13
2.4.4 难例数据挖掘 13
2.4.5 DPM训练步骤 14
第3章 目标检测方法 17
3.1 HOG特征提取 17
3.2 基于HOG的目标检测实验 19
3.3 基于DPM的目标检测实验 20
3.4 两种检测方法的比较 23
第4章 结论和展望 26
参考文献 27
致谢 28
第1章 绪论
21世纪是信息时代,图片、视频是人们获取信息的主要来源。随着电子信息与计算机科学技术的不断发展,数据获取途径越来越便捷而且信息存储成本快速降低,可用的图像数据量随之急剧增长。然而面对大量复杂的数据处理任务,仅仅依靠单纯的人工处理,效率很低。这使得人们对自动化图像信息分析处理的需求日益增加。
1.1 目标检测的研究背景和意义
人工智能是近年来计算机领域中的研究热点之一,机器智能化是今后发展趋势。人类利用视觉、触觉、听觉来感知外部世界以收集信息,再通过大脑处理信息并做相应反馈。智能机器就是通过模仿人类的这种感知功能帮助人类处理大量信息以解决相关问题。在人类获取的所有外界信息中,有80%左右是通过视觉获取的图像信息,而大脑对于图像信息更加敏感。因此利用计算机视觉技术获取、处理图像可以帮助人类解决海量的图像信息。随着传感器技术、数字信号处理技术的发展,计算机视觉领域显示出了巨大的发展空间。计算机利用光学传感器采集图像,再将图像数字化,最后通过处理数字化图像得到最终所需要的信息。这一过程实现了计算机模拟人类视觉抽象能力,由此产生了计算机视觉的概念。在计算机视觉技术中,底层理论基础之一是对图像目标的检测算法。目标检测领域的算法研究面临着三个主要挑战:目标描述、目标学习和目标检测。其中,目标描述即为如何为目标建立模型;目标学习是如何通过训练样本得到模型;目标检测就是如何在图像中检测到所感兴趣的目标或者类。
随着对目标检测技术深入研究,目标检测已经应用于医学、交通、娱乐游戏等领域。对于不同的领域应用而言,感兴趣目标的定义是不同的。例如,在火车视频监控系统中,乘客是主要检测对象;在高速公路交通系统中,快速行驶的车辆是关注目标;在体感交互式游戏中,人的手、脸、体态是检测对象。而所有这些目标都有一个共同属性,即都是快速移动的。其大概实现过程是通过提取目标的颜色、纹理、形状等特征,同时考虑背景的灰度、结构和统计等特征,然后设计匹配策略和判别准则,最终实现对目标的检测。目标检测技术已成为自动化控制、计算机视觉、智能信息处理等学科的重要研究内容,其研究成果可成功应用于只能武器、情报侦察、安全监控、医疗诊断、影视娱乐、自动化生产等领域,对加快科技发展,促进社会生产力提高具有重要意义。它将大大便捷人们的生活,使社会秩序更加稳定。
1.2 国内外研究现状