自然背景下行人检测与识别方法研究文献综述
2020-04-14 20:11:35
1.1设计目的及意义
随着科学技术的快速发展,信息的获取显得越来越重要。人们认识世界的重要来源就是图像,在很多时候图像的信息比其他的信息显得更加的丰富,真实和具体,根据研究统计人类获得的信息80%左右是图像信息。由此可见图像信息的重要性,近年来以图像,图形以载体的计算机视觉技术正在不断的发展,并且广泛的应用于医学、交通、工业、自动化等领域。
计算机视觉包含了图像恢复、图像分类、图像检测、图像分割等一系类图像问题。行人检测作为目标检测的典型实例,因其在汽车安全、监控及机器人技术中的直接价值引起了研究者们的极大关注。近年来随着计算机技术的高速发展,行人检测在检测精度和检测效率上取得了很明显的进步。但是由于行人的任何一个活动都不是固定不变的,受到很多因素的影响,因此行人检测仍然是研究的一大难题,需要投入很多的研究。
行人检测的目标是计算机能够针对待检测的图像或视频,判断出是否有行人,并实时准确地显示出行人的位置。这一项技术在智能辅助驾驶、智能监控、行人分析、智能机器人分析以及智能交通等领域有着重大的意义。
1.2国内外研究现状
随着行人检测技术的广泛应用为人们带来便捷、安全的高质量生活,越来越多的学者投入到行人检测技术的研究中。在2000年时候,欧洲国家着手于PROTECTOR系统的研究,该系统结合了行人检测、轨道估计、风险评估和驾驶员预警,并提出了一种在实际车辆环境中检验行人检测性能的方法。研究者不断加大行人检测的研究力度,每年很多的相关文章都会发表在计算机视觉的三大权威会议以及各大顶级期刊上。
近十年的研究中出现了许多的算法框架。其中比较典型的方法有Viola-Jones,HOG SVM,DPM,CNN。
Viola-Jones提出的Haar特征是最具代表的特征之一。2001年,Haar特征结合Adaboost分类器成为了一种基于滑动策略的快速行人检测方法。之后人们发现学习算法和特征描述算子是制约行人检测系统性能的两个关键性因素,并在这两个方面做出了相当大的进展。2005年Dalal等人成功将SIFT特征从图像匹配转移到物体检测上,提出了梯度方向直方图(HOG),使得行人检测技术大大推进。至今HOG技术是一项很典型的算法,HOG特征提取结合线性SVM分类器是行人检测领域中一项典型算法。Mori和Sabzmeydani于2007年提出了Shapelet特征算法,是一种基于图像局部区域的策略方法。2008年Pedro Felzenszwalb等提出了一种用于物体检测的判别训练多尺度、可变形部件模型。该模型的基础构造模块就是HOG特征,即从两个不同尺度上提取HOG特征。在此之后又提出了很多改进算法,比如三层树形模型等。
国内例如中科院计算机科学实验室孙庆杰等人利用基于侧影的人体模型及其对应用的概率模型,提出了一种基于矩形拟合的人体检测算法。西安交通大学郑南宁等研究了利用支持向量机识别行人的方法,通过稀疏Gabor滤波器提取行人样本图像中行人的特征,然后利用支持向量机来训练所提取的样本特征等等。
在2009年,Caltech行人检测数据集被发布了,并由此确定了行人检测的评价指标为每张图片的误检个数。目前常用的方法包括DPM,深度神经网络和决策树三大类。随着计算机技术的不断发展,卷积神经网络渐渐作为一种比较成熟的行人检测方法,本文将采用这种方法对行人检测进行研究。