基于深度卷积网络的行人部件检测开题报告
2021-12-29 21:48:30
全文总字数:2791字
1. 研究目的与意义及国内外研究现状
近年来,全程数字化、网络化的视频监控系统优势愈发明显,其高度的开放性、集成性和灵活性,为整个社会信息化的发展提供了更加广阔的发展空间;但同时也带来了一个问题,即海量的视频监控流使得发生突发事故后,需要耗费大量的人力物力去搜索有效信息。行人作为视频监控中的重要目标之一,若能对其进行有效的外观识别,不仅能提高视频监控工作人员的工作效率,对视频的检索、行人行为分析也具有重要意义。
国内外研究现状
图像识别技术是人工智能领域的一个重要组成部分,它主要是利用计算机对图像进行处理、分析和理解,识别各种不同的目标对象的技术手段。例如,实验者们在给定一幅含有一个或多个目标物体的图像中,图像识别技术主要由以下三个部分组成,第一阶段主要工作在于图像分割,将目标对象与背景分离;第二阶段工作在于特征提取,用特征表示目标;第三阶段工作在于分类,依据特征分类。目前,随着互联网新型产业的快速发展,图像的识别技术已经成为了当下的研究热点,并且研究者们基于图像识别进行了许多相关的研究工作,因此也产生了许多非常重要的研究成果。
在特征算法方面,2006年,加拿大多伦多大学的教授和他的学生在《科学》杂志上发表了一篇关于深度学习研究的文章,这也直接推动了深度学习在学术界和工业界的发展。深度学习在近几年的发展迅猛,alex krizhevsky等人利用深度学习的方法在数据库imagne上的成功,将深度神经网络推向高峰。hog(方向梯度直方图)是2005年国际计算机识别的会议上由法国研究者dalal等人提出的一种用于解决人体目标检测的图像描述子,该方法使用梯度方向直方图特征来描述人体,产生一种新的局部特征用于检测分类。
2. 研究的基本内容
行人属性检测是智能监控技术的重要组成部分。本课题旨在应用深度卷积网络的方法对图像中的行人进行定位(头部、上身、下身、脚、帽子、包),自动识别出行人图像中行人的属性特征。标注的行人属性包括性别、头发和上下身衣着、鞋子及包的种类和颜色,并提供图像中行人头部、上身、下身、脚、帽子、包位置的标注。
3. 实施方案、进度安排及预期效果
实施方案:以vggnet深度卷积网络为基础,在已经公开的c caffe toolbox上实现的。通过大量的训练数据对模型进行训练,采用梯度下降法得到系统参数。
进度安排:首先阅读机器学习领域相关文献,特别是近年来的深度网络学习方面的经典文献,然后以vggnet为基础,熟悉深度卷积网络模型的基本原理及其实现,在以上基础上开发基于深度卷积网络的人体属性检测与分割原型系统
4. 参考文献
[1] viola p, jones m.rapid object detection using a boosted cascade of simple features[c]//proceeding of cvpr2001 ,kauai,hi,usa,2001:511-518.
[2] pan r,gao w, liu j,et al.automatic recognition of woven fabric pattern based on image processing and bp neural network[j].the journal of the textile institute,2011,102(1):19-30.
[3] salem y b,nasri s.automatic recognition of woven fabrics bassed on texture and using svm[j].signal,image and video processing,2010,4(4):429-434.