基于深度学习的行人检测算法研究开题报告
2020-02-10 22:42:07
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
随着科技的进步与发展,我们的生活方式也在慢慢的改变,很多以前需要耗费大量人力才能完成的任务,现在可以直接交给计算机去完成。计算机视觉就是这些技术中非常重要的一个研究热点与方向,计算机视觉涉及了图像处理、机器学习、模式识别等多个学科[1],它的最终目的是模拟人的视觉能力,可以完成各种识别任务,在计算机视觉这个大的研究领域下,又有一个备受学术界和工业界关注的子方向——行人检测。
行人检测就是计算机对于给定的图像和视频,判断出其中是否有行人,如果有还需要给出行人的具体位置。行人检测是行人跟踪,行为分析,步态分析,行人身份识别等研究的基础和前提,一个好的行人检测算法能够为后者提供有力的支持和保障。现实生活中,行人检测有广泛的应用场景。
2. 研究的基本内容与方案
2.1设计的基本内容
1)双目立体视觉系统研究
双目立体视觉首先采用水平放置的两个摄像机来获取同一目标的左、右视图,然后通过计算左视图中的一点在右视图中的对应点的坐标差值,进而计算出该目标的3d信息。双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种很有效的测量方法。
3. 研究计划与安排
第1—2周:查阅相关的文献资料,对研究内容进行整体了解;
第3—4周:了解整体实现方案,完成开题报告;
第5—12周:更具方案进行设计和实现;
4. 参考文献(12篇以上)
[1]塞利斯基 著,艾海舟,兴军亮等译.计算机视觉:算法与应用[m].北京:清华大学出 版社,2012.
[2]sermanet p eigen d, zhang x. et al.overfeat: integrated recognition, localization and detection using convolutionalnetworks[j]. arxiv preprint arxiv: 1312.6229, 2013: 1-16.
[3]girshick r. donahue j. darell t.et al.rich feature hierarchies for accurate object