基于Faster R-CNN深度学习的航拍车辆/船舶的识别和跟踪文献综述
2020-04-14 19:55:59
我所选的题目是基于Faster R-CNN深度学习的航拍车辆/船舶的识别和跟踪,而我具体做的是基于MSER图像特征的航拍车辆跟踪。图像跟踪,简单的来说,就是通过各种图像识别的技术来提取一段素材(例如视频,图片)中的一个物体来进行持续性的跟踪。图像处理在跟踪方面的应用,已经发展了很多年,在国内外都有相对成形的技术和体系了。现在常用的图像跟踪技术中,常用的特征提取算法有基于MSER,SURF,BRISK或KAZE等图像特征。其中就我所做的MSER做一个基础的说明:MSER的中文意思是指最大稳定极值区域(MSER-Maximally Stable Extremal Regions)它通常可以用于图像的斑点区域检测。该算法最早是由Matas等人于2002年提出,它是基于分水岭的概念。多用于一副对比明显的图像,而不是比较平滑的图像,比如一双色彩斑斓的鞋子,和一个通红的成熟苹果,MSER特征提取在前者中表现的比较优秀。
图像跟踪系统被广泛应用在教育、会议、医疗、庭审以及安防监控等各个行业。其中,应用于教育以及会议方面的全自动跟踪拍摄方案,更是引领了国内外全自动跟踪拍摄的技术潮流,为精品课程、视频会议的全自动摄制打下了坚实的技术基础。在导师中我们了解到了他们所做的图像跟踪的项目,更是能将一个城市纳入到监控的范围,定向跟踪某一车辆。
在次过程中,我的目的是通过matlab提取选定车辆的模型并在一段视频中对其进行持续的跟踪。我需要完成的任务是:了解基于图像处理和计算机视觉技术的发展,现状,基础理论;熟悉MSER等图像特征的原理,以及相关目标跟踪方法的原理,算法和实现;掌握主流图像处理和计算机视觉的开发工程和编程语言。通过设计,实现,评估的完整实践流程,学习并实现通过航拍图像对车辆进行跟踪的方法。通过这次设计,能够让我较为深入的了解图像跟踪这门技术。并且通过自己设计MSER图像特征的航拍车辆跟踪,掌握MSER图像特征的原理,特点,结构和实现方法,以及其在matlab中的实现,能够完成数据集的标注和处理。
2. 研究的基本内容与方案
{title}本次毕业设计基本内容首先是了解图像处理和计算机视觉技术的发展,现状,基础理论,以及我所需要设计的MSER图像特征的原理,以及相关跟踪方法的算法,原理以及实现,这就需要我查阅大量的相关论文以及阅读补充资料,在此期间,我还需要对一篇推荐的英文论文进行独立的翻译。在了解到这些设计的基础后,便要自己开始设计了,可以通过matlab或者openCV完成我们的设计,因为我对于matlab比较的熟悉,所以我选择使用matlab进行设计。在设计时,首先我需要完成航拍图像数据集的标注与预处理,把我们所需要跟踪的车辆的特征集提取出来,以能在视频中每一不同帧中找到我们所跟踪的车辆。随后,我们运用MSER等技术实现对车辆的跟踪。MSER的基本原理是对一幅灰度图像(灰度值为0~255)取阈值进行二值化处理,阈值从0到255依次递增。在得到的所有二值图像中,图像中的某些连通区域变化很小,甚至没有变化,则该区域就被称为最大稳定极值区域。这类似于当水面持续上升的时候,有些被水淹没的地方的面积没有变化。最后,我们需要对于我们的跟踪方法进行测试并评估其性能。3. 参考文献1 《数字图像处理(第三版)》 冈萨雷斯等, 2007
2《数字图像处理的MATLAB实现(第二版) 冈萨雷斯等,2013
3《Learn Open CV3》。 bradski et al., 2017
4 《计算机视觉:算法与应用》。 塞利斯基,2012
5 “ Robust Wide Baseline Stereo from Maximally Stable Extremal Regions," Matas et al., 2002
6 "Object Tracking A Survey," Yimaz et al, 2006.
7 "Automated traffic surveillance system with aerial camera arrays imagery: Macroscopic data collection with vehicle tracking," Zhao et al, 2016.
8 "Traditional and recent approaches in background modeling for foreground detection: An overview," Thierryet al.2014.
9 ”基于数字图像处理的车牌识别技术“ 楼恰航,2019