基于SSD的目标检测方法设计与实现文献综述
2020-04-15 15:45:15
深度学习的概念源于人工神经网络的研究。含多隐层的多层传感器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。其在图象识别领域具有重大应用价值。
香港中文大学的多媒体实验室是最早应用深度学习进行计算机视觉研究的华人团队。在世界级人工智能竞赛LFW(大规模人脸识别竞赛)上,该实验室曾力压FaceBook夺得冠军,使得人工智能在该领域的识别能力首次超越真人。
目标检测是计算机视觉学科的重要研究方向之一,在很多场合中都很重要,比如无人驾驶,就非常需要目标检测给它提供非常高的检测和定位精度。当前,目标检测中基于深度学习的算法大概可以分为两种:分步目标检测算法(比如Fast R-CNN、Faster R-CNN等);单步目标检测算法(比如YOLO、SSD等)。前者先要产生一批用作输入数据的候选框,然后经过神经网络回归分类得到结果;后者不生成候选框,直接将预测边框的任务变成回归问题解决。虽然Faster R-CNN检测性能较好,但是由于采用了RPN和Fast R-CNN两种网络,所以导致结构较为复杂,检测的速度不够快速。
SSD:Single Shot MultiBox Detector算法是一种端到端的单次多框实时检测的深度神经网络模型,融合了YOLO的回归思想和Faster R-CNN的候选框机制。SSD算法利用回归的思想极大地减少了神经网络的计算量,提升了算法运行的速度。它不需要生成候选框,而是直接提取输入图片的特征信息,然后直接在特征图上回归这个位置的边界框以及对物体类别进行分类;运用局部特征提取的方法得到不同位置,不同宽高比、尺寸的特征,这一点相比于 YOLO 针对某一位置进行全局特征提取的方式更加有效率。此外,为了增加模型检测不同大小物体的鲁棒性,SSD算法选取网络中多个层次的特征图进行预测。
{title}
2. 研究的基本内容与方案
{title}研究内容
SSD(single shot multibox detector)算法
研究目标
(1)利用SSD目标检测方法在图像中提取检测的目标
(2)在被检测目标的部分被遮挡的情况下能够识别。