基于区域卷积神经网络的图像物体检测文献综述
2020-05-01 08:40:34
1.1背景资料
图像是人对视觉感知的物质再现。图像可以由光学设备获取,如照相机、镜子、望远镜及显微镜等;也可以人为创作,如手工绘画。图像可以记录、保存在纸质媒介、胶片等等对光信号敏感的介质上。随着数字采集技术和信号处理理论的发展,越来越多的图像以数字形式存储,这也是可以使用计算机来处理图像的基础。
随着科技的发展,每天在网上传送的图片流量与日俱增,越来越多的信息采用图片形式存储,因此对于图片信息的处理就变得十分重要。看懂图片对于人来说是再简单不过的任务,人通过大脑中已有的知识经验可以轻松读懂图片中有哪些物体以及物体是什么,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中的语义概念,也不清楚目标出现在图像中哪个区域。
图像物体检测是利用图像处理与模式识别等领域的理论和方法,从图像中定位感兴趣的目标,并给出每个目标的边界框。
1.2国内外研究现状分析(文献查阅报告)
通过查阅文献资料,我基本了解了国内外对于设计与实现基于基于区域卷积神经网络的图像物体识别研究现状。目前有很多成熟的算法和框架可以使用,当今最广泛应用的是Faster R-CNN算法,算法由Ross B. Girshick在2016年提出,Faster R-CNN是在Fast R-CNN的基础上提出来的,它将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。
1.3目的及意义
目的(为了解决什么科学技术问题):随着人们对计算机对图像理解的要求越来越高,一款能够自动检测图像中物体位置的系统越来越为人们所需要。
意义(社会经济价值):图像对象检测在人脸识别、医学影像、智能视频监控、机器人导航、基于内容的图像检索、基于图像的绘制技术、图像编辑和增强现实等领域都有广泛的应用。
{title}2. 研究的基本内容与方案
{title}2.1 目标(开发的系统概况描述)