登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 软件工程 > 正文

基于Mask R-CNN的目标检测分割研究文献综述

 2020-04-29 15:17:10  

1.目的及意义

在机器学习中,卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别。卷积神经网络,是一种前馈神经网络,人工神经元可以响应周围单元,可以大型图像处理。卷积神经网络包括卷积层和池化层。卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(Convolutional Neural Networks-简称CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。 K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后,更多的科研工作者对该网络进行了改进。其中,具有代表性的研究成果是Alexander和Taylor提出的“改进认知机”,该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。

神经网络在 2012 年崭露头角,Alex Krizhevsky 凭借它们赢得了那一年的 ImageNet 挑战赛,他把分类误差记录从 26% 降到了 15%,在当时震惊了世界[1]。自那之后,大量公司开始将深度学习用作服务的核心。Facebook 将神经网络用于自动标注算法、谷歌将它用于图片搜索、亚马逊将它用于商品推荐、Pinterest 将它用于个性化主页推送、Instagram 将它用于搜索架构。

受到多伦多大学Hinton实验室研究工作的启发,加州大学伯克利分校Jitendra Malik教授领导的团队,提出了一个在如今看来好像是不可避免的问题:能否将Krizhevsky等人提出的网络模型泛化应用到对象检测上?对象检测技术是一项通过标出图像中不同对象并对其进行分类的任务。在对象检测挑战赛PASCAL VOC上,由Ross Girshick,Jeff Donahue和Trevor Darrel组成的这个团队,发现这个问题可以通过Krizhevsky的研究成果来进行解决。他们由此提出了Regions WithCNNs (R-CNN)架构[2]。

2017年:Mask R-CNN 扩展Faster R-CNN用于像素级分割。我们可以进一步扩展这些技术,定位到每个对象的精确像素,而不是仅限于边框吗?何恺明和Girshick等研究人员,在Facebook人工智能研究部门里使用了一种被称为Mask R-CNN的网络结构来探索这个问题。Mask R-CNN通过向Faster R-CNN网络添加一个分支来输出一个二进制掩码,来说明给定像素是否为对象的一部分[3]。

卷积神经网络模型从提出之日起,就一直被各国学者不断探索研究。

从CNN到DCNN,再从DCNN到DN,再到AND,以及之后的RCNN,fast R-CNN,Faster R-CNN。CNN一直在发展。在国内,孙艳丰的基于改进Fisher 准则的深度CNN识别算法,(fisher-basedconvolution neural network,FCNN)[4],王冠皓的多级金字塔卷积神经网络填补了国内对于CNN研究的空白[5]。国外一直都是卷积神经网络研究的前沿阵地,Ross Girshick等提出了RCNN以及之后的Fast RCNN,Mask RCNN等一系列卷积神经网络改进模型。而最近的ILSVRC-2017冠军,360人工智能团队提出的“DPN双通道网络 基本聚合”深度学习模型也对业界产生较为深远的影响。

本次研究的目的在于深入了解卷积神经网络,了解卷积神经网络现在的发展状况。为未来从事相关方面工作打下知识基础。近十几年来,深度学习一直都是热点领域,而在DL中,CNN又是其中发展的最好的分支。CNN也将是自己未来的研究方向。通过本次研究,在了解目标检测的原理上,结合目标检测和语义分割技术,运用主流模型,完成一系列评估和优化工作。

充分利用大学四年来所学的知识,在大学本科阶段的最后,进行一次真正意义上的科学研究,为自己的学习生涯交出一份满意的答卷。利用自己所学的知识,实现真正的知识到成果的转化。

参考文献:

[1] KrizhevskyA, Sutskever I, Hinton G E. ImageNet classification with deep convolutionalneural networks[C]// International Conference on Neural Information ProcessingSystems. Curran Associates Inc. 2012:1097-1105.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图