登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 电子信息工程 > 正文

基于深度残差网络的图像识别研究文献综述

 2020-04-14 16:31:22  

1.目的及意义

生活中,我们每天都会看到海量的图像,从中我们能够更加直观的了解、学习事物。面对这些海量的图像信息,我们如何去快速有效的找到所需要的关键信息,如何对海量图像进行分门别类,图像识别给了我们很好的答案。

简单的说,图像识别即计算机怎么理解图像并与外界交互,以识别各种不同模式的目标和对像的技术。传统的图像识别方式是人为设定矩阵算子提取图像的特征值,比如形状特征、纹理特征等,而随着图像复杂度的提升,人们已经很难设置这样的矩阵算子。所以找到一种准确可行的利用人工神经网络模拟人类的视觉系统进行图像识别将具有实际意义。

神经网络可以自动学习这样的矩阵算子,进而从图像提取出一些隐性特征进行分类识别。其中具有代表性的卷积神经网络以其特有的局部感知和权值共享特性,在卷积层中,通过卷积运算使得每一个神经元都与前一层的局部区域相连,提取该局部特征,不同的卷积核提取图像的不同特征,如颜色、纹理以及某个方向的边缘等,最终通过多个卷积核来提取图像的多种不同特征。通过局部感知和权值共享,能够大大减少卷积神经网络中需要训练的参数。卷积神经网络可以直接将二维图像作为输入,将特征提取和分类集合在一个网络中,使得网络能直接从训练数据中提取出最有利于分类的特征,从而避免了传统算法中复杂的特征提取过程,为图像识别翻开了新的篇章,也带来了新的研究热潮。

然而卷积神经网络伴随着网络的加深也带来了过拟合、梯度爆炸和退化等问题,即随着网络深度的增加,准确率增长的速率会很快达到饱和,然后会很快的下降,使得网络的加深对性能提高并没有显著效果,因此还存在许多有待改善的地方。

为解决退化问题,本文是采用深度残差网络框架来解决退化等问题,利用多层网络拟合一个残差映射,而不是寄希望于每组少数的几个层的网络层就可以直接拟合出所期望的实际映射关系。此方法更便于优化,更容易在增加深度时获得精度的提高,明显优于之前的网络结构。

残差网络(ResNet)是2015年微软亚洲研究院的何凯明团队提出的一种特殊卷积神经网络,该神经网络可以轻易达到上百层,甚至上千层,并且能在可接受的时间内完成训练,从而大大提升了图像识别的准确度。在2015年的imagenet比赛中,在图像分类,定位和检测三个项目中全部获得了冠军,同年,在图像识别比赛MS COCO 中同样夺魁。多个比赛的优异表现,证明了残差神经网络具有很大的优势。

总之,残差网络使得深层卷积神经网络的拟合能力和泛化能力得到显著的提高,并且随着层数的加深网络的性能也稳步提升,基于深度残差网络的图像识别有更高的识别准确度。

{title}

2. 研究的基本内容与方案

{title}

基本内容及目标

1) 学习深度卷积神经网络的基本知识。

2) 学习并使用深度残差框架。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图