基于卷积神经网络的图像分类方法设计文献综述

2021-12-31 23:25:29

全文总字数：4905字

图像分类，根据各自在图像信息中所反映的不同特征，把不同类别的图像区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域划归为若干个类别中的某一种，以代替人的视觉判读。图像分类技术作为当代人工智能的一个重要分支。一直以来在人脸识别，监控检测，导航，医疗检查，森林火灾检测等诸多领域有所贡献。摘□要：

随着时代的发展，依赖传统机器学习的图像分类技术越来越无法适应快速增长的数据信息。人们对新技术的渴求越发强烈。2012年，Alex Krizhevsky提出了深度卷积神经网络模型AlexNet，获得当年ILSVRC比赛分类项目的冠军。当时深度卷积神经网络模型AlexNet引入了全新的深层结构和dropout方法，一下子把错误率从25%以上降低到了15%，颠覆了图像分类领域。至此，图像分类技术迎来了新的发展。

关键词：卷积神经网络；图像分类；特征提取；深度学习

引言

随着计算机技术的不断发展，人们迎来了数据大爆炸时代。人们通过计算机可以足不出户了解天下事，可是如何对这海量的信息进行筛选，处理成为了当代互联网时代的一大难题，图像分类就是这一大难题中的一个小分支。

图像分类技术作为计算机视觉和人工智能的重要组成部分，主要内容是指通过计算机的分析和处理将图像划分成不同类别，从而大大缩短人们检索时间的，提高人们图片信息采集效率。图像分类过程包括信息的获取、预处理、特征抽取和选择、分类器设计和分类决策，其中特征提取又是图像分类技术的一大难点。

2 卷积神经网络

80年代，人工神经网络的反向传播算法（也叫Back Propagation算法或者BP算法）的发明，这种算法给当时的机器学习带去了新思路，即人工神经网络模型可以通过统计模型从大量训练样本中学习出统计规律，从而得出输入—输出数据模型的函数关系^[1-8]。随后各种浅层机器学习模型相继被提出，比如支撑向量机（SVM，Support Vector Machines）、Boosting、最大熵方法（例如LR， Logistic Regression逻辑回归）^[8-15]等，这些方法给当时的图像分类技术一个新的飞跃。但这些依然没有摆脱需要人为对图像进行预处理、特征分类这一劣势。虽然浅层学习在一定程度上优化了算法，但随着计算机视觉的发展以及配备数字照相机的移动客户端的普及，图像信息也呈现爆炸式的增长，原有的方法无法适应这么高强度的运算。

针对这一缺点，人们又提出了深度学习这一概念。所谓深度学习就是让计算机自主进行特征学习，将大量的训练样本作为输入，通过多层网络建立的模型^[16-22]，得到提取的特征作为输出，最重要的是这个过程没有人为的操作，即自动提取图像特征。其中卷积神经网络（Convolutional Neural Networks，简称CNN）作为深度学习的重要分支，接下来会进行详细的介绍。

卷积神经网络的结构

卷积神经网络模型从结构上来看，大体上可分三层：输入层，隐含层和输出层。其中最主要的隐含层又包括卷积层，池化层和全连接层^{[15-17][19-24]}，具体结构框图如图一所示。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码

基于卷积神经网络的图像分类方法设计文献综述

引言

2 卷积神经网络

卷积神经网络的结构

您可能感兴趣的文章

最新文档

推荐栏目

登录

注册

找回密码

基于卷积神经网络的图像分类方法设计文献综述

引言

2 卷积神经网络

卷积神经网络的结构

您可能感兴趣的文章

最新文档

推荐栏目