基于深度学习的图像分类方法分析与研究文献综述

2020-05-01 08:40:37

1．目的及意义

1.1 研究目的及意义

图像分类是根据图像的语义信息将不同类别图像区分开来，是计算机视觉中重要的基本问题，也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。图像分类在很多领域有广泛应用，包括安防领域的人脸识别和智能视频分析等，交通领域的交通场景识别，互联网领域基于内容的图像检索和相册自动归类，医学领域的图像识别等。

一般来说，图像分类通过手工特征或特征学习方法对整个图像进行全部描述，然后使用分类器判别物体类别，因此如何提取图像的特征至关重要。在深度学习算法之前使用较多的是基于词袋(Bag of Words)模型的物体分类方法。词袋方法从自然语言处理中引入，即一句话可以用一个装了词的袋子表示其特征，袋子中的词为句子中的单词、短语或字。对于图像而言，词袋方法需要构建字典。最简单的词袋模型框架可以设计为底层特征抽取、特征编码、分类器设计三个过程。

而基于深度学习的图像分类方法，可以通过有监督或无监督的方式学习层次化的特征描述，从而取代了手工设计或选择图像特征的工作。深度学习模型中的卷积神经网络(Convolution Neural Network, CNN)近年来在图像领域取得了惊人的成绩，CNN直接利用图像像素信息作为输入，最大程度上保留了输入图像的所有信息，通过卷积操作进行特征的提取和高层抽象，模型输出直接是图像识别的结果。这种基于"输入-输出"直接端到端的学习方法取得了非常好的效果，得到了广泛的应用。

1.2 研究现状

图像分类有多种实现算法，如KNN、SVM、BP神经网络、CNN以及迁移学习等，这些方法各有其优缺点，如传统的KNN、SVM、BP神经网络算法功能强大而且易部署，也能取得不错的结果。

由于传统的多层感知机模型在图像识别方面效果甚佳，但由于其节点间的全连接模式对于其延展性造成了阻碍，因此对于高分辨率的图像，识别率不是很理想。所以进一步，我们可以用TensorFlow框架构建CNN来进行图像分类，可以提升识别准确率，但是存在过拟合等问题。可以采用一些优化策略进一步提升识别准确率，如变化的学习率、加深网络层数等方法。

{title}

2. 研究的基本内容与方案

{title}

2.1 目标（开发的系统概况描述）

本课题旨在研究采用深度学习的方法，针对已有固定的分类标签集合，然后对于输入的图像，从分类标签集合中找出一个分类标签，最后把分类标签分配给该输入图像。

2.2 基本内容

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码