基于深度学习的交通标志图像自动分类的研究与实现文献综述
2020-04-15 17:28:55
1. 目的及意义
1.1 研究目的及意义
随着机器学习和计算机视觉技术的不断发展,越来越多的人工智能设备不断涌入我们的生活中,在交通领域也有像无人车等先进的智能设备开始进入我们的视野。交通标志自动分类在无人驾驶或者与交通相关项目中都有应用。通过对四周环境的扫描所获取的视觉信息来定位交通标志,并通过机器学习和图片识别分类的技术来实现交通标志的自动识别和分类,从而使智能设备能够进行下一步的操作。
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。研究如何使人工系统从图像或多维数据中“感知”的科学。深度学习[1]目前是一个非常热门的研究方向,利用卷积神经网络的卷积层、池化层和全连接层等基本结构,就可以让这个网络结构自己学习和提取相关特征,并加以利用。这种特性对许多研究提供了许多便利,可以省略过往非常繁杂的建模过程。
本课题是在计算机视觉和深度学习的技术基础下,实现交通标志图片的自动识别分类。属于计算机视觉技术领域中的模式识别(抽取图像中的统计特性或结构信息)和图像理解(对图像的内容做出决定)模块。在本课题中,首先要对原始的含有交通标志的图片做处理作为训练数据集。然后,使用深度学习的理论和方法,选取合适的神经网络模型和参数,对交通标志图片数据集做训练,建立模型。最后,期望可以实现对输入的任意图片,能够自动识别分类出图片中的交通标志,并对识别效果做一个评估,反馈到之前选取的模型和参数做出相应的调整。
1.2 研究现状
随着深度学习和卷积神经网络技术的发展,越来越多的神经网络算法在图像特征识别和分类中得到应用。
深度学习(Deep learning)[1]的概念是由Hinton等在2006年提出,是一门比较年轻的研究方向。随着卷积神经网络[5](Convolutional Neural Network,CNN)一个多层结构的网络学习算法的提出,深度学习通过分层式结构的多层信息处理来进行非监督的特征学习和图像分类,模拟人脑学习和分析的能力,形成一个神经网络结构,该网络优势被广泛应用于计算机视觉、文本、声音等研究领域[4]。2012年AlexNet[2]的问世极大的提升了当时图片分类的准确性,使人们重新对用于图像识别的卷积神经网络(CNN)的兴趣复苏,随后VGGNet[3],GoogleNet[6]等卷积神经网络算法被提出,通过加深卷积层和减小卷积核的大小来改良图像分类的精度;目前,物体检测的现状是采用R-CNN[11]:将所有的检测问题分解为两个子问题:一是使用低水平的特征(如:颜色、质地)以一种不可知的方式生成对物体定位的建议,二是使用CNN在这些定位的地方对物体进行识别。
虽然卷积神经网络在众多应用领域取得了优异的成绩,但是关于其完备性的相关研究与证明仍然是目前较为匮乏的部分。卷积神经网络的完备性研究有助于进一步理解卷积神经网络与人类视觉系统之间的原理差异,并且帮助发现和解决当前网络结构存在的认知缺陷[4]。其未来将在无监督学习方面具有更广阔的研究前景[9]。
交通标志的自动识别和分类的问题是模式识别的一个研究热点。早期比较主流的是利用阈值分割算法对交通标志进行检测,然后利用模板匹配方法进行识别;目前最流行的是使用深度学习进行检测,最常见的方法是CNN,BP神经网络和SVM(支持向量机)等,这提升了识别的准确率和效率。但仍然会受到环境、天气、拍摄角度以及遮挡物等的影响,另外实时性(算法的效率)有待进一步提升[17]。本课题期望能够爬取交通标志的数据集并做处理,选取合适的CNN网络进行训练,期望建立一个具有普适性的交通标志自动分类的系统。