车牌字母识别方法的研究文献综述
2020-03-30 12:17:46
文献综述 一、前言 车牌字符识别技术是智能交通系统中的关键技术之一,已广泛应用于各级公路和城市道路交通管理,具有巨大的经济价值和现实意义。它涉及了模式识别,人工智能,计算机视觉以及数字图像处理等众多学科领域。目前国内外许多学者专门研究车牌定位和车牌字符识别等关键技术,并取得一定成果,但仍存在许多值得继续研究和改进的地方。比如现在大多数的车牌识别方法对清晰度高的图像识别率很高,但在天气变化,光照不均以及车牌存在污渍、变形和倾斜的情况下,识别率往往会大幅下降,所以提高全天候下车牌识别技术的鲁棒性对我们来说很有意义。 二、研究现状 1、国外车牌识别研究概况 自1986年以来,西欧国家开始开展交通运输信息化领域的研究、开发与应用,已经取得了一定的成效。而车牌识别系统作为智能的重要组成部分,在这同时得到了长足的发展,技术上得以不断完善,出现了很多成熟高效的产品,例如Hi-Tech公司的识别产品可以达到93%的识别正确率; optasia公司的VLPRS可以达到97%的识别正确率,但是识别速度相对低一些;另外还有ASiaVISion公司的产品也VECON产品也取得了较为良好的识别效果和速度。另外日本、加拿大、德国、意大利,英国等各个西方发达国家都有适合本国车牌的识别系统。各个国家的产品虽然不同,但基本上都是基于车辆探测器的系统,设备投资巨大。 车牌定位的研究国外起步比较早,现有比较好的车牌定位方法主要有:RMu11ot等提出了一种基于纹理的车牌定位方法; Masataka研究出了一种利用车牌边角特征进行车牌定位的方法;J.Barroso等提出的基于水平线搜寻的定位方法;CharlCoetzee提出的基于Niblack二值化算法及自适应边界搜索算法的定位方法。J.BulaS-Cruz等人曾提出基于扫描行的车牌提取方法。上述方法,尽管在一定的条件下能够分割出车牌,但车牌识别系统大多是利用摄像机室外拍摄汽车图案,存在许多客观的干扰,如天气,背景,车牌磨损,图像倾斜等因素。因此定位并不十分理想,而且对于其它国家的车牌并不能很好地识别,甚至产生拒识或误识现象。 2、国内车牌识别研究概况 我国在90年代初,开始在高等级公路上把计算机技术、通信技术和电子技术应用于监视和管理系统。虽然智能运输系统的研发和推进在我国还处于起步阶段,但作为新世纪的经济增长点和交通系统建设必然选择的重要性己得到国家相关部门的高度重视我国也在九五期间,由交通部组织了网络环境下不停车收费系统行业联合攻关项目研究。由交通公路科学研究所,北京市交通厅,江苏省交通厅等展开示范工程建设。与此同时,全国各个高等院校,研究机构也纷纷开展了电子不停车收费技术的研究。但是由于我国国情的不同,国民信用体制的不完善和我国高速公路收费体制的原因,使得电子不停车收费技术在我国的推广应用遇到了很大的困难。各地(如广东,重庆,上海等地)已经上马的电子不停车收费系统纷纷停止使用或改做它用。国内做得较好的产品主要是中科院自动化研究所汉王公司的汉王眼,除此之外国内的亚洲视觉科技有限公司,深圳市吉通电子有限公司,中国信息产业部下属的中智交通电子系统有限公司等也有自己的产品。国内也有一些关于车牌自动识别的文章,但是大都因条件各异而适用范围有限。从投入实用的效果来看,国内目前还没有真正满足实际需求且价格符合国情的产品。上海交通大学苏厚胜等在2006年发表文章提出一种基于小波变换定位候选区域和颜色空间变换确定最终车牌区域的定位方法,这种方法较为快速,但是只适用于背景简单的环境。中国科学技术大学鹿晓亮等在2006年发表文章提出一种基于彩色边缘检测的车牌定位方法,这种算法在Y、U、V空间内对车牌进行边缘检测,充分利用了颜色信息,但是对光照比较敏感。清华大学叶茂亮等提出基于笔画分析和形态学的汽车牌照定位算法,算法准确率较高,但是对对比度较低和车牌号码各位字符之间间隔较大时,定位效果不理想。吉林大学张禹等提出基于梯度变换以及包围盒的定位方法,这种方法对伪车牌的去除效果不好。上海交通大学施鹏飞等提出一种利差分和投影定位车牌方法,这种算法对干扰区域的去除效果不好。除此之外还有基于形状,纹理特征的定位方法,基于小波变换和行扫描的定位算法,还有基于神经网络的定位方法。这些算法都是基于车牌的某种特征来研究车牌的定位,因而具有一定的针对性和局限性。虽然上述各种车牌定位方法都具有一定的实用性和参考价值,但大都不完善,背景要求比较简单,不能满足当今背景复杂车牌多干扰多的实际场合应用要求。当然,结合上面这些基本方法与各种优化算法又派生出许多其他定位算法,每种方法也存在各自不同的局限性,例如:基于彩色的分割对于无法得到彩色图像的情况显然完全失效;基于搜索车牌边框的方法在光照不均,有强光干扰时失效,车牌边框不明显的图像效果差;基于灰度梯度的方法在复杂背景下,对干扰比较敏感;基于经典变换域的方法也有上述类似问题存在。 三、车牌识别技术概述 车牌照识别系统主要分为车牌图像捕获,图像预处理,车牌定位,字符分割,字符识别几个部分,系统的实现过程如图1.1所示: 图1 车牌识别系统框图 首先要进行车牌图像预处理,车牌识别系统所处理的图像,全部来源于实际的交通环境中,不可避免的存在着各种噪声的影响。为了改善图像质量,提高识别率,在车牌识别前,需要进行图像预处理。预处理结束后,将会对车牌进行定位,车牌定位主要是从车辆图像中找到车牌的位置,它的准确性将直接影响到字符分割。字符分割就是把定位得到的车牌区域上的字符切分出来,对分割后的字符子图像,利用模式识别与人工智能的算法,进行字符识别。 四、车牌字符分割与二值化 车牌字符分割的目的是将定位出来的车牌中的多个字符进行分割,形成以一个字符为单位的单个字符。然后将分割好的字符提供给字符识别使用。字符分割往往不会进行单独研究,但事实上字符分隔的精准度会直接影响到字符识别的结果。对于一些因为客观条件发生粘连的字符能否将其准确的进行分割对于最后的字符识别是十分关键的一步。 1、字符分割方法 (1)直接分割:直接分割法就是根据车牌图像的大小固定与车牌字符之间间隔的特征进行分割。我国车牌由 7 个字符组成,其中第二与第三个字符之间的间隔较大。假设车牌的长度为x,那么将2/7 x处作为第二个字符与第三个字符的分界线,然后从此处开始分割后面的五个字符,最后再对前两个字符进行分割。该方法思路简单清晰,但是对车牌图像的要求较高。 (2)利用连通域分割:我国车牌第一个字符为汉字,第二到第七个字符为数字或字母。而后六个字符各自都构成了一个独立的连通域。因此,只要找到每个连通域的起始位置,就可以得到一个包含该字符在内的矩形区域,这时就可以将该字符分割出来。但是,第一个字符为汉字,而汉字具有非连通性,因此,在分割第一个字符的时候可以通过利用后六个字符的长度等先验知识得到结果。在一些客观条件下,该方法在分割汉字字符时是较容易出错的。 (3)利用投影法分割:该方法是利用图像投影直方图的波峰和波谷对车牌字符进行分割。直方图中的波谷即为相邻字符之间的间隔处。在实际应用中,由于车牌污损,光照等因素,会出现字符模糊的现象。并且定位出来的车牌区域也并非是十分精确的车牌区域,因此会对投影造成一定的干扰,从而影响分割结果。车牌定位时造成的车牌区域不精确,车牌字符自身的磨损,车牌图像获取时的光照等客观因素都会造成字符分割的偏差。 2、字符图像的二值化 为了进一步把车牌的单个字符从车牌区域中精确地提取出来,需对检测出的车牌区域进行二值化,这对车牌字符的分割起着关键的作用。二值化的目的是将牌照图像中的字符用黑色或白色表示,其余部分用白色或黑色表示。图像二值化的关键是阈值的选取,只要阈值选取恰当,不仅可以有效地去除噪声,而且可将图像明显地分成目标和背景,大大减少信息量,提高处理速度。求解二值化阈值的方法很多,如直方图变换法、最大类间方差法、共生矩阵法等。由于车牌区域的直方图分布不具有明显的波峰和波谷,本文将采用迭代法求阈值进行二值化。实验证明,该方法具有很强的稳定性和自适应性。其基本思想是:首先计算图像灰度直方图,选取图像灰度范围的中值作为初始阈值T0(设共有L级灰度),然后按下式进行迭代: (1) 其中,是灰度为l值的像素个数。迭代进行到结束,最终得到的为最终分割的阈值T。一般K取为0.5,但由于车牌图像在拍摄时不稳定,为了使分割的效果更好,需要动态调整K值。K值的调整是基于如下的先验知识,即车牌图像中背景像素点总数与字符像素点总数之比应该基本固定(约为2.0): (2) 式中,S为背景像素点总数与字符像素点总数之比。由于车牌中字符复杂程度的不同,S略有变化,一般在1.8~2.5之间。当S大于2.5时,我们应适当减小K值;当S小于1.8时,就适当增大K值。这样,用不同的车牌图像的S值来调节K,就可以获得一个准确的分割阈值。
(a)原图 (b)二值化后的图像 图2 二值化效果图 五、车牌字母识别 1、 字符图像的归一化 由于拍摄距离的不同,导致车牌尺寸大小不同,在字符识别之前通常需要进行尺寸归一化处理,相对来说,统一尺寸的字符识别的标准性更强,准确率也更高。所谓的尺寸归一化就是将不同尺寸大小的字符图像经过变换规范化成统一大小的图像,来避免字体大小或者分辨率的差异对字符识别的影响。常用的字符归一化有两种:一种是将文字的外边框按比例线性放大或缩小成为规定尺寸的文字图像;另一种是根据水平和垂直两个方向文字黑象素的分布进行大小归一化,即双线性插值法。假设归一化图像的某像素点在原图的对应点p的坐标为(x u,y v),其中x、y均为非负整数,u、v为[0,1)区间的浮点数,则这个像素值g(x u,y v)可由原图像中坐标为(x,y)、(x l,y)、(x,y l)、(x l,y l)所对应的周围四个像素的值决定,即: (3) 其中,表示原图像处的像素值。 经过上述变化后,得到的归一化图像可能不是二值图像,再次进行二值化处理即可。 2、字符识别方法 车牌字符识别属于字符识别的范畴,字符识别是模式识别的重要应用领域,涉及到模式识别,图像处理,人工智能,模糊数学,机器视觉等多种学科,是一门综合性很强的技术。常见的字符识别算法主要有如下几种: (1)传统模式识别方法 传统模式识别技术一般包括模板匹配法,统计特征法等。模板匹配法是先对每个字符建立一个标准模板,将待识别图像变成大小一样的图像,将每个模板与待识别图像进行逐点比较,并根据其相似程度而得出识别结果。基于模板匹配的字符识别方法为早期的识别方法,这个时期的应用在识别正确率方面有所突破,但还没有考虑到识别实时性的要求,识别的速度有待进一步提高。 (2)人工神经网络技术 人工神经网络是仿生学的产物,它通过网络结点间的连接来存储信息并完成分类计算。人工神经网络技术抛开了传统的计算结构和相应的算法,采用了生物神经网络的模型,因此它能较好地实现人类存储知识及处理信息的机能,从而较好地解决了车牌识别中所存在的因字符残缺不全而无法识别的问题。基于BP方法的分类器已趋于成熟并在OCR领域中取得了较好的应用效果,相比之下其他新的结构和方法取得的进展不很明显。神经网络其局限性在于,需要大量实验样本,并且容易陷入局部最优。 (3)遗传算法 遗传算法是基于自然选择和基因遗传学原理的搜索算法,它将适者生存这一基本进化理论引入串结构,并且在串之间进行有组织但又随机的信息交换,它是优化理论中的一种算法,模拟生物进化的过程来逐步达到最好的结果,是一种全局随机算法。标准的遗传算法通常包括三个基本操作:复制,交叉和变异。遗传算法的中心问题是鲁棒性,因为人工系统很难达到如生物系统那样的鲁棒性。车牌字符识别本质上是一个参量空间里寻找最优定位参量的问题,而寻找参量空间的全局最优解用遗传算法可以很好的实现。但是遗传算法迭代时间很长,不满足时间上要求。 (4)支持向量机方法 支持向量机方法是建立在统计学习理论和结构风险最小化原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以期获得最好的推广能力。支持向量机的主要优点有:它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值,算法最终将转化为一个二次寻优问题,从理论上说,得到的将是全局最优点,解决了神经网络方法始终无法避免的局部极值问题。算法用结构风险最小化代替经验风险最小化,较好地解决了小样本的学习问题。算法将实际问题通过非线性变换映射到高维特征空间,在高维特征空间中构造线性判别函数来实现原空间中的非线性判别函数。同时引入核函数方法,巧妙避开了高维空间中的复杂运算维数问题,使算法实现成为可能。 |
参考文献: [1] 黄凡.车牌字符识别技术的研究与实现[D].重庆:重庆大学,2008. [2] Gao Qian,Wang Xinnan,Xie Gongfu..License Plate Recognition Based On Prior Knowledge[A].In:IEEE.International Conference on Automation and Logistics[C].Jinan:IEEE,2007,2964-2968. [3] Seiki Yoshimori,Yasue Mitsukura.License Plate Detection System in Rainy Days [A].In:IEEE. Computational Intelligence in Robotics and Automation [C].Kobe:IEEE,2003,972-976. [4] Chang Shyang-Lih,Chen Li-Shien,Chung Yun-Chung,Chen Sei-Wan.Automatic License Plate Recognition [J].INTELLIGENT TRANSPORT ATION SYSTEMS.2004,5(1):42-53. [5] 欧阳文卫,罗三定.车牌定位算法研究[J].湖南工业职业技术学院学报,2006,6(4):33-35. [6] 应宏微,宋加涛,杨忠秀等.车牌定位算法研究[J].视频技术应用与工程,2007,31(1):79-82. [7] 卢雪松.车牌照定位和分割算法的研究[D].呼和浩特:内蒙古工业大学,2005. [8] Zheng Danian,Zhao Yannan,Wang Jiaxin,Automatic License Plate Recognition [J].Pattern Recognition Letters.2005(26):2431#8211;2438. [9] 王辅之,陈亚军.基于区域统计特征的车牌定位与分割算法研究[J].淮北煤炭师范学院学报,2006,27(4):49-53. [10] 邹晔.基于灰度阈值和梯度差的车牌定位技术[J].科技广场,2007(23):139-140. [11] 孟涛,姚烈健,卢荣.一种车牌定位的新方法[J].舰船防化,2007(6):27-30. [12] 于万波,沈连山,赵晶.基于颜色特征的汽车车牌定位[J].辽宁工程技术大学学报(自然科学版),2001,20(5):713-714. [13] 齐永奇,王文凡,赵岩,赵耀.基于纹理特征和垂直投影的车牌定位算法[J].现代电子技术,2007(17):184-186. [14] 王森,陈炬桦.基于神经网络和综合特征的车牌定位算法[J].计算机技术与发展,2008,18(2):38-41. [15] 衰崇明,陈环宇.一种识别汽车牌照的字符分割技术[J].计算机时代.2004(8):5-10 [16]任明亮,范勇,蒋欣荣等.一种快速精确的汽车牌照字符切分算法[J].四川大学学报.2002,39(3):450-454 [17]欧阳庆.不均匀光照下车牌图像二值化研究[J].武汉大学2006,39(4):144-146 [18]姜瑾,张桂林,许慧慧.基于投影特征曲线匹配的车牌字符识别算法[J].计算机与数字工程,2007,38(6):20-22. [19]周开军,陈三宝,徐江陵.复杂背景下的车牌定位和字符分割研究[J].计算机工程,2007,33(4):198-200 [20]宋晨光.车牌定位与字符分割算法研究[D].北京:中国农业大学,2005. [21]蒋传伟.车牌识别系统中车牌定位与字符分割的研究[D].武汉:华中科技大学,2006. [22]马婉婕.车牌识别系统中字符分割的研究与实现[D].上海:复旦大学,2009. [23]黄骥.汽车牌照识别系统中车牌定位与校正及字符分割的研究[D].南京:南京航空航天大学,2007. [24]李文举,梁德群,崔连延,毕胜.一种新的面向字符分隔的车牌图像预处理方法[J].计算机应用研究,2004(7):258-260. [25]谷秋頔,白艳萍.基于模板匹配的车牌数字与字母识别[J].数学的实践与认识,2011,41(20):66-71. |