信函分拣关键技术-手写邮政编码识别方法研究毕业论文
2020-02-19 18:31:33
摘 要
最初的邮政信函分拣系统是以人力为基础的分拣系统,这种系统效率较为低下并且工作人员容易疲劳而出现差错。随着科技的发展,邮政系统中开始运用自动化技术,计算机的相关技术也因此成为了信函识别与分类的重要手段,而对于手写邮编的自动识别,各种方法和技术也层出不穷。
人工神经网络兴起于二十世纪八十年代,它是模仿人类大脑的神经元网络建立起的一种信息处理模型,人工神经网络技术发展迅速,在手写数字识别的问题中能取得很好的结果。
本文介绍了邮政信函分拣系统,对邮政信函分拣机进行了初步的设计和分析,针对信函分拣的关键技术——手写邮政编码的识别问题,本文拟采人工神经网络技术,构建神经网络模型,并实现自己手写数字的识别。
关键词:信函分拣系统 手写数字 人工神经网络
Abstract
The original postal letter sorting system was a human-based sorting system that was less efficient and staff members were prone to fatigue and errors.With the development of science and technology, the use of automation technology in the postal system, computer related technology has become an important means of letter recognition and classification, and for the automatic recognition of handwritten zip code, various methods and techniques are also emerging.
Artificial neural network emerged in the 1980s. It is an information processing model established by a neural network that mimics the human brain. Artificial neural network technology develops rapidly and can achieve good results in the problem of handwritten digit recognition.
This paper introduces the postal letter sorting system, and carries on the preliminary design and analysis of the postal letter sorter. For the key technology of letter sorting, the identification of handwritten postal code, this paper intends to use artificial neural network technology to construct a neural network. Model and realize the recognition of your own handwritten numbers.
Keywords: sorting system handwritten digits artificial neural network
目录
第一章 绪论 1
1.1. 信函分拣系统的现状 1
1.2. 信函自动分拣系统研究的意义 1
第二章 分拣系统 2
2.1. 信函分拣系统任务分析 2
2.2. 信函分拣系统设计 2
2.3. 系统配置及功能分析 4
第三章 手写邮政编码识别概述 5
3.1. 手写邮编识别发展现状 5
3.2. 手写数字识别研究意义 5
3.3. 手写数字识别难点 6
3.4. 人工神经网络概述及其基本原理 6
3.5. 手写数字识别的一般方法 7
第四章 手写数字预处理 8
4.1. 灰度化处理 8
4.2. 二值化处理 9
4.3. 去噪声 10
4.4. 数字分割 11
4.5. 归一化处理 11
4.6. 图像细化 13
第五章 手写数字的特征提取 14
5.1. 特征提取方法概述 14
5.2. 结构特征提取 15
5.3. 统计特征提取 16
第六章 人工神经网络识别 16
6.1. 人工神经网络构建 16
6.2. 系统实现 17
6.3. 系统识别结果分析 18
第七章 结论 18
参考文献 19
致谢 20
绪论
信函分拣系统的现状
如今这个时代,科技发展迅速,自动化技术在我们生活的很多方面都得到了应用,大大提高了我们的生活水平。各国相继推行邮政管理体制改革,引入自动化技术,使得处理邮政信函的信函自动分拣系统也得到了应用与发展,分拣技术逐渐趋于成熟和完善。信函分拣系统中的重点和难点就是手写邮政编码的识别,对于这个问题,各种方法层出不穷,特别是人工神经网络的提出与发展,很大程度上提高了手写数字的识别率,对解决分拣系统的作业效率问题有很大帮助。
信函自动分拣系统一般可以分为光学字符自动识别(OCR)和光学条码自动识别(OBR)[1],欧美等国家的邮政编码常常可以精确到街道和门牌号,家家户户几乎都能使用打字机来打印邮编地址,所以用手书写地址的信函很少,信函的标准化程度比较高,采用的是OBR,不需要识别手写邮政编码。但是我国地域辽阔,手写汉字地址非常复杂,要实现手写地址的直接识别是比较困难的,所以我国采用的是六位邮政编码制度[2]。而且我国家庭打字机并没有普及,无法实现用打字机来打印邮编的条码,还是要靠人手写邮政编码,所以我国信函自动分拣系统主要为OVCS系统,OVCS系统采用的是OCR光学字符自动识别和人工视屏补码相结合的技术[3],OCR主要用于识别手写体的邮政编码,而对于OCR无法正确识别的信件,再以人工的方式对其进行补码,以提高分拣系统的作业效率。
信函自动分拣系统研究的意义
运送传递信函是邮政部门的重要工作,虽然如今信息通讯发达,我们可以通过打电话、QQ、微信等多种方式与人交换信息,但是不可否认,信函还是在我们生活中扮演着不可或缺的角色。在自动化技术还不成熟的早期,信函通信较为普遍,而当时的分拣只能靠人工作业,不仅效率极其低下,而且分拣员工的工作量大,容易劳累导致分拣出错,这种人力分拣显然是不可取的。随着科技的发展,自动化技术渐渐被应用到各个行业,邮政信函的自动分拣系统的研究也受到了人们的关注,实现信函的自动分拣不仅有利于节省人力物力,减少邮政部门的员工数量,更能提高信函分拣系统的工作效率,提高邮政部门的信函吞吐量。同时随着各种方法特别是人工神经网络的提出,信函分拣系统的关键技术——手写邮编的自动识别也得到了发展,如今已经能够得到很理想的识别率,这也优于人工作业。识别率虽然比较高了,但还不是百分之百,不能做到完全不出错,所以对于系统不能正确识别出的信函,则还是需要人工操作,这是系统目前受制于数字识别算法的不足之处,还需要进一步的研究。
分拣系统
信函分拣系统任务分析
条形码打印
邮票探测检查
邮编识别
信函分拣
条形码阅读
图2.1 信函分拣系统任务流程
信函分拣系统主要由送料机、邮票探测器、光学字符自动识别器(OCR)、条码打印机、PLC分拣闸口、主传送带等部件构成。整个信函分拣系统要实现邮政信函的自动分拣处理,信函送入传送带后先检查邮票粘贴情况是否合格,合格的进入下一步,不合格的直接送到驳回箱等待后续处理。对邮票检查合格的信函进行手写邮政编码的识别,将手写邮编转化为条形码,由条码打印机打印在信函上相应位置,打印了条形码的信函接着被传送带送往PLC分拣闸口,条码阅读器读取信函上的条形码,PLC控制器则根据条码阅读器传入的条码信息打开相应的闸口,信函随即被送入格口箱以进行下一步的处理。
信函分拣系统设计
初始分拣
信函的初始分拣是信函先放到送料机,经送料机送往邮票检测器,通过邮票检测器的检测就完成了初始分拣,合格的信函送往主传送带进行下一步的分拣,不合格的信函将被驳回,置于驳回箱中等待下一步的处理。
邮票是在寄信时贴用的邮资,通常被粘贴在信函上指定的位置,邮票检测器可以用来检测是否贴有邮票和邮票是否合格,它主要是利用光电传感器来对其进行检测的,当信函被传送带传送至邮票检测器时,检测器上的扫描仪会发出侧向的光,照射在邮票上,这样就会形成由光暗交替的锯齿状图案,光电传感器上的物镜会投射扫描线,而在扫描窗口的终点处,邮票检测器将会判断出每封信函的邮票检测是否通过。
邮票检测器装载在传送带上,通过了邮票检测器的信函会被送上主传送带进行后续识别分拣操作,这些信函在通过邮票检测器时不会产生异常信号,而没通过邮票检测器的信函则正好相反,此时邮票检测器会产生信号激活螺线管,从而带动鼓风机把信件转移到驳回传送带上,经驳回传送带送往驳回箱等待员工进行下一步处理。
图2.2 初始分拣示意图
主分拣
信函在经过邮票检测并合格后会进入主传送带开始信函的主分拣处理[4]。当信函经过光学字符识别器(OCR)时,OCR会扫描信函上的手写邮政编码,将这些邮编信息转换为相应的条形码,随后条码打印机将相应的条码打印在信函上的指定位置。打印了条形码的信函将随传送带送到PLC控制器和分拣闸口处进行分拣。
PLC控制器包括PLC、摄像头和光学条码自动识别(OBR)设备,信函随主传送带不断前进,经由摄像头处时,摄像头将捕捉到信函上的条码信息,将信息传送至OBR设备,设备对其进行OBR识别,并且通过网络连接到全国邮政信息系统数据库,查询该信函应该被送至的格口[5],并将该格口信息传送到PLC控制器,PLC控制器根据收到的格口信息控制气动设备打开相应的闸口[6],信件就此送到格口箱等待后续处理。每个格口箱都安装有计数设备,每有一封信函装入,计数器都将加一,工作人员预先为每个格口设置一个最大可容纳信函数量的值,当计数器的值达到该满值时会发出语音或灯光提示,员工得知后可及时对其进行处理。
图2.3 主分拣示意图
系统配置及功能分析
在上面对整个信函分拣系统的分析中,我们可以将该信函自动分拣系统划分成五个模块,分别是输入、传送、连接、输出和显示模块。
图2.4 信函分拣系统模块
输入模块主要包括信函的连续输入和初始分拣过程,该模块涉及的设备有信函输送机、初始分拣传送带、邮票检测器、驳回传送带和驳回箱。信函输送机可以把信函连续输送到初始分拣传送带上,邮票检测器用来识别邮票粘贴情况是否合格,驳回箱用来装初始分拣不合格的信函,传送带用来输送信函。
数字识别模块包括主传送带系统、信函定位器和导向器、OCR光学字符自动识别设备。主传送带系统用于信函的连续输送,信函定位器可以判断信函输送的方向是否正确,是否能够被OCR设备正确识别出邮编,如果不能,导向器就要对其进行调整,以便OCR能正确识别,OCR设备用于识别手写邮编数字,条码打印机用于打印条码。
连接模块主要是带有编程设备的可编程逻辑控制器(PLC)、OBR光学条码自动识别设备、保护电路和控制电路,OBR设备获取条码信息后会向PLC控制器发出信息,PLC接收到信息后控制相应的气动设备进行下一步操作。保护电路和控制电路主要包括电源、系统控制器、工作时间计时器等不同功能组合而成的控制开关和相应的指示灯。
输出模块包括气动设备、分拣闸口和格口箱等,气动设备接收PLC控制器的脉冲信息并执行相应操作,打开信函应送往的分拣闸口,格口箱主要用于堆叠完成了整个分拣过程的信函。
显示模块主要用于显示整个分拣系统中的相关工作信息,由工作状态显示栏和各个计数器组成,工作状态显示栏显示分拣系统的运行时间,相关设置和状态信息,计数器显示每个格口箱中信函的堆叠情况。
手写邮政编码识别概述
手写邮编识别发展现状
计算机图像识别方面的研究一直是人们关注的焦点,也是无数学者为之奋斗的学科领域,图像识别的目标就是利用计算机去自动识别一些图像,不用人工操作就可以完成对一些信息的处理。手写数字的识别正是图像识别课题中一个很热门的方向[7],一般有脱机和联机两种情况,脱机识别是将手写数字的图片输入到系统,让系统自动识别。联机识别则是通过捕捉书写数字时的笔划运行轨迹以及笔画上各个像素点的位置信息来帮助识别。信函分拣系统中待识别的手写邮政编码是各个寄信人之前写好的,无法捕捉书写笔迹,所以该识别属于脱机识别问题,这比联机识别问题要难很多。对于手写数字的识别问题,几十年来无数学者都在努力研究,为之提出了许多具有高可靠性和高识别率的方法,其中人工神经网络的提出与发展极大地促进了手写数字识别技术的发展,本论文将以人工神经网络方法为主解决手写邮编的识别问题。
手写数字识别研究意义
几十年来,在对手写数字识别问题的研究中,我们取得了很多令人欣喜的成果,但是由于理论和技术等各个方面的原因,对此问题的研究还没有达到我们所期望的高度。手写数字识别是一个很具有研究价值的课题,在人工神经网络和深度学习提出后,我们又得到了解决这个问题的新方法,而这些方法在此课题上取得了非常令人振奋的成果[8]。
手写数字在我们的生活中应用极为广泛,实现对其自动识别能够大大方便我们的生活。0到9共10个阿拉伯数字是世界各地的人们都在使用的符号,所以这项研究没有文化背景的差异,世界各国的学者都会对其进行研究,都能从此课题的研究中得到好处,不同国家和地区的研究人员可以互相交流和分享研究经验,不断推动研究的发展进步。手写数字的识别能够用于大规模的应用统计,不论是金融领域还是涉及到财务和财务的方面,手写数字都扮演着极为重要的角色,如果能攻克手写数字识别课题,无疑能大幅度提高这些领域的作业效率。而在本文所要讨论的问题——信函自动分拣系统中,手写数字的识别正是其关键和难点所在,所以能否解决这个关键问题意义重大。
手写数字识别难点
手写数字的识别问题广泛存在于我们的生活中,当涉及到数字的识别问题时,待识别数字之间往往是孤立的,而一位数字识别错误就可能导致整个结果差之千里,所以我们希望识别准确率能够尽可能的高[9],然而手写邮编识别其本身有着很多难点[10]:
(1)手写邮政编码的识别属于脱机识别,是以手写数字图像作为输入的,不能做到像联机识别那样可以捕捉书写时的笔划来帮助识别;
(2)阿拉伯数字0-9共10个数,虽然个数并不多而且笔画很简单,但是不同的人对这些数字的书写习惯有较大差别,字体的不同给识别造成了很大的困难,自动识别系统很难做到识别不同人的字体;
(3)阿拉伯数字的笔画非常简单,字形中所蕴含的信息量比较小,当要区分不同的数字时,较小的字形信息量将导致很难准确地区分出字形相似的数字;
(4)我国的邮政编码共有六位,其中的每一位数字都很重要,只要六位邮编中一位识别错误,就可能会导致目的地址的错误,所以对数字识别的准确率有比较高的要求。数字识别不像文字识别,文字识别可以利用上下文的语句来帮助识别,而数字识别中每个数字都是孤立的,这也给识别带来了困难;
(5)人们在手写数字时往往会带有连笔,这会给原本的数字增加一些冗余的笔段,造成字形畸变,增大信息量,给特征抽取和识别带来困难。
人工神经网络概述及其基本原理
人类之所以有智能是源于大脑的存在,大脑中有大量的神经元,而每个神经元都是一个小型的处理单元,当多个神经元以不同的方式相互连接起来时,就形成了神经元网络。每个神经元都可以连接一个或多个其他的神经元,不同神经元之间可以相互传导信息,当一个神经元接收到多个从不同神经元传来的信号时,就会对接收到的信号进行处理,产生出兴奋或抑制信号[11]。
人工神经网络就是根据人脑中神经网络的功能和结构,仿生出的一种用于处理信息的网络系统。神经元之间相互连接的方式不同,所组成的神经元网络就不同。人工神经网络的构建与学习过程就像大脑中的神经元做自适应变化的过程,而网络的输出就相当于大脑中神经元最终所产生的兴奋和抑制信号。
人工神经网络的研究最早能够追溯到二十世纪五十年代提出的感知器模型,但是在随后的几十年里并无太大发展,直到八十年代,误差反向传播(BP)算法的成功提出,解决了人工神经网络中隐含层之间连接权值的调整问题,这才使得人工神经网络进入了飞速发展时期。
本文拟采用BP神经网络来解决邮政信函分拣系统中的手写邮编识别问题。BP神经网络的建立有信息的正向传播和误差的反向传导两个过程[12]。BP神经网络有输入层、隐含层和输出层三个主要层次,输入层和输出层通常只有一层,而隐含层可以为一层或者多层,每个层次都可以有数量不等的节点,输入层的节点主要接收输入到网络的信息,将信息传递给隐含层中的各个节点进行处理,隐含层是处理内部信息的层次,主要负责信息的内部变换并将变换处理后的信息传递到输出层,这就是BP神经网络中信息的正向传播过程,最后由输出层输出信息在网络中的处理结果,如果输出层的输出跟预期的输出不一致,就要进行误差的反向传导过程,这时误差会通过输出层,以梯度下降的方式不断更正各层次间的连接权值,向隐含层和输入层依次反馈传导。信息的正向传播过程和误差的反向传导过程不断循环往复,不断调整各层次的权值[13],直到神经网络的输出误差减小到允许的范围内或是达到了人为设定的最大学习次数时,这个过程才会停止,这也正是BP神经网络的学习和训练过程。
手写数字识别的一般方法
神经网络识别
特征提取