基于机器学习的手写字识别文献综述
2020-04-14 17:20:05
-
目的及意义
1.1目的及意义
20 世纪中期,第一台计算机在美国诞生,人类的信息时代拉开了序幕,随后信息革命悄无声息的开始了,到目前为止,计算机已经由原来的仅供军事领域到人们的日常生活中,功能更是不可同日而语了。计算机已经发展成人们生活中不可或缺的一部分,在生活、娱乐、工作中都占据着重要的位置,计算机的功能和性能也在不断的加强,如何使计算机与人之间能更加友好的交互是信息技术研究的重点。人类可以通过视觉、听觉、嗅觉、触觉捕获信息,人与人之间甚至可以通过眼神、动作完成信息传递,人与计算机的交互变成人与人之间交流一样便捷是人机交互的最终目标。人类承载信息的方式主要包括声音、图像、语言和文字,而文字信息的作用是任何一种方式无法取代的。
人类的习字与识字的过程是一个典型的学习训练过程,对于机器学习算法的研究很有意义,由于手写字识别是一个涉及多学科的复杂性问题,各个学科从自身角度探索手写体字识别问题,出现了大量新思想和新方法,促进了相关学科的深入发展,因此手写字识别在相关学科研究中,具有很高的理论探索价值和启发创造作用。不仅具有重要的理论研究价值,而且具有广阔的应用前景。
深度学习是一门交叉学科,从神经网络发展而来,模仿人脑的思维逻辑方式,模型的抽象学习能力很强,深度学习的诞生颠覆了语音、图像、文字的传统识别方式,在实际应用不断取得突破。分析脱机手写汉字识别中遇到的种种问题,将深度学习的方法应用到脱机手写汉字识别问题中进行深入研究,对汉字方向识别和发展具有非常重要的意义。
1.2.1手写字识别的研究现状
如今在手写字识别领域,存在的识别方法有多种,每一种识别方法会有自
己的优势和劣势,在识别结果上也不尽相同,目前比较常用的有:K最近邻算法、神经网络、隐马尔可夫模型(HiddenMarkov Model,HMM)、贝叶斯分类器和支持向量机(SupportVector Machine,SVM)等。其次,改进的二次判别函数(ModifiedQuadratic Discriminant Functions,MQDF)被广泛的使用,使用该分类器前要对数据进行预处理,预处理的方式有图像二值化、规整化、线性规整化、非线性规整化等,预处理主要是避免图像发生形变,使其更清晰的呈现,之后进行特征提取生成指定维数的特征向量,维数的设定根据具体的情况而定,之后可以利用线性判别分析(LinearDiscriminant Analysis,LDA)或主成分分析(PrincipalComponent Analysis,PCA)方法进行特征降维,最后使用MQDF分类器进行分类。MQDF分类器对特征描述能力很强,但是对复杂的计算能力较差,很多学者都尝试在MQDF基础上进行方法改进,很多学者提出了有价值的文献。对模式识别中降为算法和手写自识别两个问题进行了研究,提出了一种新的方法替代方法解决MQDF中参数估计问题,通过分析每类在训练集上参数分布,选出最优参数,进而获得最优分类结果。
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付