基于安卓的火车票OCR识别APP设计与开发文献综述
2020-04-28 20:26:47
文 献 综 述
一、选题背景
随着信息技术水平的不断提升,信息的数量和形式正突飞猛进。如何对这些信息进行处理,使其能够方便被识别,成为计算机研究领域的一大重点。图像现在是一种重要的信息媒介,对信息内容的诠释具有特殊意义。文字具有高级语言特征,对信息储存、内容提取、检索等具有重要作用,且在占很大比重的图像中都有文字的存在,所以对图片中文字的提取便意义非凡。光学字符识别系统(OCR)就是通过计算机检测纸上的印刷字符,通过判断亮、暗的模式确定其形状并处理的一种高度智能化技术。
随着移动互联网和智能手机的快速发展,许多企业都开发了自己的移动办公APP、移动财务报销APP。为了简化流程,很多需要业务人员自己录入报销票据的信息,比如增值税票、出租车票、火车票、餐票等等;目前手动输入上述票据信息进程出错而且也比较慢,现在增值税票的快速录入已经有智能软件和硬件可以解决了,今天我主要是给各位介绍一下火车票OCR快速识别这个应用;火车票OCR识别可以快速录入火车票信息,解决火车票的信息录入,并且支持二次开发,可以快速集成到企业APP和财务系统上。
本课题详细阐述了一个在手机端调用手机摄像头拍照并调用百度云OCR技术的API接口获取火车票图像中的文字信息,以文档的形式保存的手机app设计。
二、研究现状
OCR识别技术是本课题的研究的重点,只有调用OCR识别技术,APP才能识别火车票。此次调用的是百度云文字识别API接口的OCR识别技术来实现APP的设计。(光学字符识别,Optical Character Recognition),是通过图像处理和模式识别技术对光学的字符进行识别的意思,是自动识别技术研究和应用领域中的一个重要方面。它是一种能够将文字自动识别录入到电脑中的软件技术,是与扫描仪配套的主要软件,属于非键盘输入范畴,需要图像输入设备主要是扫描仪相配合。API:应用程序接口(API:Application Program Interface)是一组定义、程序及协议的集合,通过 API 接口实现计算机软件之间的相互通信。API 的一个主要功能是提供通用功能集。程序员通过调用 API 函数对应用程序进行开发,可以减轻编程任务。 API 同时也是一种中间件,为各种不同平台提供数据共享。
光学字符识别(OpticalCharacterRecognition)技术诞生于上个实际50年代,是模式识别领域的一个重要分支,它涉及了图象处理模糊数学、计算机、形式语言、自动机、组合论、信息论、人工智能等多个学科,是介于基础研究和应用研究之间的综合性技术。随着模式识别和人工智能研究的发展,字符识别技术已逐步趋于成熟,并且广泛应用到各个领域,它的应用又反过来推动了模式识别的发展,促进了计算机及自动化应用的普及。8676国外的字符识别技术研究起步较早,在1929年Tausheck就取得了光学字符识别专利。几年后,美国科学家Handelt也提出了利用光学技术进行识别的想法。到20实际50年代字符识别技术开始受到人们的广泛关注,并逐步成为模式识别研究领域的焦点,随后出现了一些简单的识别统,如六七十年代,日本Toshiba等公司研制出了邮政编码自动分拣机等OCR系统我国70年代末才开始OCR技术方面的研究,但由于我国政府对汉字自动识别的研究从80年代开始给予了充分的重视和支持,经过科研人员二十多年的辛勤努力,使得OCR的应用取得了重大突破:从简单的体识别发展到多种字体混排的多体识别,从中文印刷材料的识别发展到中英混排印刷材料的双语识别。各个系统可以支持简、繁体汉字的识别,解决了多体多字号混排文本的识别系统,对于简单的版面可以进行有效的定量分析,同时汉字识别率已达到了9%以上。目前印刷体汉字识别系统的应用已经相当成熟,如清华TH-OCR97综合集成汉字识别系统,对中等质量的样本,识别率已经可以达到99%左右或更高。字符识别的研究也已看是从印刷体向手写体进发如今,OCR已经逐步进入人们日常学习、生活、工作等各个领域,已经广泛应用在金融、保险、报业、税务、工商等行业随着我国自动化程度的提高,字符识别技术应用的范围也越来越宽。然而特定领域里的应用必定存在该领域的特殊性,针对不同领域的需求需要采用不同的解决办法。因此数字字符识别的研究仍具有理论价值和实践意义。
OCR识别技术不仅具有可以自动判断、拆分、 识别和还原各种通用型印刷体表格,在表格理解上做出了令人满意的实用结果,能够自动分析文稿的版面布局,自动分栏、并判断出标题、横栏、图像、表格等相应属性,并判定识别顺序,能将识别结果还原成与扫描文稿的版面布局一致的新文本。表格自动录入技术,可自动识别特定表格的印刷或打印汉字、字母、数字,可识别手写体汉字、手写体字母、数字及多种手写符号,并按表格格式输出。提高了表格录入效率,可节省大量人力。同时支持将表格识别直接还原成PTF、PDF、HTML等格式文档;并可以对图像嵌入横排文本和竖排文本、表格文本进行自动排版面分析。
三、课题设计内容