离线手写数字识别方法研究毕业论文

2022-07-24 10:12:45

论文总字数：20614字

摘要

手写体数字识别作为一个跨学科多领域的研究内容，涉及到信息学、统计学、模糊识别、计算机技术以及仿生学。是一种高效的信息自动录入方式。

本文以离线手写数字识别为课题。在预处理过程，主要对常见的图像的细化方法和分割方法进行了研究。本文的特征提取采用的是数字结构特征方法，通过分析总结十个阿拉伯数字的结构特征，具体选用了端点、交叉点、欧拉数等特征来完成对手写体数字的识别。

根据本文实现的特征提取和识别方法制作的识别系统，对大量的不同书写方式的十个阿拉伯数字进行了识别，并得到了较高的识别率。

关键字：手写体离线数字结构特征

Off-line handwritten numeral recognition research

Abstract

Handwritten numeral recognition is an important branch of image recognition, and has been widely used in many fields, and its entry to the large amount of information and efficient electronic storage device has a very important role.

This paper conducted a study on the identification offline handwritten numbers. In the pretreatment process, mainly on the common thinning methods and segmentation methods have been studied. This article features extracted using structural features of a digital method, by analyzing the structural characteristics summarized the ten Arabic numerals, specifically chosen endpoint intersection, Euler number and other features to complete the identification of handwritten numbers.

According to this paper, the system by structural feature and recognition has been recognition a large of number image, and has a higher recognition rate.

Keywords: Handwritten; Off-line; number; Structural features

摘要 I

Abstract II

第一章绪论 1

1.1 课题背景 1

1.2国内外的研究现状 1

1.3 离线手写数字识别系统的基本构成 1

1.4本文的主要工作和安排 2

第二章离线手写数字识别系统预处理 4

2.1 图像采集 4

2.2 灰度化 4

2.3 二值化 6

2.4 细化 7

2.4.1 细化概述 7

2.4.2 本文细化方法 7

2.5 图像分割 12

2.5.1 图像分割概述 12

2.5.2 本文分割方法 12

2.6 数字有效区域的分割 15

2.7 小结 17

第三章特征提取与图像识别 18

3.1 特征提取与数字识别概述 18

3.1.1统计特征识别 18

3.1.2结构特征识别 19

3.2 本文特征提取与数字图像识别 19

3.3 小结 25

第四章结果与分析 26

4.1 实验环境 26

4.2 测试过程与结果 26

4.3 分析 29

第五章总结与展望 30

5.1 总结 30

5.2 展望 31

参考文献 32

致谢 34

第一章绪论

1.1 课题背景

手写体数字识别作为一个跨学科多领域的研究内容，涉及到信息学、统计学、模糊识别、计算机技术以及仿生学。存储设备输入手写信息的方法有：一是使用特定的硬件设备进行书写，二是将书写后的信息以数字图像的方式输入到存储设备中。离线识别与联机识别相比，缺少物理载体，只能对像素进行操作；同时也会因图像采集方式、背景、光线均匀性等、笔迹的粗细的不同，产生无法预料的噪声，增加识别的难度。

离线手写数字识别应用范围很多，例如遥感，医疗，财税，金融，军工，生物，地理、邮政等。具体的像邮政分拣，银行票据输入，信息录入等。离线手写数字识别系统的应用可以有效地提高工作效率，减少人力成本，增加经济效益。

1.2国内外的研究现状

光学字符识别OCR(Optical Character Recognition)是由德国科学家Tausheck在1929年提出的概念。根据中科院自动化研究所的资料显，最早的OCR软件出现在1957年，名字叫做ERA( Electric Reading Automation ) . 而最早的OCR产品是由IBM公司开发生产的IBM11418，是第一代OCR产品。同期的还有NCR和Farrington公司。在60年代末，日本的HITACHI和Fujitsū公司也开发出了ORC产品。而后的OCR研究以手写体字符为主。第三代OCR技术主要集中在大字符集的识别上。

我国OCR技术的研究工作相比于发达国家明显滞后，与第一代OCR产品相差10年以上。1979年后开始研究汉字识别；到1986年，研究有了重要进展。90年代中期以后，中文OCR的研究进入高潮阶段。

1.3 离线手写数字识别系统的基本构成

一个完整的离线手写数字识别系统共包括两大部：预处理和分类识别。

图1.1 数字图像识别一般流程图

预处理主要作用是为了后面特征提取和分类识别做基础，减小识别过程的计算量，提高识别速率，保证识别效率。预处理过程分为：图像采集、灰度化、二值化、细化以及图像分。通过扫描设备获取图像，的采集过程简单，且采集效果受外界光线影响较小。

1.4本文的主要工作和安排

本文以离线手写数字识别为课题，具体内容包括两个大方：图像预处理和分类识别。

在预处理过程，本文着重对图像二值化和细化进行了研究和分析，并在该过程中实现了图像的读取、灰度化、二值化、膨胀、细化、分割等功能。

在图像分类识别过程中，首先对各种常见的数字识别方法进行了研究和分析总结。而后本文根据对各种方法的比较，选择了一种较为简单的分类方法，提取数字结构特征为特征值，再对数字图像进行识别。根据相应的理论分析，实现了一个以数字结构特征为基础的离线手写数字识别系统，并达到了基本的要求。

本文在结构上共分为5个章节：

请支付后下载全文，论文总字数：20614字

您需要先支付 50元 才能查看全部内容！立即支付

注册

找回密码

离线手写数字识别方法研究毕业论文

Abstract

第一章绪论

1.1 课题背景

1.2国内外的研究现状

1.3 离线手写数字识别系统的基本构成

1.4本文的主要工作和安排

您可能感兴趣的文章

最新文档

推荐栏目

登录

注册

找回密码

离线手写数字识别方法研究毕业论文

Abstract

第一章 绪论

1.1 课题背景

1.2国内外的研究现状

1.3 离线手写数字识别系统的基本构成

1.4本文的主要工作和安排

您可能感兴趣的文章

最新文档

推荐栏目

第一章绪论