基于神经网络的文字提取与识别技术的应用与研究开题报告
2022-01-07 21:53:46
全文总字数:1843字
1. 研究目的与意义及国内外研究现状
文字识别是模式识别中一个非常重要和活跃的研究领域,而且文字识别也并非一项孤立的技术,其所涉及的问题是模式识别的其他领域都无法回避的。应用上,作为一种信息处理手段,字符识别还有广阔的应用背景和广大的市场需求。
人工神经网络识别方法具有一些传统技术所没有的优点:良好的容错能力、分类能力强、拥有并行处理和自学习能力,并且是离线训练和在线识别的。这些优点使他在字符识别中能对大量数据进行快速实时处理,并达到良好的识别效果。
由于文字识别难于建立精确的数学模型,所以本文采用bp神经网络对这一问题进行处理。神经网络识别的一个关键步骤是预处理和特征提取,主要包括灰度化、二值化、锐化、噪声去除、字符分割、字符归一化、字符骨架提取等。先对图片进行预处理,再对图片进行特征提取,利用改进的bp神经网络,对图片上的字符进行识别,提高识别的准确率。
2. 研究的基本内容
基于bp网络的文字识别系统分为两个阶段,学习阶段与识别阶段。两个阶段都要对样本字符进行预处理、特征提取,学习阶段还要确定稳定的权值,识别阶段还要经过分类,再输出识别结果。
文字图像在采集过程中,受到像素质量、扫描性能的影响,文字图像会带有形变和噪声,这些变化都会影响识别效果。因此要进行预处理,目的是消除原始图像中的噪声,将原来的图像转化为清晰的二值化图像,便于微观结构特征的提取。预处理过程包括去噪、二值化、归一化、细化。
特征提取是使用计算机提取图像信息,来决定每个图像的点是否属于一个图像特征。在字符识别当中,特征的选择是一个关键的问题。字符的特征可以分为两大特征:结构特征和统计特征。特征提取的原则是所选用的特征能够很好地反映字符本身的特点。
3. 实施方案、进度安排及预期效果
实行方案:计划采用16*16像素的文字图像,一个样本图像中,文字部分的像素点为1,其余部分的像素点为0,即可将图像转换成二值向量,然后提取图像的24个特征值作为输入。设计一个3层的树形神经网络,包含一个输出层,一个隐含层,一个输出层。共使用500个样本对神经网络进行训练。
课题进度:(1)第1周:检索资料、调研、完成开题报告及文献综述;
(2)第2周:确定基于神经网络的文字提取与识别系统的总体设计方案;
4. 参考文献
[1]雷建锋.《基于人工神经网络下的图像识别的研究》. 湖北工业大学.2008
[2]李连胜 .《基于神经网络的手写数字识别技术研究》.中南大学.2008.
[3]李望晨.《bp神经网络改进及其在手写数字识别中的应用》. 哈尔滨工业大学.2006