基于卷积神经网络的笔迹鉴定研究与实现开题报告
2020-02-18 19:22:42
1. 研究目的与意义(文献综述)
1、目的及意义
随着司法、金融等领域对身份的识别验证需求的不断上升,人们探索了越来越多的身份鉴别方式,如指纹识别、面容识别、虹膜识别等固有生理特征识别方式和步态识别、笔迹鉴定等行为特征识别方式。其中,笔迹鉴定在手写签名、信件真伪鉴定等方面扮演重要角色。笔迹鉴定是通过对一段文字书写内容进行比较和鉴别,以确定该文字书写内容是否为待鉴定人员所书写。笔迹鉴定是鉴定这类手写材料有效性最直接的手段,其鉴定结果将作为公安机关侦破案件的重要参考,以及作为庭审案件的重要材料。因此,笔迹鉴定的准确度,将直接影响案件侦破进度和庭审结论的公正性。
2. 研究的基本内容与方案
2.1基本内容
本课题研究基本内容包括三个部分,一是数据集的处理部分,提取数据集中笔迹的特征;二是确定卷积神经网络具体模型,确定卷积神经网络的框架结构;三是训练神经网络,调节参数。
本课题训练数据集使用CASIA-HWDB手写数据集,包含中文和英文。使用CASIA-HWDB中文数据集进行卷积神经网络的训练和测试,使用CASIA-HWDB英文数据集进行卷积神经网络的泛化。本课题使用Python作为编程语言,利用Tensorflow平台搭建卷积神经网络。卷积神经网络结构如图1所示。
图1 卷积神经网络基本流程图
2.2技术方案
1、数据集处理部分
对于CNN识别图像而言,数据预处理是常见步骤,虽然CNN能够读取原始图片,但是一个有效地预处理对于训练网络至关重要。从CASIA-HWDB下载得到数据集后,按照数据集的说明,对图片进行分割重建,并对图片做归一化处理,使非笔迹信息的特征弱化。同时,借助参考文献的研究方法,如K邻接段(KAS)、轮廓梯度等方法选取部分笔迹特征,对训练材料进行预处理,得到更有效训练材料。
2、确定网络具体模型部分
卷积神经网络模型众多,各有长处,但具体选取何种网络模型,尚无定论,这取决于具体的任务。本部分将对已有的几大经典卷积神经网络进行分析,如Alex-Net、VGG-Nets、NIN和残差神经网络。确定网络模型后,本课题将借助Tensorflow平台搭建出具体网络。
3、训练神经网络与调参部分
这一部分将是本课题研究的重点内容。在卷积神经网络大框架确定后,需要对其具体参数进行训练和调整。卷积神经网络初始参数对于训练过程和最终网络结果十分关键。神经网络参数初始化有多种做法,如全零初始化、随机初始化、和其他初始化方法。全零初始化不可取,虽然最终网络收敛到稳定状态,参数(值)大概率保持正负各半的状态,期望为0,但是全零会导致神经网络后面的参数传递出现问题,无法训练。又因为随机初始化训练收敛过于缓慢,故本课题选取预训练的方式,得到预训练模型,将预训练模型的参数作为正式训练参数的初始值。对于激活函数的选取,同样采用预训练的方法,对Sigmoid函数、ReLU函数、Leaky函数等经典激活函数进行对比分析。另外对目标函数进行对比分析,选取合适的目标函数。
通过具体训练,得到能实现功能要求的笔迹鉴定卷积神经网络,通过与其他参考文献提及的卷积神经网络进行比较,调整优化网络具体超参数(卷积层具体参数、汇合层具体参数),得到达到课题要求的网络。并且确定各自神经网络在识别准确度、训练收敛速度、泛化能力等方面的优缺点。找出原因,形成结论。
本课题技术流程如图2所示。
| |
图2 技术流程 | |
3. 研究计划与安排
第1周—第3周 搜集资料,了解笔迹鉴别和神经网络原理,撰写开题报告;
第4周—第5周 论文开题,完成数据集处理部分;
第6周—第12周 确定网络具体模型、训练网络,撰写论文初稿;
4. 参考文献(12篇以上)
[1] jain r, doermann d.offline writer identification using k-adjacent segments[c]//2011 internationalconference on document analysis and recognition. ieee, 2011: 769-773.
[2] 邓辉瑶. 基于深度卷积神经网络的离线笔迹鉴别研究[d].华中科技大学,2016.
[3] 余义. 基于内容及风格的离线手写汉字鉴定算法研究[d].电子科技大学,2017.