基于Pytorch的手写数字图像分类器的设计与实现开题报告
2020-02-18 19:26:44
1. 研究目的与意义(文献综述)
自人工智能诞生以来,人们所做的工作大多数逐渐被人工智能所代替,如现在的快递包裹,商家基本都是机打快递单,智能设备则可根据订单上的信息实现快递包裹的自动分类,实现机械的智能操作。目前对于印刷体的数字识别已经趋于完善。但由于手写数字的多样性及不规范性,识别起来比印刷体就多了很多不确定性,手写数字识别的研究则可以用来解决手写数字类的数字识别及录入工作,如银行的票据录入,邮政编码,财务报表等信息的识别录入工作,如果是人一直去录入这些数字,不仅工作量很大,而且时间久了也会感到疲惫,甚至眼睛也会看疼,需要投入大量的人力物力,要想实现这些工作的智能操作,其核心技术就是手写数字的识别,通过利用手写数字的智能识别,可实现这些工作的智能录入,解放人的双手。
一般地,字符识别可以按不同的分类方法来分:从采用的输入设备来分,可以分为联机识别和脱机识别;从字符的字体来分,脱机识别可分别为印刷体识别和手写体识别;从识别对象来分,可分为手写数字识别,手写汉字识别,手写字母识别及其他国家的文字识别等;其中,根据文字类的多少,又可分为限制性识别和非限制性识别。
手写数字识别技术作为光学字符识别的一个重要分支,集数学图像处理、计算机图形学和人工智能等多种知识于一体,在计算机自动化和智能化领域慢慢的成为了一项重要的技术。目前该项技术的已经趋于成熟,但在实际应用当中还未得到大量的普及。
2. 研究的基本内容与方案
2.1 研究目标
实现基于pytorch的手写数字图像的识别的算法设计。手写数字识别技术作为光学字符识别的一个重要分支,集数学图像处理、计算机图形学和人工智能等多种知识于一体,在计算机自动化和智能化领域慢慢的成为了一项重要的技术。此次设计将研究基于pytorch深度学习框架高效、快捷的搭建一个神经网络,并对模型进行训练和对参数进行优化,来解决手写数字识别的计算机视觉问题,使搭建的模型的标准能够准确的对手写数字图片进行识别,将其应用到成绩的录入当中。
2.2 研究内容
3. 研究计划与安排
第1周 搜集资料,确定技术方案;
第2周 撰写开题报告初稿;
第3周 修改开题报告;
4. 参考文献(12篇以上)
1.陈云,《深度学习框架pytorch入门与实践》,电子工业出版社,2018
2.肖智清,《神经网络与pytorch实战》,机械工业出版社,2018
3.黄瀚敏,一种基于特征提取的手写字符识别技术,《重庆大学学报:自然科学版》2000