基于SVM实现并优化文字识别开题报告
2022-01-07 22:20:25
全文总字数:2230字
1. 研究目的与意义及国内外研究现状
近年来,随着计算机的迅速发展,模式识别技术不断取得新的进展,大大改善了人机之间的信息交互能力。计算机文字识别是模式识别的一个重要分支,它包括 数字字符识别、西方文字字符识别、东方文字字符识别。数字字符识别和英文字符 识别研究最充分,识别方法比较成熟,识别率也比较高;而东方文字字符识别比较困难,其中汉字字符识别是文字识别中最困难的部分。
汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模 式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式 语言与自动机、模糊数学、组合数学、信息论、中文信息处理等学科,也涉及到语言文字学、心理学、仿生学等,是一门综合性技术。 计算机文字识别是使汉字和其它字符高速自动输入计算机,解决了汉字信息处 理系统中手动输入效率低这一关键问题的理想途径,是办公自动化不可缺少的文字 自动输入手段,是智能计算机智能接口的重要组成部分。同时联机手写汉字识别是 一种很方便的汉字输入方式,而且字符图像经识别后形成的代码,在信息量上减少了百分之九十九以上,对信息压缩和传输有重要意义。
汉字识别是一种难度非常大的模式识别。这是因为:从客观上讲,汉字是一种特殊的模式集合,其模式种类很多,结构非常复杂,有的模式又十分相似,加上印刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等原因,都使得汉字字符的识别十分困难。
2. 研究的基本内容
1.静态图像不同文字提取的处理流程:
(1) 人工文字:
人工添加的文字一般来说有以下几个特点,文字大小固定,色调单一并且相对于背景色更为鲜明,分布较为集中,排列方式一般为横向或纵向。针对以上几个特点设计相应方法。具体实现:图片预处理,包括灰度化,二值化,实现基于二值化聚类的图像文字提取。
3. 实施方案、进度安排及预期效果
进度安排: 1-3周 选定研究方向,确定论文题目,完成任务书填写 4-5周 明确研究方向,研究内容,完成开题报告 6-8周 查阅相关文献,学习该课题相关专业知识 9-10周 对完成该课题制定初步设计方案和详细计划 11-12周 完成绪论与基础知识介绍部分 13-15周 进行详细实验设计,得出结果,完成初稿 16周 与导师沟通对初稿进行全面修改整理 17周 论文答辩 预期效果: 在保证对于纯汉字识别正确率不低于90%的情况下,提高汉字识别速度,尽可能达到实时识别 |
4. 参考文献
[1]姚聪.自然图像中文字检测与识别研究[d].华中科技大学,2014
您可能感兴趣的文章
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- .NET MVC框架在开发农业资源清单系统中的适应性外文翻译资料
- 使用Java平台针对数据库桥接层的Spring框架可靠性调查外文翻译资料
- 基于MVC架构的数据库和Web应用程序外文翻译资料
- 利用微服务SpringBoot 设计和开发公众投诉系统的后端应用。外文翻译资料
- 基于SSM框架的校园自行车租赁管理系统统计外文翻译资料
- 基于Android的校园交友社交应用的设计与开发外文翻译资料
- 基于Android的在线社交系统服务端的设计与实现外文翻译资料
- 基于Spring-boot微服务框架的学生成绩分析系统的设计与实现外文翻译资料
- 用于生成计算材料科学文献中使用的方法和参数的数据库的自动化工具外文翻译资料
最新文档
- 性能优化的FRP护套用于钢筋混凝土框架的抗震改造外文翻译资料
- 圆形截面的FRP约束混凝土:审查和评估应力应变模型外文翻译资料
- FRP约束混凝土的轴向压缩行为:实验测试数据库和面向设计的新模型外文翻译资料
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 利用污泥和低质粉煤灰制备高强度陶粒外文翻译资料
- 表面活性剂改性疏水性Cu2O量子点作为高效钙钛矿太阳能电池顶部空穴传输材料外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- Nb 和 Ni 共掺杂 Mg(0001)氢解离扩散的理论研究:外文翻译资料
- 基于 Jetson Nano 深度学习平台的学生课堂学习评估系统—–学生的人脸检测与识别外文翻译资料
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- 皇后大道大桥——NEXT梁外文翻译资料
- 连续梁桥支座附近的波纹钢腹板抗剪性能评估外文翻译资料
- 在200至300℃的温度下纤维素的水热降解外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 注蒸汽井中硅含量对水泥石抗压强度的影响外文翻译资料