基于深度学习的自然场景文字识别方法研究开题报告
2022-01-14 21:52:16
全文总字数:1189字
1. 研究目的与意义及国内外研究现状
文字,作为人类智慧的结晶,是人类文明最重要的标志之一。从古至今,文字在我们的生活中都发挥着不可或缺的作用。而随着随着信息技术和智能化数码设备的发展,图像和视频数据随时都会大量的产生,互联网的飞速发展又极大的促进了图像和视频的传播。文字包含丰富而精确的语义信息在基于视觉理解的任务中应用广泛,为了利用海量的图像和视频中的信息,也为了方便对信息的分类存储和查找,我们迫切需要研究如何让计算机自动识别图片中的文字信息。
国内外研究现状
近年来,该领域取得了大量的研究成果和巨大研究进展,但是对于自然场景图像中的文字提取与识别,仍然面临诸多挑战,如噪声、模糊和失真等。目前,自然场景的文字识别通常被分为两个子问题来完成:文字检测和文字识别。文字检测目前已有的研究方法有:(1)基于连通域的文字检测方法;(2)基于滑动窗口的文字检测方法;(3)基于深度模型的文字检测方法。文字识别目前已有的研究方法有:(1)基于字符的识别方法;(2)基于单词的识别方法
2. 研究的基本内容
1.了解自然场景文字识别的研究现状以及其面临的问题。
2.了解深度学习在自然场景文字识别领域的应用。
3.探究自然场景文字识别领域中的深度学习相关算法,并尝试实现和改进。
3. 实施方案、进度安排及预期效果
1、开题报告撰写2019.2.25-2019.3.5 查阅相关资料,完成开题报告,查找并阅读相关英文文献并完成翻译。
2、相关研究文献查阅和学习 2019.3.6-2019.3.20对相关的研究文献进行进一步的查阅和学习,积累算法实现和论文编写的必要理论和知识。
3、实施阶段以及完善论文2019.3.21-2019.5.1探究自然场景文字识别领域中的深度学习相关算法,尝试实现和改进。并整理,编写论文。
4. 参考文献
[1]马景法. 基于深度学习的场景文字检测与识别[d].华南理工大学,2017.[2]白翔,杨明锟,石葆光,廖明辉.基于深度学习的场景文字检测与识别[j].中国科学:信息科学,2018,48(05):531-544.
[3]夏勇. 基于深度学习的自然场景文本检测与识别算法研究[d].
[4]黄攀. 基于深度学习的自然场景文字识别[d]. 2016.