登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 信息工程 > 正文

基于纹理特征的文本检测方法与实现毕业论文

 2021-04-21 00:33:41  

摘 要

随着生活的节奏越变越快,纯文字式的信息已经不能满足人们的需求,图片和视频也随着各种便携式设备(如:手机、电脑、摄像头等)的飞速发展渐渐地占据了人们的视野。而图片、视频等内容里面夹杂着大量的繁复的、不必要的成分,因此文本检测渐渐地发展为处理图片的重要工作。

许多文本识别应用逐渐地占据了人们的视野,而文本检测是它的重要前提,因为它需要检测和定位出所需要的文本区域,为后续的工作提供基础,而简化和优化这个过程受到了研究人员的广泛关注。

论文主要研究了基于纹理的自然场景文本检测,主要工作是首先读取图片,并对图片做预处理工作,即将图片转化为灰度图像;其次,在灰度图像中选出MSER区域,即候选区域;然后对这些候选区域做纹理特征的计算、选取,这些纹理特征包括灰度共生矩阵及其二次统计量,能量、对比度、熵、均匀度、相关性等;用这些特征值去训练SVM文本分类器;最后将是文本的MSER区域保留。本文使用的是IADAR2013数据库,有229张训练样本和233张训练样本。

研究结果表明:基于纹理的自然场景文本检测可以完成文本检测,但对于一些复杂的图片来说,本算法工程较大且耗时较长。

关键词:文本检测;纹理特征;MSER区域;文本分类器;

Abstract

As the pace of life grows faster and faster, pure character information can no longer satisfy people's needs, along with the rapid development of various portable devices, such as mobile phones, computers, cameras, etc., pictures and videos gradually occupy people's vision.And the content of pictures, videos and so on is mixed with a lot of complex and unnecessary components. Therefore, text detection gradually develops into the important work of image processing.

Many text recognition applications gradually occupy people's vision, and text detection is its important premise, because it needs to detect and locate the required text area, provide the basis for the follow-up work, and the process of simplification and optimization has been widely concerned by the researchers.

This paper mainly studies textural based natural scene text detection. The main work is to first read the picture and preprocess the picture, and turn the image into a grayscale image. Secondly, the MSER region is selected in the gray image, that is, the candidate area. Thirdly, MSER region is selected in gray image, that is, candidate area.Then the texture features of these candidates are extracted, including grayscale symbiotic matrix, energy, contrast, entropy, uniformity and correlation, and the text classifier is trained with these SVM eigenvalues. Finally, the MSER region of the text will be preserved.This paper uses the IADAR2013 database, with 229 training samples and 233 training samples.

The results show that textual detection based on texture based natural scene text detection can complete text detection, but for some complex pictures, this algorithm is large and time-consuming.

Key Words text detection; texture; MSER region; text classifier;

目录

第一章 绪论 1

1.1 背景及意义 1

1.2 国内外当前研究现状 2

1.3 研究内容 3

第2章 基于MSER文本候选区域提取 5

2.1 总体设计 5

2.2 MSER算法 5

2.3 MSER文本检测实现 6

2.4 连通域标记与分析 8

2.5 文本合并 8

2.6 章节小结 9

第3章 基于纹理特征的文本检测 11

3.1 总体设计思路 11

3.2 纹理特征提取 13

3.2.1 纹理概述 13

3.2.2 纹理特征提取实现 13

3.3 灰度共生矩阵 14

3.2.1 灰度共生矩阵原理 14

3.2.2 特征值计算实现 15

3.3 训练与测试文本分类器与SVM 17

3.3.1 SVM原理简介 17

3.3.2 SVM使用 18

3.3.3 数据集ICDAR2013 21

3.4 结果分析 21

3.5 章节小结 22

第4章 总结与展望 23

4.1 本文工作总结 23

4.2 工作展望 23

参考文献 24

致 谢 25

第一章 绪论

信息爆炸是21世纪一个鲜明的时代特征,纯文本信息已经不能满足人们的需要,有些信息更是“只可意会,不可言传”。图像已经逐渐取代纯文本信息,成为了人类获取信息、表达信息和传递信息类的重要手段。文本图像更是一种常见的载体。随着图片的复杂化,图片上的文本信息检测成为了研究的重要课题。

1.1 背景及意义

21世纪以来,人们的阅读工具更加的广泛,各种便携式摄像设备已经大众化(如:智能相机、手机、电脑笔记本、监控等),相应地,阅读的题材也方方面面,从以前的纯文字,到现在的图片、视频,人类使用这些设备从图片、视频中获得越来越多的信息。但是,由这些设备所产生的图像/视频的信息也呈现出爆炸式的趋势,使得人们接受到的垃圾信息也越来越多。各种自然场景信息中,图像/视频的信息中含量最多,而有些非常重要的文字信息需要从这种图像视频中获取,比如:路边停车、肇事逃逸车辆的车牌号码;商品的商标、名称;路边的指示牌;电影的字幕;建筑物的名称;以及图像/视频的内容简介等。因此,对于图片、视频中的文本检测和定位是非常有意义的。

一般把图像中的文本类型分为两类。一类是人工合成的,如图1.1(a)所示,它是指原本不存在于原始图像中,是一种人工添加的文本,即后期处理,比如,图像/视频中的标注、解释说明、中英文弹幕,新闻联播上的标题和解说词等等。这种文本处理是为了方便人类阅读和理解的,因而背景不复杂,文本鲜明,与背景相对比,其对比度和分辨率都比较高,字体圆润而清晰,大小基本固定,一般比较鲜明,是经典的文字识别的主要研究方向。另一类是自然场景的,如图1.1(b)所示,此时文字作为场景的一部分出现在图像中(比如路边停车、肇事逃逸车辆的车牌号、购买商品的名称、路边的指示牌、建筑物的名称等),和人工合成的不同,拍摄时,因拍摄站姿导致拍摄出的角度、光线不同,拍摄出来的图像照片也会不同,部分扭曲和遮挡等也会影响图像的处理,因而使得自然场景文本检测与定位的难度更大。

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图