基于深度学习的图像识别技术研究及其应用文献综述
2020-04-30 16:14:43
通过对人工神经网络的深入研究产生了深度学习的概念,动机在于建立模拟人脑进行分析学习的神经网络。深度学习是经过观察组合低层特征来得到抽象的高层表示属性类别或特征,包含多隐层的多层感知器就是其中一种结构,用发现数据的分布式特征来表示。
深度学习在诸多领域的应用都取得了十分巨大的成就,例如自然语言处理、计算机视觉、图像、语音、自然语言处理等,是近十年来在人工智能领域取得的重要突破。已有的深度学习模型都是属于神经网络范畴的。通常用到的神经网络包含大量的参数,常常发生过拟合问题,所以神经网络有着很大的缺点,在训练集上神经网络的识别结果准确率很高,但是运用在测试集上时效果却很差。
20世纪50年代初期计算机科学之父、人工智能之父图灵就已经提出了隔墙对话的概念:通过计算机模拟人的大脑来与人就行交流,让第三者无法辨别人类与电脑对话的差别。但是随着人们对人工智能领域的深入研究,在短时间内却远没有人们想要的结果,发展十分缓慢。
20世纪80年代,保罗韦伯斯(Paul Werbos)首先提出了采用反向传播法来训练一般的人工神经网络,人工神经网络反向传播算法就此诞生,这是一种新的无需人工制定规则的方法,而是让计算机在大量训练样本中寻找统计规律,与以前所用的的方法相比较,其在很多方面有着明显的优势。但是神经网络其本身只含有一个隐含层,是一种浅层学习模型。随后,人工神经网络反向传播算法进一步被杰弗里·辛顿(G. Hinton)、燕·勒存(Y. LeCun)等人应用于训练具有深度结构的神经网络,并且在1980年,杰弗里·辛顿提出采用含有多个隐含层的深度结构来代替代单层结构,多层感知器模型(Multi_Layer Perceptron)就此而产生,其也是出现最早的一种深度学习网络模型。然而在1990年以后,由于最大熵方法、SVM等一些模型在理论和实践方面有着很大的优势和应用性,让当时对人工神经网络领域的研究与发展遇到阻碍。
20年代初期,深度学习的宗师,杰弗里·辛顿在《Science》和相关期刊上发表了论文,阐述了两个重要思想:其一、隐含层层数增加可以使网络学习能力增强,学到的特征更贴近物体本身;其二、多层神经网络系统训练时间长,训练难度大,但是如果每一层单独训练,训练的难度和时间都有改善。其中杰弗里·辛顿提出每一层的“单独训练”都是无监督学习,首次提出了深度信念网络的概念。
随后,杰弗里·辛顿的思想就受到科研机构、工业界的高度关注。从2009年开始,微软亚洲研究院的语音识别专家们和深度学习领军人物杰弗里·辛顿合作。2011年,谷歌研究院和微软研究院的研究人员先后将深度学习应用到语音识别,识别率达到了 70-80%,其成果对语音识别领域已有的技术框架产生了根本性质的改变。2012年,在图片分类比赛ImageNet中杰弗里·辛顿的学生将深度学习应用在图像识别中打败了Google团队,使得图片识别错误率下降了14%。其后各个国家和地区纷纷建立相关研究机构,希望在人工智能上有所突破。如今,深度学习已经在图像与视频分析、语音识别、自然语言处理、CTR预估、大数据特征提取等方面获得广泛的应用。
当然,深度学习的发展任然有着巨大的挑战,人脑的机制是十分复杂的,有着很多未知的地方需要发现,所以对人脑神经元传递信息和神经中枢处理信息的原理和构造的进一步深层次剖析,将帮助我们设计出更加合理和有效的算法。深度学习对整个世界来说不亚于一场科技的革命,对着语音与图像识别的正确率有着直接的提升,数据智能化将信息产业与搜索引擎变得更为重要,如今计算机已经遍布各个行业,它的影响将随着计算机对以互联网相关的产业产生巨大的变化。
{title}2. 研究的基本内容与方案
{title}了解深度学习的发展和研究现状,学习图像识别技术的基本原理和步棸。
研究深度学习的概念和结构,学习深度学习常用的方法,着重研究深度学习最常用的两种方法:1.卷及神经网络(CNN),卷积神经网络是一种特殊的深层神经网络模型,它的特殊性体现在两个方面,一方面它的神经元间的连接是非全连接的,另一方面同一层中某些神经元之间的连接的权重是共享的(即相同的)。它的非全连接和权值共享的网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量;2.深度信念网络(DBN),深度信念网络(DBN)由多层神经元构成,这些神经元又分为显性神经元和隐性神经元。显性神经元用于接受输入,隐性神经元用于提取特征。因此隐性神经元也有个别名,叫特征检测器。最顶上的两层间的连接是无向的,组成联合内存。较低的其他层之间有连接上下的有向连接。最底层代表了数据向量,每一个神经元代表数据向量的一维。 学习关于比较新的两种理念的结合:卷积深度信念网络(CDBN),知道不同方法的优点和在不同方面的应用。
了解深度学习在图像识别上的一些应用。主要为了研究基于深度信念网络的人脸识别比较新的技术LBP-DBN,学习LBP(局部二值模式)原理和作为实现特征提取的原因与优点。最后学习编写人脸识别算法,选取一些人脸图片放入大量其他图片数据库中,应用MATLAB实现图像识别分类,并对实验结果进行分析,深入了解算法,与其他人脸识别结果相比较得出结果分析。
您可能感兴趣的文章
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- .NET MVC框架在开发农业资源清单系统中的适应性外文翻译资料
- 使用Java平台针对数据库桥接层的Spring框架可靠性调查外文翻译资料
- 基于MVC架构的数据库和Web应用程序外文翻译资料
- 利用微服务SpringBoot 设计和开发公众投诉系统的后端应用。外文翻译资料
- 基于SSM框架的校园自行车租赁管理系统统计外文翻译资料
- 基于Android的校园交友社交应用的设计与开发外文翻译资料
- 基于Android的在线社交系统服务端的设计与实现外文翻译资料
- 基于Spring-boot微服务框架的学生成绩分析系统的设计与实现外文翻译资料
- 用于生成计算材料科学文献中使用的方法和参数的数据库的自动化工具外文翻译资料