基于自编码器的图像特征提取算法设计与实现开题报告
2020-02-18 19:26:46
1. 研究目的与意义(文献综述)
图像特征提取在智能识别等领域中起着重要的作用,是图像处理和识别的基础步骤。在计算机中,图像按照有序的多维矩阵进行存储,通过颜色可将图片分为两类:一类是用二维数组存储像素值的灰度图片,另一类是用三维数组存储三个通道颜色的像素值的彩色图片。当图像的数目较少时,能够利用矩阵作为图像的特征进行一些需要的操作,但是在实际的应用场景中,数据量是非常庞大的,如果直接用图像的存储矩阵作为图像特征来进行各类运算处理,则将会浪费大量的存储空间和计算资源。所以,根据人们的经验,数据中存储的巨大信息量对于计算机来说也并不是都需要的,会有一定的信息冗余。因此就能够通过一定的方法来对图像降维,也称为从图像中提取特征。因为只保留了图像中的重要特征信息,所以能够利用特征值对图像进行更多的操作和进一步处理。利用图像特征进行运算,明显降低了存储和运算复杂度。传统的图像特征提取主要是根据特定的目人为的设计特定的算法将图片转化为一定维度的数据进行表示。随着机器学习的出现和不断发展,使图像处理有了新选择,提高了效率,为图像特征提取提供了更好的方法。使用自编码器(autoencoder)就为图像的特征提取提供了更好的解决方案。
自编码器是神经网络的一种,1986年由rumelhart提出,是一种无监督学习方法,使用了反向传播算法,目标是使输出和输入尽可能相等。自编码器内部有隐藏层,可以产生编码表示输入。自编码器目前已成功的应用在降维和信息检索任务中。降维是表示学习和深度学习的第一批应用之一。它是研究自编码器早期驱动力之一。例如,hinton and salakhutdinov (2006) 训练了一个栈式rbm,然后利用它们的权重初始化一个隐藏层逐渐减小的深度自编码器,终结于30个单元的瓶颈。生成的编码比30维的pca产生更少的重构误差,所学到的表示更容易定性解释,并能联系基础类别,这些类别表现为分离良好的集群。因此此次设计将采用自编码器的方式对图像进行处理,而自编码器主要作用在于通过复现输出而捕捉可以代表输入的重要因素,利用中间隐层对输入的压缩表达,达到像pca那样的找到原始信息主成分的效果。
设计的意义是(理论或实际):
2. 研究的基本内容与方案
2.1研究目标
利用python开发语言,完成基于自编码器的图像特征提取算法设计与实现。图像特征提取在图像识别和处理领域中应用广泛,是图像处理、分类和识别的基础步骤。通过研究图像特征提取可以为图像处理领域提供一些更好的处理方法,解决一些基本的、共性的问题。将自编码器应用于图像特征提取中,由于它是一种无监督学习方法,使用了反向传播算法,目标是使输出和输入尽可能相等,所以就可以对自编码器进行训练,利用中间隐层对输入进行压缩表达,通过复现输出而捕捉可以代表输入的特征信息,达到像pca那样的找到原始信息主成分的效果。这样就可以利用计算机构建一个自编码网络,提取图像特征,并使用特征重新构建图像,使图像处理更加节省时间和精力,提高工作效率。
2.2研究内容
3. 研究计划与安排
第1周:搜集资料,撰写开题报告;
第2周:搜集资料,撰写开题报告;
第3周:学习python和开发环境的使用;
4. 参考文献(12篇以上)
1.周志华,机器学习,清华大学出版社,2016
2.尚敬文等,基于深度稀疏自动编码器的社区发现算法,软件学报,2017
3.黄永昌等,scikit-learn机器学习——常用算法原理及编程实战,机械工业出版社,2018