稀疏编码在自然图像特征提取中的应用开题报告
2021-03-11 21:58:36
1. 研究目的与意义(文献综述)
在当今这个大数据时代,我们面临的一个重要问题是:如何高效地处理这些数据?稀疏编码(sparse coding)就是一个比较流行而有效的方法。稀疏编码是一种模拟哺乳动物视觉系统主视皮层v1区简单细胞感受人工神经网络方法。该方法具有空间的局部性、方向性和频域的带通性,是一种自适应的图像统计方法。稀疏编码算法是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据。超完备基的好处是它们能更有效地找出隐含在输入数据内部的结构与模式。稀疏编码算法的目的就是找到一组基向量 ,使得我们能将输入向量 表示为这些基向量的线性组合:
虽然形如主成分分析技术(pca)能使我们方便地找到一组“完备”基向量,但是这里我们想要做的是找到一组“超完备”基向量来表示输入向量(也就是说,k gt; n,基向量的个数比输入向量的维数要大)。超完备基的好处是它们能更有效地找出隐含在输入数据内部的结构与模式。然而,对于超完备基来说,系数 ai 不再由输入向量 唯一确定。因此,在稀疏编码算法中,我们另加了一个评判标准“稀疏性”来解决因超完备而导致的退化(degeneracy)问题。
近年来,许多神经生理学家在视觉系统上已展开了全面深入的研究,并且取得了一些有重要意义的研究成果。这就使得在工程上利用计算机来模拟视觉系统成为可能。基于这一认识,利用已有的生物学科研成果,联系信号处理、计算理论以及信息论知识,通过对视觉系统进行计算机建模,使计算机能在一定程度上模拟人的视觉系统,以解决人工智能在图像处理领域中碰到的难题。神经稀疏编码算法正是这样一种建模视觉系统的人工神经网络方法。这种算法编码方式的实现仅依靠自然环境的统计特性,并不依赖于输入数据的性质,因而是一种自适应的图像统计方法。
2. 研究的基本内容与方案
本次毕业设计的基本内容有:了解稀疏编码乃至人工智能的概念、理解稀疏编码的工作机制、描述其底层的数学原理、使用matlab或其他软件实现一种用于自然图像特征提取算法,从而初步具备通过机器学习来模拟大脑提取特征的能力
方案步骤:
(1) 通过查阅文献和搜集相关资料,介绍稀疏编码的基本原理,总结常用方法,并完成与毕业设计相关的外文文献翻译。
3. 研究计划与安排
2016.12-2017.02 查阅稀疏编码的相关资料、撰写开题报告、翻译英文资料。2017.02-2017.04 学习稀疏编码算法并开始在matlab或其他软件上实现。
2017.04-2017.05 完成算法在matlab或其他软件上的实现,然后分析、调试并完善实验结果。
2017.06-2017.07 撰写毕业论文并完成答辩。
4. 参考文献(12篇以上)
[1] 尚丽.稀疏编码算法及其应用研究[d].中国科学技术大学, 2006.
[2] 尚丽,郑春厚.基于稀疏编码的自然图像特征提取及去噪[j].系统仿真学报,2005, 17(7):1782-1784.
[3] 边肇祺,张学工.模式识别(2版)[m]. 北京:清华大学出版社,2000.