基于流形学习理论的特征提取方法任务书
2021-12-12 18:30:27
1. 1. 毕业设计(论文)的内容、要求、设计方案、规划等
流形学习的目的是在不依赖诸多先验假设(如观测变量之间相互独立,分布近似正态等)的情况下,直接寻求隐藏在高维观察空间中的低维非线性数据结构与性质,完成或协助完成数据挖掘、机器学习、模式分类等各项任务。目前,流形学习主要集中在非监督学习领域。非监督学习要解决的问题可分为两大类:一是寻找可靠的特征提取函数,提取数据集的可靠特征,并且在面临未见过的数据时保持特征稳定。解决此问题的非监督学习通常称为特征提取;二是寻找对数据集的描述模型,即建立数据分布模型(可能是非常粗糙的)。流形学习在这两方面均有涉及。等容映射(isomap)和局部线性嵌入(lle)是最常用的两种非监督流形学习方法。isomap 算法主要使用近邻图中的最短路径得到近似的测地线距离,代替了不能表示内在流形结构的euclidean 距离,进而发现嵌入在高维空间的低维坐标。lle算法能够实现高维输入数据点映射到一个全局低维坐标系, 同时保留了邻接点之间的关系,这样数据样本固有的几何结构就能够得到保留。这两种方法通过数据样本两两之间的关系来体现数据流形的性质。首先,数据集的局部性质通过样本的邻域结构信息来体现,即体现在样本之间的近邻关系上。其次,数据集的全局性质体现在不相邻的样本之间的关系上(如isomap中两样本之间的流形距离)。而这种全局性质,也通过局部性质(即样本之间的近邻关系)来体现。这种思想体现了流形理论的基本思想,且不依赖于对数据流形的任何概率假设,也对数据集的先验知识依赖较少,体现了流形学习思想的精要。同时,由于流形的结构表现为数据点两两之间的关系,从而可以用一个矩阵(邻接矩阵)表示。这使得流形结构的表示变得简单,从而有利于算法的构造。这两种方法是寻找数据在低维空间中的表示,而不构造具体的非线性映射或流形。
基于流形学习理论, 本课题研究二种新的无监督的鉴别投影方法。基于图像矩阵双方向的无监督鉴别投影((2d)2udp)和基于图像矩阵双方向的最大间距鉴别投影((2d)2 mdp)。这种新的方法通过邻接图来考虑高维图像空间中流形结构的。这二种鉴别投影主要是依据相应鉴别准则,针对图像矩阵的行方向和列方向同时进行维数压缩,从而得到相应的特征矩阵。通过在orl和ar人脸库上进行实验, 表明提出的(2d)2udp和(2d)2mdp在识别率方面的优劣。
具体要求:
2. 参考文献(不低于12篇)
1.边肇祺,张学工. 模式识别(第二版). 北京: 清华大学出版社,1999
2.何力, 张军平, 周志华. 基于放大因子和延伸方向研究流形学习算法. 计算机学报, 2005,28:2000--2009
3.郭跃飞, 黄修武, 杨静宇等, 一种求解fisher最佳鉴别矢量的新方法及人脸识别, 中国图象图形学报, 1999, 4(a) 2: 95-98.
您可能感兴趣的文章
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- .NET MVC框架在开发农业资源清单系统中的适应性外文翻译资料
- 使用Java平台针对数据库桥接层的Spring框架可靠性调查外文翻译资料
- 基于MVC架构的数据库和Web应用程序外文翻译资料
- 利用微服务SpringBoot 设计和开发公众投诉系统的后端应用。外文翻译资料
- 基于SSM框架的校园自行车租赁管理系统统计外文翻译资料
- 基于Android的校园交友社交应用的设计与开发外文翻译资料
- 基于Android的在线社交系统服务端的设计与实现外文翻译资料
- 基于Spring-boot微服务框架的学生成绩分析系统的设计与实现外文翻译资料
- 用于生成计算材料科学文献中使用的方法和参数的数据库的自动化工具外文翻译资料