主成分分析法与自动编码器技术及其在学生评价中的应用开题报告
2022-01-12 22:43:12
全文总字数:5370字
1. 研究目的与意义及国内外研究现状
随着我国高等教育规模的扩大,大学生数量不断增多,就业人数、考研人数等都在逐年增加。面对如此数量之多、质量参差不齐的学生,无论是企业还是高校导师,都需要对学生的综合能力进行评估评价,尽可能地发现并留下自己想要的人才。因此建立一个客观全面的评价方法模型对学生的综合能力进行评价,能够为企业和高校选拔优秀人才提供重要的参考。
综合评价是对学生全面的客观的观察、记录、分析,目前国内大部分高校均采用的是分析评价体系,将学生的综合能力分为几个一级指标,然后将一级指标细化为可衡量的项目,逐项评分。在逐项评分后,通过加权加总的方式给出评价的分数结果。从综合能力的评价指标上来看,目前的高校评价指标体系仅局限于一些硬指标如成绩奖项等,指标体系还不够客观全面。另一方面,人为地设置权重,通过对指标加权加总的方式,也有一定的主观性。
从1956年美国达特茅斯会议首次提出“人工智能”的概念,到如今新一轮科技革命和产业变革方兴未艾,算法、大数据、5g等为公众所熟知,“人工智能”正在全球范围内蓬勃兴起,成为科技创新的“超级风口”。当前,教育和信息技术的融合,催生出海量的多元的有价值的大数据,当这些大数据与机器学习结合,将深度地挖掘教育数据背后的本体共生的表征价值以及交互产生的关联价值。这样势必引发机器学习与学习评价的结合,使基于人工智能开展综合评价成为未来趋势。不同于传统的综合评价,机器学习支持下的综合评价是将现代信息的技术嵌入到学习的全过程,对学习活动的信息流和运行轨迹作出合理的观测、解释和反馈。利用机器学习,处理数据的混杂性并关注数据之间的隐含关系,用客观的数据说话,对学生进行真实客观的评价,并通过数据,能够得到哪些方面是值得引起注意,有利于学生改进和提高。
2. 研究的基本内容
本研究介绍主要的两种降维技术:主成分分析法和自动编码器。
主成分分析也称为卡尔胡宁-勒夫变换(karhunen-loeve transform),是一种用于探索高维数据结构的技术。pca通常用于高维数据集的探索与可视化。还可以用于数据压缩,数据预处理等。pca可以把可能具有相关性的高维变量合成线性无关的低维变量,称为主成分( principal components)。新的低维数据集会经可能的保留原始数据的变量。
自动编码器是一种无监督的神经网络模型,它可以学习到输入数据的隐含特征,这称为编码(coding),同时用学习到的新特征可以重构出原始输入数据,称之为解码(decoding)。从直观上来看,自动编码器可以用于特征降维,类似主成分分析pca,但是其相比pca其性能更强,这是由于神经网络模型可以提取更有效的新特征。除了进行特征降维,自动编码器学习到的新特征可以送入有监督学习模型中,所以自动编码器可以起到特征提取器的作用。
3. 实施方案、进度安排及预期效果
2018年12月-2019年1月15日:进行机器学习方面知识的学习,安装matlab同时熟知环境的操作流程;
2019年1月16日-2019年2月15日:大量阅读数据降维方面的论文,理解主成分分析法和自动编码器原理算法。
2019年2月16日-2019年3月15日:使用matlab语言编写代码,初步实现主成分分析法和自动编码器算法。
4. 参考文献
[1]张田昊. 数据降维算法研究及其应用[d].上海交通大学,2008.
[2]蒋胜利. 高维数据的特征选择与特征提取研究[d].西安电子科技大学,2011.