基于自闭症儿童数据集的分类算法研究开题报告
2022-01-07 22:05:20
全文总字数:2205字
1. 研究目的与意义及国内外研究现状
自闭症谱系障碍(asd)是一种大脑神经发育障碍,伴随着智力障碍、言语障碍、运动协调障碍、情感障碍,同时有多动症、重复行为等症状。事实上,它的病因与遗传和神经因素有关。尽管asd有其遗传根源,但主要通过社交互动,想象能力,重复行为和沟通等行为指标进行诊断。与其他婴儿组相比,asd儿童在早期发育上遇到了更为严重的困难,影响早期学习以及与他人交往。
绝大多数asd诊断都依赖手工制定的规则,这些规则使用分数的数学总和公式来提出适当的诊断。因此,除了准确性之外还需要专家或临床医师的评估。更重要的是,大多数现有的asd诊断工具需要大量的时间才能产生完整的诊断结果,并且程序不符合成本效益。表明,家长参与早期治疗的干预会对长期的学术发展产生层次影响。说明早期诊断可以显着减少这些疾病。随着我国asd儿童病例数日益增多,因此,时间效率高且易于实施的asd筛查方法具有统计学意义,且能够帮助专业人员并告知个人他们是否应该进行正式的临床诊断。
为了改善asd的诊断过程,本文主要目的是提高病例的诊断时间,提供更快速的筛查服务,改善诊断准确性,并降低输入数据集的维度,以确定asd的最高排名特征。同时,对数据集进行判别分析,快速地判别出是否患病。
2. 研究的基本内容
本文利用加州大学欧文分校(UCI)提供的292个自闭症儿童数据为研究对象,着重研究了三种典型的机器学习分类算法:K近邻算法、C5.0决策树算法、支持向量机和。在进行特征选取后,然后分别建立K近邻模型、C5.0决策树、支持向量机,模拟得到分类预测结果。
3. 实施方案、进度安排及预期效果
实行方案:
通过查阅书籍、期刊及网络上的一些共享资源,在老师、同学的帮助指导下,运用所学的统计软件完成数据的处理。
进度:
4. 参考文献
[1] 鲁明辉.自闭症谱系障碍共病研究现状与启示[j]. 现代特殊教育,2015,(1): 34-39
[2]kim sh c lord vhbal. longitudinal follow-up of academic achievement in children with autismfrom age 2 to 18 [j].child psychol psychiatry, 2018 mar;59(3):258-267.
[3]桑应宾. 基于k近邻的分类算法研究[d]. 重庆大学,2009:5-14