慢性肾脏病的统计分析开题报告
2021-12-12 18:30:01
1. 研究目的与意义及国内外研究现状
现在,社会的工作相对于以前的工作发生了巨大变化。随着工业的发展,需要体力劳动的工作越来越少,很多工作都已被机器人取代,转而形成以脑力劳动为主的工作形式。但是我们发现突发急性病症明显减少,随之而来的是患慢性病的人群明显增多,慢性病成了人们亟需解决的问题。
本文旨在通过统计学中对于处理分类数据分析的方法,以论证慢性肾脏病的相关影响因素。对预防慢性肾脏病提出合理建议。
2. 研究的基本内容
本文对总共使用三种方法对与慢性肾脏病有关因素进行分析。其中,各种方法对缺失值处理和变量筛选运用了不同方法。
首先,运用聚类分析法分析出患病者的身体信息分类。然后,在logistic回归分析中,对数据采取简单删除法删除缺失样本,然后使用逐步回归法筛选变量,最后建立logistic模型,对模型检验并预测。由于存在缺失值将影响准确性,所以采用综合插补法插补缺失值后重新建立logistic模型。并对比简单删除法与综合插补法建立的模型有何不同。在判别分析中,首先使用lasso算法对变量进行筛选,并采取Fisher判别法对样本建立判别方程。对20个变量做聚类分析。在决策树分析中,对缺失数据采取简单删除法。
3. 实施方案、进度安排及预期效果
实施方案:
1、查阅相关资料,了解聚类分析,logistic模型、lasso算法、判别分析以及决策树
4. 参考文献
[1] 何晓群,刘文卿.应用回归分析(第三版).中国人民大学出版社,2011.1:235-245
[2] 邓集贤,杨维权.概率论及数理统计第四版下册.高等教育出版社,2009.2:26-114
[3] 魏强强.纵向数据有关模型研究:[硕士论文].宁夏大学,2008.4