基于患者评价的药物选择方法研究开题报告
2022-01-14 20:36:20
全文总字数:2757字
1. 研究目的与意义及国内外研究现状
在医药行业中,治疗同一疾病常常有多种药物,如何选择令人最满意的药物、如何在某些方面改进药物,成为药企和患者的一个重要问题。随着信息技术的提高,人工智能和机器学习技术也在不断发展,面对海量数据,人工筛选判别过于繁琐,我们可以引入机器学习中的随机森林算法对样本进行训练和预测。随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,并且其输出的类别是由个别树输出的类别的众数而定。他的准确度高、可以处理大量的输入变数、评估变数的重要性、学习过程迅速。本文通过研究患者对药品的评价及对该药物的满意度,建立药物评价模型,继而筛选出使患者更满意的药物,或者改进药物的某些方面使满意度提高,研究成果具有重要的理论意义和实际应用价值。1、理论上,研究药物的各方面因素对患者的满意度的影响程度,对于药物的开发以及药物的销售有重要理论价值;
2、从实际应用的角度,本研究的成果能够利用患者对药物的反馈数据得出患者对不同药物的满意度,促使药物公司选择满意度更高的药物生产或者改进药物,有效提高治疗效果。另一方面,这也可以帮助药物公司进行更好的决策,提升药物销量,有重大商业价值。
2. 研究的基本内容
本文面向医药行业,借助机器学习技术,我引入随机森林算法,有效利用药物评论数据集,建立患者评价和患者对药品满意度的关联模型。
本文采用uci网站提供的drugs.com数据集,是一份患者对于治疗多种不同疾病的多种不同药物的评价及满意度,包括6个变量,20万个样本。
论文内容安排如下:1、通过r软件对该数据集做处理,从患者的评论中提取特征信息,建立特征和满意度的矩阵。
3. 实施方案、进度安排及预期效果
第一部分绪论,首先对选题的研究背景与现实意义进行了展开说明,然后综述了国内外对药物的评价方法和随机森林算法的研究进展与现状,最后提出本文的写作框架与主要创新点。第二部分介绍了本文研究所用的方法的理论基础,主要包括随机森林、统计判别、机器判别。第三部分介绍数据集的来源及具体信息,通过R软件对该数据集做处理,从患者的评论中提取特征信息,建立特征和满意度的矩阵。利用特征筛选,对特征和难易度的关联程度进行排序,筛选出主要的特征。建立判别分类模型并检验模型的可靠性,优化模型。根据最终得到的依据药物评价建立的患者满意度模型,实际运用到药物的生产选择及改进中,以取得对患者更好的治疗结果及销售结果。第四部分结论与展望,对本文的所有研究进行了总结概括,同时指出本文还不够完善的地方,并进行合理的展望。进度安排及预期效果:2019.1.3前:填好任务书,指导老师审核通过2019.1.10前:写好开题报告,指导老师审核,完成开题2019.3.1前:查阅文献、确立指标、建立模型、数据实现,撰写论文初稿,并完成外文文献翻译2019.5.10前:完成中期检查,并完成论文定稿,对毕业论文进行检测,准备答辩。
4. 参考文献
[1] felix grer, surya kallumadi, hagen malberg, and sebastian zaunseder. aspect-based sentiment analysis of drug reviews applying cross-domain and cross-data learning[j]. in proceedings of the 2018 international conference on digital health (dh 18).2018:121-125.
[2]卡巴科弗.r语言实战[m].人民邮电出版社,2013.
[3]杨光,网爽.改进灰关联决策法及其应用[j].沈阳师范大学学报,2017:166-169.