基于随机森林的文本分类研究应用任务书
2020-07-01 20:48:31
1. 毕业设计(论文)的内容和要求
1、搜集相关文本分类数据,了解文本分类数据的相关特点。
3、熟悉r语言统计分析软件的使用。
4、会对数据进行前期的预处理,熟悉决策树和随机森林的相关算法的具体公式和代码,了解该算法在本文分类方面的具体运用。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 参考文献
[1]方洪鹰. 数据挖掘中数据预处理的方法研究[d]. 重庆:西南大学, 2009。
[2]卓佳,廖廷悟. 浅谈数据预处理理论[j]. securities futures of china, 2010(9)。
[3]黄文,王正林. 数据挖掘-r语言实战[m]. 电子工业出版社, 2014。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 毕业设计(论文)进程安排
1、2018年1月,开题。
2、2018年2月,调研搜集数据;查阅国内外期刊资料,了解随机森林算法在文本分类上的具体应用。
3、2018年3月,熟悉rstudio的使用,确定课题的核心算法,并进行优化设计。
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付