基于MapReduce的K-means聚类算法并行实现任务书
2020-02-18 15:56:29
1. 毕业设计(论文)主要内容:
随着近几年互联网和移动互联网的高速发展,我们也将跨入一个数据爆炸的时代。
而数据量的急剧增长对传统的数据挖掘算法提出了新的挑战。
因此如何在大数据环境下高效准确地挖掘出数据中的有价值的信息成为了一个亟需解决的问题。
2. 毕业设计(论文)主要任务及要求
1.查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成至少1500字开题报告;
3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
4.完成系统的编码与调试;
5.完成10000字以上的毕业论文;
6.进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
(1)2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2019/5/1—2019/5/25:撰写及修改毕业论文;
(4)2019/5/26—2019/6/5:准备答辩。
4. 主要参考文献
1. Hartigan, John A., and Manchek A. Wong. "Algorithm AS 136: A k-means clustering algorithm." Journal of the Royal Statistical Society. Series C (Applied Statistics) 28, no. 1 (1979): 100-108.
2. Wu, Xindong, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Geoffrey J. McLachlan et al. "Top 10 algorithms in data mining." Knowledge and information systems 14, no. 1 (2008): 1-37.
3. Kantardzic, Mehmed. Data mining: concepts, models, methods, and algorithms. John Wiley amp; Sons, 2011.
4. 韩家炜, 坎伯. "数据挖掘: 概念与技术." 北京机械工业出版社,2001.
5. 周爱武, 于亚飞. "K-Means 聚类算法的研究." 计算机技术与发展 21, no. 2 (2011): 62-65.