基于Hadoop的台称计量数据分析任务书
2020-06-23 21:00:18
1. 毕业设计(论文)的内容和要求
为更好地维护市场经济秩序,进一步推动流通领域计量管理工作的开展,保护消费者合法权益,计量部门连续多年对该类产品进行监督抽查,本文结合监督抽查的结果,利用大数据处理平台重点分析市场流通中台秤的产品质量情况。
对大数据挖掘、数据分析、数据可视化进行学习研究,利用hadoop平台,以及spark从获取的数据抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
在初期可以根据已知台秤质量差异的情况下,通过数据挖掘来验证使用模型是否正确,能够正确反应实际数据的真实情况。然后利用不同的数据分析算法,从多个维度去分析台秤计量数据的质量,将不同的分析结果进行汇总分析可视化,最后对仪器质量进行较为合理、全面的评价。
2. 参考文献
[1] 罗锋. 流通领域电子计价秤产品质量分析[j]. 宁波市计量测试研究院,2017.
[2]陈炎龙、段红玉.基于改进hadoop云平台的海量文本数据挖掘[a].湖南师范大学自然科学学报2016.
[3] 王准.基于hadoop云平台的海量数据挖掘方法 [a].广州工商学院 2016.
3. 毕业设计(论文)进程安排
2017.11.21- 2017.12.20 |
选题,参阅参考资料,了解毕设的相关内容 |
2017.12.21- 2018.1.10 |
写开题报告 |
2018.1.11- 2018.2.15 |
开发环境的搭建,做好系统开发的准备工作 |
2018.2.16- 2018.4.20 |
系统的开发 |
2018.4.21- 2018.5.31 |
系统的调试、改进,开始写论文 |
2018.6.1-2018.6.4 |
系统最后测试,论文的撰写 |
2018.6.5 |
软件答辩 |
2018.6.6- 2018.6.11 |
完善论文,交给指导老师初审,并最终定稿 |
2018.6.12- 2018.6.13 |
准备答辩,完成答辩ppt |
2018.6.14 |
论文答辩 |