基于python的数据处理系统构建与应用开题报告
2020-02-10 23:10:19
1. 研究目的与意义(文献综述)
1.1 选题的目的及意义
人工智能中首先包括知识工程,即根据已有的知识,利用规则解决问题。机器学习是人工智能的另一部分,也是核心技术,通过利用经验,建立统计模型、概率模型解决问题。是对某个实际问题建立计算模型,并利用已知的经验来提升模型效果的一类方法。当要处理和分析的数据中存在一定模式,想把其中的知识写成规则、形式化地确定下来,但无法一一穷尽时,就可以尝试使用机器学习的方法,将经验知识确定为一个模型,对输入进行处理[1]。
机器学习方法在大型数据库的应用称为数据挖掘。在数据挖掘中,需要处理大量的数据以构建简单有效的模型[1].数据科学可以被称为跨学科领域,有助于通过应用相关的数学、计算、科学方法从可用的广泛多维信息数据库(结构化,半结构化和非结构化)中提取有意义联系或模式见解[2],使用先进的分析平台和编程语言来处理不同规模和类型的大型数据库对于从相关数据中获得有意义的见解至关重要。这有助于在商业和研究领域内制定新战略或改进现有战略。随着数据数据科学的快速发展,各行各业的研究人员都可以通过众多的开源软件平台(anaconda等)及各类编程语言(matlab、python,r等),在自己的研究领域内应用机器学习等方法,更好地指导研究工作[3]。
2. 研究的基本内容与方案
2.1 研究目标
使用机器学习的方法,对车载数据进行数据分析,寻找各变量与目标变量之间的相关性,为优化车辆排放、车辆控制提供参考。
2.2主要内容
3. 研究计划与安排
第1周:开始毕业设计的英译汉和初步的文献查阅工作;
第5周:完成英译汉、文献综述报告和开题报告;
第6-7周:结合毕业设计任务书要求,进行文献查阅和归纳分析;
4. 参考文献(12篇以上)
1. 吕云翔,马连韬,刘卓然,张凡,张程博,《机器学习基础》,清华大学出版社。
2. kadiyala amp; kumar, applications of python to evaluate environmental data science problems, environmental progress amp; sustainable energy, 2017.no.6, 1580–1586。
3. kadiyala amp; kumar,applications of python to evaluate the performance of decision tree-based boosting algorithms,environmental progress amp; sustainable energy,2018.no.2,618-623。