基于大数据挖掘的新能源汽车主要指标现状分析毕业论文
2021-11-26 23:35:42
论文总字数:27764字
摘 要
大数据的应用日渐广泛,新能源汽车在生产、销售及使用过程中也在无时无刻产生各种各样且数量巨大的数据,而大数据与新能源汽车行业相结合也是未来汽车行业重点研究发展的方向。因此,本文基于大数据挖掘对新能源汽车的主要指标、技术现状及市场情况等进行研究。
首先,本文基于主流汽车门户网站上的新能源汽车指标数据,根据新能源汽车的特点,确定了11个技术指标以及8个市场数据或者车型类别指标共19个新能源汽车的主要指标,并根据11个技术指标建立相应的技术指标体系,包括续航能力指标体系、动力性指标体系等共4个技术指标体系,并根据不同的技术指标体系预测其作用。
其次,运用python技术对主流汽车门户网站上的新能源汽车指标数据进行爬取,主要步骤则包括获取网页源代码、解析网页源代码并将数据存储到MySQL数据库中。利用定义ODBC数据源的方式将数据导入SPSS进行数据预处理,包括数据整理等,再进行数据挖掘,包括聚类分析及相关性分析了解新能源汽车的技术现状、各指标体系内部的相关性及指标体系间的相关性。
最后,对新能源汽车部分主要指标的描述统计现状进行分析,包括环保标准、能源类型、车型级别,对新能源汽车主要指标中的用户评分以及年销量进行社会效益分析,并提出新能源汽车行业现有的不足,并对新能源汽车的未来发展提出建议。
本文利用大数据挖掘得到的新能源汽车主要指标数据背后的价值可以了解新能源汽车行业的技术现状、市场情况及不足,为新能源汽车未来发展提供建议。
关键词:新能源汽车,大数据挖掘,社会效益,指标体系,数据爬取
Abstract
The application of big data is becoming more and more widespread. New energy vehicles are also producing various and huge amounts of data all the time in the production, sales and use process. direction. Therefore, based on big data mining, this paper studies the main indicators, technical status and market conditions of new energy vehicles.
First of all, based on the new energy vehicle index data on the mainstream automobile portal website, this article determines 11 main technical indicators and 8 market data or model category indicators, a total of 19 new energy vehicle main indicators according to the characteristics of new energy vehicles, and according to 11 technical indicators establish corresponding technical index systems, including endurance capability index system, dynamic index system and other systems, and predict their role according to different technical index systems.
Secondly, using python technology to crawl the new energy vehicle index data on the mainstream car portal website, the main steps include obtaining the webpage source code, parsing the webpage source code and storing the data in the MySQL database. Use the method of defining ODBC data sources to import data into SPSS for data preprocessing, including data sorting, missing value processing and outlier processing, and then data mining, including cluster analysis and correlation analysis to understand the technical status of new energy vehicles, various The correlation within the indicator system and the correlation between the indicator systems.
Finally, analyze the descriptive statistical status of some main indicators of new energy vehicles, including environmental standards, energy types, model levels, social benefit analysis of user ratings and annual sales in the main indicators of new energy vehicles, and propose the new energy vehicle industry Existing deficiencies and make recommendations for the future development of new energy vehicles.
This article uses the value behind the main indicator data of new energy vehicles obtained by big data mining to understand the current status and deficiencies of the new energy vehicle industry and provide suggestions for the future development of new energy vehicles.
Key words: New energy vehicles, big data mining, social benefits, index system, data crawling
目 录
摘 要 III
Abstract IV
第1章 引言 1
1.1 研究的目的及意义 1
1.2 国内外研究现状及发展趋势 1
1.3 研究内容及方法 2
第2章 新能源汽车的主要指标及其体系 5
2.1 新能源汽车主要指标的选取 5
2.2 主要技术指标体系的建立 7
2.3 主要指标体系的作用 8
2.4 本章小结 9
第3章 主要指标的数据挖掘 10
3.1 基于python的数据爬取 10
3.2 基于SPSS的主要指标数据挖掘 13
3.3 本章小结 24
第4章 主要指标的统计现状及社会效益分析 25
4.1 主要指标的描述统计现状 25
4.2 主要指标的社会效益分析 25
4.3 新能源汽车的现有问题及发展建议 27
4.4 本章小结 27
第5章 总结与展望 28
5.1 总结 28
5.2 展望 28
致谢 29
参考文献 30
第1章 引言
1.1 研究的目的及意义
新能源汽车包含纯电动汽车、插电式混合动力汽车与增程式电动汽车等。面对日益严峻的环境污染与能源短缺问题,发展新能源汽车是我国汽车行业面对环境与能源问题日益严峻的情况下最有潜力的未来发展趋势。新能源汽车对比于传统的内燃机汽车,整车架构更为简洁,排放更为环保,整车产生的噪声更低,作为新能源汽车动力来源的电动机的效率更高。
国家在过去几年里出台了许多关于新能源汽车补贴的政策来推动新能源汽车行业的发展,由于新冠肺炎疫情的影响,新能源汽车市场在2020年初受到极大的冲击,2020年3月31日的国务院常务会议上提出了将新能源汽车购置补贴和免征购置税政策延长两年。新能源汽车补贴政策对新能源汽车的技术指标有一定的要求,所以新能源汽车的生产厂商及用户着重关注新能源汽车的纯电续航里程、充电时间、电池能量等技术指标。本文也依据汽车门户网站上的数据确立了新能源汽车的11个主要技术指标及8个市场数据或车型类别共19个新能源汽车主要指标来对新能源汽车的现状进行研究。
随着大数据时代的到来,新能源汽车的方方面面也在不停的产生大量相关的数据。本文则基于大数据挖掘,利用python网络爬虫技术对门户网站上共267款在售新能源汽车的11个主要技术指标与8个市场数据或车型类别指标进行数据爬取,使用聚类分析及相关性分析等数据挖掘技术对爬取所得的数据进行数据挖掘,了解在售的267款新能源汽车的技术现状及市场情况,基于新能源汽车主要指标的数据挖掘的结果来对新能源汽车进行现状分析,指出新能源汽车发展现状的不足并根据不足给出相应的新能源汽车行业未来发展的建议,以期为国内新能源汽车的未来发展方向提供一定的数据分析支撑和理论基础。
1.2 国内外研究现状及发展趋势
大数据,即大量的数据,不仅只是数量庞大,大数据还具有规模性、多样性等共四种独特的属性。随着物联网,数据库等技术的蓬勃发展,大数据的时代已经拉开帷幕。据研究估计,在2020年全球的数据量约为2008年数据量的79.6倍。近年来数据库技术的提升、传感器等感知式系统的普遍运用、计算机的运算速度能力的提升以及Spark等软件的广泛应用,获取数据的方式越来越多,蕴含在海量数据中的价值也在不断地被各种技术方式挖掘出来,展现在世人面前。
大数据技术应用在新能源汽车上的许多方面,涵盖了新能源汽车生产、销售、使用及售后服务四大环节,包括安全预警及管理、车辆运行状态监测管理及统计、电池动力性能估计、续航里程的预测、动力电池系统的运行管理以及城市充电桩的分布及运行管理等。
在国外,美国与欧盟都颁布一系列与大数据领域相关的政策并采取具体措施来发展大数据技术。各大传统车企如奥迪、宝马等以及各大科技企业都在推进大数据技术在生产研发环节上的应用来寻求产品更新换代、商业模式的革新以及数字化服务能力的提升的机会。例如,美国福特汽车公司的Sync,谷歌公司的开放汽车联盟以及苹果公司的Carplay。大数据挖掘技术在欧洲也有应用到电动城市交通发展、道路安全数据挖掘及分析、实时充电站或充电桩推荐还有GPS数据挖掘分析等间接与新能源汽车行业相关的其他领域。
我国也在政策方面高度重视大数据技术的应用及发展,国务院早在2015年印发了《促进大数据发展行动纲要》,2017年工信部则印发了《大数据产业发展规划(2016-2020年)》,以期在2020年大数据产业得到较大的发展。在大数据与新能源汽车相结合应用方面,国内基于大数据建立了一个具有分布式系统特征的多任务联盟网络,有学者提出了面向大数据的新能源汽车复杂联盟的云评价方法,利用了大数据研究建设新能源公交车大数据的决策支持平台等,还有许多学者及研究人员通过大数据挖掘来确定分析新能源汽车的运行工况(含电池状态,续航里程等)。大数据技术在新能源汽车行业上也得到了具体的应用,展现了其良好的应用前景及发展潜力,也是汽车行业未来发展转型升级的重点突破方向之一。
1.3 研究内容及方法
1.3.1 研究内容
本文将采用文献查阅分析法、网络调查法、数据爬取及大数据挖掘等方法收集文章研究的资料,根据门户网站上的数据确立了11个主要技术指标与8个市场数据及车型类别指标,针对主要技术指标建立主要技术指标体系并对指标体系的作用进行叙述,爬取并挖掘新能源汽车主要指标数据的价值,对其进行分析,了解在售的新能源汽车的技术状况及市场情况,对未来新能源汽车的发展提出一些建议。
具体研究内容包括:阐述本文的研究目的、意义,对国内外大数据的发展、大数据在新能源汽车的应用及发展趋势进行叙述,点明全文的研究内容及方法,构建全文的脉络及技术路线。基于汽车门户网站上的数据,选取11个新能源汽车的主要技术指标及8个市场数据及车型类别(工信部纯电续航里程、电池能量、能源类型等),并阐述选取的理由及指标内容。构建新能源汽车主要技术指标的指标体系,根据市场数据,预计新能源汽车主要技术指标的作用。利用python软件对门户网站通过定制Requests BeautifulSoup两大模块进行数据爬取,获取并解析汽车门户网站的html代码来获取所需要的信息后将其储存到数据库中。数据挖掘则先设计数据挖掘的整体方案,对数据进行预处理后,将新能源汽车的主要技术指标通过聚类分析技术与相关性分析进行数据挖掘,并得到数据挖掘的结果。基于数据挖掘的结果对其进行社会效益分析,得出在售新能源汽车的技术现状与市场情况。最后针对全文的研究结果,了解在售267种新能源汽车的技术现状及市场情况,指出现阶段新能源汽车的问题,针对新能源汽车未来发展方向提出建议,并根据本文研究的不足进行总结与展望。
1.3.2 研究方法
本文运用了文献查阅分析法、网络调查法、数据爬取法及大数据挖掘法。利用文献查阅分析法,对新能源汽车的大数据应用现状及文章研究利用数据爬取法来对本文的研究数据进行获取收集,了解研究的研究方向及研究中可能会遇到的问题及解决方法。利用网络调查法对新能源汽车的市场背景及政策现状进行调查分析。利用数据爬取法收集数据并通过大数据挖掘法对数据进行数据挖掘得到隐藏在数据深处的价值。
请支付后下载全文,论文总字数:27764字
相关图片展示: