数据挖掘技术的高层建筑火灾事故分析中的应用毕业论文
2022-01-02 17:05:09
论文总字数:17416字
摘 要
在步入21世纪以来,我国经济正处于高速发展的阶段。由于我国人口众多,高层建筑在我国的城市建筑中的比例不断上升,高层建筑火灾这一棘手的问题也正在闯进人们的视野中。与普通火灾不同的是,高层建筑火灾火势蔓延快,消防措施不足,扑救难度大,难以快速灭火,这对于人民的生命安全和财产危害更大。因此,找出高层建筑火灾当中隐藏的共同的规律,从根源上控制火灾的发生是预防火灾最好的办法。本文主要通过使用数据挖掘来进行高层建筑火灾事故分析,并通过网络搜索对近5年的高层建筑火灾事故数据进行收集和整理,建立针对高层建筑火灾事故的数据表。本文以Python为挖掘平台,对高层建筑火灾案例进行分析,对火灾发生的时间、原因、楼层等火灾的基本属性进行有目的的挖掘。挖掘方法包括文本挖掘、K-means聚类分析、层次聚类和Apriori关联规则分析。通过对挖掘的结果进行分析与总结,可以在一定程度上了解了高层建筑火灾发生的基本规律和其不同的事故属性的内在关系,对事故可能发生的情况进行了预测,为安全事故人员和数据分析人员提供了一种思路。
关键词:高层建筑;火灾事故;数据挖掘;聚类分析;关联规则
Application of fire accident analysis in high-rise buildings with data mining technology
Abstract
Since entering the 21st century, China's economy is at a stage of rapid development. Due to the large population of China, the proportion of high-rise buildings in China's urban buildings has been still rising. The thorny problem of high-rise building fire is also breaking into people's vision. Unlike ordinary fires, fires in high-rise buildings spread quickly, insufficient fire-fighting measures are difficult to extinguish, and it is difficult to extinguish fires quickly, which is more harmful to people's lives and property. Therefore, finding the common rules hidden in high-rise building fires and then controlling the fire from the root cause is the best way to prevent fires. This article mainly uses data mining to analyze fire accidents in high-rise buildings, and collects and collates fire accident data for high-rise buildings in the past five years through network search to establish data tables for fire accidents in high-rise buildings. Taking Python as the mining platform, this paper analyzes the fire cases of high-rise buildings, and deliberately excavates the basic properties of fire such as time, cause and floor. The mining methods include text mining, K-means cluster analysis, hierarchical clustering, and Apriori association rule analysis. Through the analysis and summary of the mining results, we can understand the basic law of high-rise building fire and the internal relationship of its different accident attributes to a certain extent, predict the possible situation of the accident and provides a way of thinking for the security accident personnel and data analysts.
Key Words: high rise building ;fire accident ;data mining ;cluster analysis ;association rules
目 录
摘要 I
Abstract II
第一章 绪 论 1
1.1研究背景及研究意义 1
1.2国内外研究现状 1
1.2.1国外研究现状 1
1.2.2国内研究现状 2
1.3研究内容与方法 3
1.3.1研究内容 3
1.3.2研究方法 4
第二章 数据挖掘 4
2.1数据挖掘技术 4
2.1.1 数据挖掘的定义 4
2.1.2 数据挖掘的历史背景 5
2.2数据挖掘的对象 6
2.3数据挖掘的步骤 6
第三章 高层建筑火灾事故数据来源与数据整理 7
3.1火灾数据来源 7
3.2数据的预处理 8
3.3数据处理 9
3.3.1高层建筑火灾事故分析 9
3.3.2高层建筑火灾事故属性选择与结构化处理 9
第四章 高层建筑火灾事故的数据挖掘 11
4.1词云分析 11
4.1.1 文本挖掘 11
4.1.2 高层建筑火灾事故的文本挖掘 11
4.2 K-means聚类 13
4.2.1 K-means聚类算法 13
4.2.2 高层建筑火灾事故的K-means聚类 13
4.3 层次聚类 16
4.3.1 Agglomerative Clustering 层次聚类算法 16
4.3.2 高层建筑火灾事故层次聚类分析 16
4.4 Apriori关联规则 18
4.4.1Apriori关联规则算法 18
4.4.2高层建筑火灾事故的关联规则分析 18
第五章 总 结 21
致 谢 22
参考文献 23
第一章 绪 论
1.1研究背景及研究意义
火灾是我们经常可以在身边见到的灾害之一,是全世界范围内都会发生的公害事件,而且事故频率高、时间跨度大,容易造成严重的危害和惨重的损失。在众多的火灾类型当中,高层建筑火灾正在随着城市化的发展而变得越来越频繁和严重,与普通火灾不同的是,高层建筑内部结构复杂,竖向通道较多,一旦发生火情,那么火势可以迅速蔓延到其他区域,例如2009年2月9日中央电视台新址园区中心大楼火灾。出动了16个消防中队,54辆消防车,过火面积达21333平方米,一名消防队员死亡,直接经济损失1.6亿元;像这样严重的事故还有很多。找出高层建筑火灾事故背后真正存在的客观规律是目前很多安全人员的研究目标,因此,研究高层建筑火灾发生的规律就变得刻不容缓。
本研究通过在网络上搜集近五年来有过详细报道的高层建筑火灾,利用多种方法对搜集到的信息进行分析、筛选、预处理,建立相对全面的高层建筑火灾事故属性的数据表[2],利用不同的数据挖掘的算法对高层建筑火灾中的多种事故属性做数据分析,揭示高层建筑火灾的发生规律,合理地作出预防措施,并对发生火灾之后的救援措施提出建议是我们研究的主要目标。
1.2国内外研究现状
1.2.1国外研究现状
由于现代计算机水平的飞速发展,数据挖掘技术已经在各个领域中有所应用,国外对于数据挖掘技术在火灾事故领域当中的应用大多都是森林火灾、工业园区、建筑工地的火灾事故,收集相关数据并对事故进行预测。Nizar Hamadeh等通过采用决策树和反向传播算法两种数据挖掘技术,利用4个气象属性对黎巴嫩的森林火灾进行预测[3]。Zohre Sadat Pourtaghi等通过使用BRT、GAM和RF数据挖掘模型发现了森林火灾发生的主要决定因素是年降雨量、距离道路的距离、和土地利用情况,得出的数据可以更好使人们做好初期预警、灭火资源利用等工作[4]。也有通过大数据分析对事故原因作出分析的。Joon-Soo Kim等通过使用大数据分析,收集了2007-2017十年来的建筑工地火灾的文章,整理出时间、地点、诱因、事故模式4项数据,推导出季节性因素和人为因素两种事故因素[5]。在国外,数据挖掘技术的使用较国内相对成熟。
1.2.2国内研究现状
由于我国对于火灾事故分析数据库的建立时间较晚,主要应用于电信、气象、交通数据分析等行业,数据挖掘技术在火灾分析这方面的应用相对较不成熟。在事故原因分析方面,张大可等使用了Microsoft Office Access数据库系统对数据进行了重构,采用数据仓库原理结合事故分析技术,以事故案例和事故统计为基础建立了火灾数据库,后采用Microsoft SQL Server商业智能组件对数据进行了数据挖掘,运用四种不同的数据挖掘算法,对火灾事故进行了数据挖掘[6]。张振超通过搜集近十年的电气火灾事故数据,建立了电气火灾事故数据库,应用了Hierarchical Entropy Analysis法进行分析,建立由人员风险、固有风险、环境风险安全管理风险组成的电气火灾风险计算方法[7]。谢道文通过分析火灾数据分析中存在问题,采用区位熵法,提出了火灾重心理论与分析模型,并利用支持向量机预测模型,对火灾发生次数,火灾直接经济损失重心进行了预测,他还应用空间点模式分析中的最邻近距离与标准差椭圆分析方法描述火灾点分布的集中趋势或离散趋势,提出了基于灰色理论与线性组合的预测模型,系统的研究了Apriori算法[8],并应用于火灾案例的数据挖掘,得出火灾发生的主要区域和相关因素,并提出相应对策。万鲁河等采用基于组件式地理系统的开发平台,把OLAP、OLAM技术和专业应用模型融合在一起,实现了空间数据库管理、查询火灾信息、预测火灾等级等功能。在事故原因潜在因素方面[9],丁振等通过收集平煤四矿大量的采煤工作面CH4浓度、CO浓度、粉尘浓度、温度、相对湿度等环境参数数值、运用关联规则方法,调用arules程序包对其进行数据挖掘,得出环境参数之间的强规则[10]。对于煤矿的安全生产有一定的指导作用。王振等通过使用IAHP法对高层建筑火灾中的各层次结构进行分析,将每个安全因素两两对比,建立了高层建筑火灾安全因素的判断矩阵,通过对判断矩阵求解得出每一个安全因素对于火灾的影响大小。
请支付后下载全文,论文总字数:17416字