船舶交通事故中的聚类分析方法比较研究毕业论文
2020-04-12 16:02:00
摘 要
我国是一个进出口贸易大国,而水路运输是进出口贸易的主要运输方式。近年来随着社会经济的飞速发展,海上交通运输事业也是蒸蒸日上,伴随而来的便是人们最为关注的海上交通运输的安全问题,通过对已发事故的致因要素进行解析研究进而改善运输状况显得尤为必要。而聚类分析方法便是对已发事故的各项要素包括成因以及事故本身的属性进行分析归类,以便于发掘其中各要素的相关性。
聚类分析是指将物理或抽象对象的一个集合分组为由类似的对象组成的多个类别的过程。本文以聚类分析在海上交通运输事故的应用研究为线索,学习了几种不同聚类算法的原理及实际应用,针对此方法应用在海上交通运输安全管理方面展开讨论研究,主要包挂以下几点:
(1)详细介绍了聚类分析方法应用于海上交通运输的现状及重大意义。
(2)了解聚类分析的基本概念,掌握不同的聚类算法。
(3)运用K-means(K均值)聚类算法以及DBSCAN算法(基于密度的算法)对海上交通事故的实例进行分析研究
(4)将两种不同聚类算法在MATLAB程序上实现并对其结果进行比较研究
关键词:海上交通事故 聚类分析 K均值算法 DBSCAN算法 MATLAB
Abstract
China is a big country of import and export trade, and water transportation is the main mode of transportation of import and export trade. In recent years, with the rapid development of social economy, the cause of maritime transportation is also flourishing. It is particularly necessary to analyze and further improve the transportation situation, and the cluster analysis method is to analyze the factors including the causes of the accident and the attribute of the accident itself, so as to facilitate the exploration of the correlation of the elements.
Clustering analysis refers to the process of grouping a collection of physical or abstract objects into similar classes. Based on the research of the application of clustering analysis in maritime traffic accidents, this paper studies the principle and practical application of several different clustering algorithms, and discusses the application of this method in the management of maritime transportation safety. The main packages are linked to the following:
(1)The present situation and significance of applying cluster analysis to maritime transportation are introduced in detail.
(2)Understand the basic concept of clustering analysis, master different clustering algorithms.
(3)Using K-means(K mean clustering algorithm and DBSCAN algorithm (density-based algorithm) to analyze the case of maritime traffic accidents
(4)Comparative study on two different clustering algorithms
Key words: DBSCAN algorithm of K-means algorithm for clustering analysis of maritime traffic accidents MATLAB
目录
第一章 绪论 1
1.1研究的目的和意义 1
1.2 国类外关于数据分析的研究现状 1
1.3 本文的主要研究内容 2
第二章 聚类分析理论 3
2.1 聚类分析的基本概念 3
2.2 常见的几种聚类算法 4
2.3 MATLAB基础学习 7
2.3.1 MATLAB 概述 7
2.3.2 MATLAB在聚类分析上的应用 7
2.4本章小结 8
第三章 聚类算法的实例计算分析 9
3.1 K-means算法在MATLAB实现 9
3.2 DBSCAN算法在MATLAB实现 10
3.3计算结果分析 12
3.4本章小结 12
第四章 总结与展望 13
4.1 总结 13
4.2 未来的展望 13
致谢 14
参考文献 15
第一章 绪论
在如今多元化社会,世界经济飞速发展的情景下,各国之间的进出口贸易十分频繁,海上运输则是进出口贸易的主要运输途径。随着海上运输事业的快速发展,船舶数量不断地增加,使得各个航区通航环境日趋复杂,船舶交通事故问题变得尤为突出,是水路运输需要重点防范的问题。已发生过的船舶交通事故给社会造成了巨大的损失,包括人员的伤亡、个人和社会财产的损失以及对大海环境造成的污染等等。这些事故发生的起因各不相同,对这些事故的成因进行解剖分析,利用智能算法从事故的各项属性数据中学习其期潜在的规律,是全面认识事故的重要途径。聚类分析是一种多元化的统计方法,提取船舶事故的各项属性和关键因素,例如伤亡情况,天气情况,航行轨迹,载重等等数据,通过聚类算法的对比,发现其各个因素之间的关联性,做出相对应的改善措施以防范事故的再发生,这具有重大意义。所以本次毕业设计分析针对长江船舶事故的一个数据集,利用聚类算法对其展开分析。
1.1研究的目的和意义
随着现代化社会的发展,海上运输成为国际贸易最主要的运输方式之一。船舶数量的急剧增加直接导致了海上交通事故频繁地发生,造成大量的人员伤亡和财产损失。海上交通运输最令人关切的首要实际问题就是事故和安全,所有的海上交通设备、助航设施以及海上交通管理系统等几乎都是为了防止事故发生和保证人生及财产安全,只有对海上交通事故的原因进行深入的分析才能更好地防患于未然。
聚类分析指将客观可见的物理对象或者抽象对象的一个集合分组为由类似也就是具有某些相同点的对象组成的多个类别的过程,其目的就是在某些特定属性相似或是相同的基础上收集相关数据来进行归类、分化。聚类起源于很多种领域,包括数学、计算机科学、经济学、生物学和统计学等等。海上交通事故的根本原因是多方面的,包括船舶设施的性能、船员的各项素质、航线、天气情况等等,为了保证海上运输通道的安全平静,需要对已发生事故的原因进行归类分析,通过聚类算法的对比,从不同角度发掘船舶交通事故发生的潜在规律,对其根本原因进行关联性建模,根据分析结果对船舶交通安全管理做出相应的改革,以防止类似交通事故的再发生。
1.2 国类外关于数据分析的研究现状
聚类分析作为数据挖掘的主要方法之一,很早就引起了人们广泛的关注。20世纪90年代中期,聚类分析研究主要是对早期聚类算法的改进和创新两个方面。然而早期的聚类方法很难处理大量的高维度数据集,在现实生活中的问题大多数有着多样性和不确定性,数据量庞大而繁杂,促使了聚类分析研究在实际应用中的不断革新。国外的学者早在上个世纪七、八十年代的时候,就开始广泛地对交通事故多发点区域的成因分析开展了研究;国内关于交通事故多发点的研究开始于二十世纪九十年代。到目前为止,有许多种方法被应用到事故致因分析当中:邬慧国等人提出了分别运用模糊聚类的分析方法中最大或是最小法和夹角余弦法推导出相似的关系矩阵,得以进行具有模糊概念的聚类分析的过程;王岩提出将引发事故的多种可能根本原因与所谓的 “事故危险性指标”参数进行灰色关联分析的方法,通过这种方法找出在该区域上的事故多发的主要成因;孙璐等人在针对目前交通事故多发点鉴别常用的传统方法存在的问题,引入了DENCLUE(基于核密度的聚类)聚类算法用于事故多发点鉴别,对于DENCLUE聚类算法的基本原理特征,基本定义以及计算步骤进行了详细的阐述,通过对已发事故的实际案例用此方法进行分析研究,重点分析了该算法用于多发点鉴别的可行性。董宪元等人基于道路交通事故由数值型和枚举型数据构成的特点,分析道路交通事故数据频率在某区域的某个时间段的分布特征,采用信息熵方法评价数据的离散程度,客观地确定交通事故案例的属性权重,并且应用了二阶聚类算法建立案例检索库,以提高案例检索精度;以Matlab R2008a为仿真工具开发交通事故案例检索系统,以沪杭高速公路交已发实际通事故数据为例子,采用了K-NN 案例检索算法进行案例检索试验,结合案例最高相似度和案例集匹配度综合评价案例检索精度,验证该案例检索优化方法的有效性。近年来随着GIS(地图绘制)空间分析技术的发展,一 些 GIS空间分析模型也被应用到交通事故致因分析中, 例如: Masayuki HIRASAWA 和 Motoki ASANO建 立了一个基于GIS的交通事故分析系统,分别对事故发生率、致死率与道路(道路结构、附属设施)、交通数量、天气状况之间的内在联系进行了分析;Fla- haut提出了一个包括只考虑空间变量的与空间自身相关在内的面向空间集成数据模型,应用对数回归来评价道路特性与当地环境特性对道路事故空间集中程度的影响。
聚类分析作为近年来热门的研究领域,涉及数据挖掘、机器学习、数据分析等多个方面,全球各地的众多学者对其的研究分析也使得聚类分析在水上交通安全管理上的应用在逐步的完善和提高。纵观国内外学者近年来在海上船舶碰撞事故方面的研究可知,研究方面主要包括事故发生概率、风险预测、致因分析,而且研究方法不断成熟。
1.3 本文的主要研究内容
聚类分析作为一种应用广泛的数据分析方法,在海上交通运输安全管理方面亦有着举足轻重的地位。要用此方法针对海上船舶交通事故成因的探索研究,我需要对聚类分析的基本概念有足够深的理解,学习如何将它运用到实际案例当中,掌握不同的聚类算法。本文针对我国长江流域某时段的一个船舶事故数据集,提取船舶交通事故的多个事故属性和致因要素,选取较为典型K均值聚类算法和DBSCAN基于密度的聚类算法对其进行研究。通过对各个事故属性的分析,包括船舶的运行轨迹、天气状况、人员伤亡、事故的重大程度等因素,判断其发生的根本原因。尽可能还原事故发生的真相,发掘其人为因素与自然因素之间的关联性,根据其不同的原因特征将它们进行准确、精细的并且合理化归类。将两种不同算法得出的结果进行比较研究,发掘各个成因之间的关联性,有利于改进海上运输策略,减少事故发生率,从而减少海上交通事故所带来的人员伤亡及财产损失。