基于函数型数据分析方法的道路交通流量聚类和预测研究开题报告
2022-01-16 20:28:44
全文总字数:5316字
1. 研究目的与意义及国内外研究现状
近年来,随着经济社会的不断发展,私人小轿车的种类和拥有量逐年递增,某些大城市的道路改扩建速度已经无法满足私家车增长的要求,城市交通拥堵等问题接踵而至,居民出行需求和城市道路承载能力之间的矛盾日益加剧,因此交通问题已经成了亟待解决的问题。不可否认的是交通拥堵问题不仅会导致城市交通运输效率下降,还会导致交通事故、空气污染、噪声污染等一系列相关问题,这严重影响城市经济发展,根据目前常见的交通拥堵解决方式大致有两种,一是重新规划道路网结构,诸如拓宽道路、架设立交桥等,但是这一种方法显然消耗了巨大的成本,需要大量人力物力财力的投入,在现有国情之下,这一类方法的可行性显然有待考究;二是通过交通流智能预测实现车辆分流,缓解道路交通的压力。在目前大数据的背景之下,利用各个城市每日存储的大量交通流量数据,用统计方法对其分析并找到大量数据背后潜藏的规律,从而给人们的出行带来便利。交通流量的预测成了各大城市重点讨论的问题,本文的重点也将着眼于交通流量的短时预测方面。用函数型数据聚类分析方法,对大量的交通流量数据,包括实时数据和历史数据进行具体的内部分析,找出关联的参数特征,通过构建数学模型,在通过一些算法来预测估计未来一段时间内某区域的交通流量数据。根据此方法,交管部门可以对复杂多变的交通情况实现实时监控,预知道路的拥堵情况,从而可以开展辅助道路的疏导工作,减轻城市主道路的交通压力。由于监测过程是一个随机过程,可能会遇上不可抗的外因例如突发车祸或者突发地质灾害,并且预测和统计时间也存在很大的关系,这也是交通流量预测的难点所在。
国内外研究现状
由于在实际生活中,遇到的数据集大多不是单纯的离散型数据,因此,本文的着眼点主要在于如何将离散型数据转化为函数型数据并加之处理。函数型数据这一概念最早是由J.O. Ramsy(1982)提出的[1],此后他(1991)又提出了适用于时间序列形态数据的无限维函数型数据分析研究的一系列方法,并且采用FPCA方法拟合线性模型对加拿大的年温度与降水量的关系进行了实证研究[2]。之后他又与B.W. Silverman一起合作[3],于1997年出版了《Functional Data Analysis》一书,详细阐述了函数型数据分析的各种理论,并用MATLAB和R中数据包进行实例分析,给后来的函数型数据统计分析奠定了基础,极大地推动了这一方面研究的发展。在之后的研究当中,严明义对中国消费价格指数和一些其他经济领域做了大胆的一些尝试性应用研究,这一应用开拓了函数型数据分析方法在国内的研究与发展[4][5];漆威(2014)通过B-样条方法逼近数据离散值,构建一种函数形虚拟变量回归模型,进而研究了空气质量政策的效应[6];陈丽琼(2014)建立了自回归混合模型,用函数主成分分析的方法拟合出模型非参部分,巧妙模拟了股票日间交易价格的波动,并且达到预测股票价格走势的目的[7];王劼(2011)针对周期性数据进行研究,采用傅里叶变换的性质定义了新的距离计算方式,并详细阐述了一种系统聚类分析具体算法,以便其能够在低维空间中达到可以用原始数据来直观表达的方法[8];梁银双对京津冀地区污染情况的研究较为细致,首先用K均值聚类的思想划分了主要污染区域并通过FPCA方法对多个观测站点的PM2.5浓度进行分析,得出其具有明显的季节分布特征,然后从人为因素这一角度出发构建了人类活动对空气质量的影响模型,最后提出带有奖惩机制的博弈模型,给当地政府提出了合理化建议,为京津冀地区缓解空气污染问题及城市发展提供了理论支持[9]。高速公路交通流量预测一直是国内外交通研究与应用的热点之一,早在二十世纪六十到七十年代就有国外学者将物理学、经济学等理论应用到交通流量预测领域并取得了一些实质性的突破,该时期的交通流量预测方法是以传统物理和数学方法构建的模型为主[10],例如指数平滑模型、卡尔曼滤波等。现如今,经过学者们的研究总结出了比较成熟的预测方法[11]:统计分析模型、非线性理论、人工智能模型、模拟仿真,也有将上述模型与其他模型叠加在一起使用的组合预测模型。国外学者对于交通流量预测有较早研究的是Jenkins和Box,他们通过一系列试验建立起Box-Jenkins模型,也就是采用ARIMA模型的思路进行预测,它可以对有着时间序列特征的交通流数据进行准确的预测,由于当时理论尚不完善,因此参数的预估存在很大的困难;随后Billy M Williams和Lester A. Hoel(2003)对这一理论进行深入研究,应用Wold分解定理和离散区间交通状况数据,建立季节性自回归综合移动平均模型[12];此外Okutani I等人(1984)提出了两种基于Kalman滤波理论的短期交通流量预测模型[13],应用最近的交通流数据进行参数估计,并且用名古屋市街道网络收集到的数据进行实例分析,结果表明平均预测误差小于9%,说明提出的新方法达到了理想的效果。 国内学者也进行了大量研究,例如丛新宇等人(2011)将Elman神经网络模型、历史趋势模型和非参数回归模型相结合的方式进行交通流量预测[14];张婉琳(2014)提出了GA-SVM方法,通过支持向量机进行预测,后续采用遗传算法优化参数[15];唐毅等人(2015)提出了一种从距离角度出发考虑的模糊优化时间序列模型[16],克服了传统常规时间序列模型的缺陷,并且这一模型对类型不一的交通状况体现出较强的适应性;韦凌翔(2016)提出了RVM与ARIMA模型相结合的方法,这一方法主要适用于非线性时间序列预测[11];同年,张佳宁提出了改进后的BP-神经网络算法,达到了比以往更高的预测精度[17];谢凯兵(2017)提出了基于马尔科夫链的组合预测模型[18],构建了关于各种形式的马尔科夫链,以达到不同情况下道路交通流长时预测的目的。针对交通流量时间分布的特性研究,聚类分析是一种应用较多的统计方法,传统的聚类方法大多基于离散的多变量数据,而目前函数型数据分析与聚类分析相结合是研究热点。本文拟采用函数型数据的聚类分析先将交通流量数据进行分类处理,以达到减少预测误差的目的。针对函数型数据聚类方面的研究,王劼等人提出了一种新的FDA系统聚类法,并将之应用于面团弹性数据[8],从理论上分析饼干制作过程中材料的配比问题;李海蓉将协变量数据,即工业烟粉尘排放量等人为因素放入模型进行辅助聚类[19],考虑不同类别的方差大小,通过调整惩罚参数来拟合城市PM2.5浓度曲线,计算结果表明各类城市PM2.5的浓度会随季节变化而变化。
2. 研究的基本内容
通过现代信息收集系统可以捕获各式各样的数据,这里的观测值应当是动态的,而不是以往所研究的静止的数据。
本文主要结合2019年英国道路站点的交通流量数据,采用函数型数据聚类分析这一方法对实例数据进行研究,分析同一站点在不同时间的交通流量变化情况,并利用之前已知数据对交通流量数据进行预测,将之与实际交通流量数据进行对比,探究预测模型的好坏。
本文选取英国高速公路a1路段(a639到a1(m)北向通行车道),收集了2019年1月所有工作日和非工作日的交通流量数据,用函数型数据聚类分析方法,对实时数据和历史数据进行具体的内部分析,找出关联参数特征,通过构建数学模型,结合交通流量变化情况关联性这一属性特征来进行进一步深入研究,以其实时交通流量数据为基础,建立短时预测模型。
3. 实施方案、进度安排及预期效果
(1)2019年1月~2019年2月,仔细研究国内外相关文献,对比在道路交通流量预测领域不同的统计方法,并对比分析优缺点;并将相关的理论知识进行梳理。收集整理相关数据。(2)2019年3月,采用FPCA、k-centres FC和k-means FC方法(函数型数据的聚类)对道路交通流量数据进行建模分析,并采用均值预测法、最大相关性预测法、加权平均预测法对道路站点的未来交通流量情况(主要是短时预测)进行预测,计算每种方法的RMSE以此判断三种预测方法的优劣程度。(3)2019年4月,完成毕业论文的撰写和修改。(4)2019年5月,参加答辩。
4. 参考文献
[1] Ramsay J.O. When the data are functions[J]. Psvchomctrika. 1982,47: 379-396.[2] Ramsay J.O, Dalzell C.J. Some tools for functional analysis[J]. Journal of the Royal Statistical Society. Series B, 1991, 53(3): 639-572.[3] Ramsay J.O, B.W. Silverman, Functional Data Analysis Second Edition. [M] New York: Springer-Press. 2005.[4] 严明义等. 中国消费价格指数季节波动的函数性数据分析[J]. 统计与信息论坛, 2010(8): 100-106.[5] 严明义. 函数性数据的统计分析: 思想、方法和应用[J]. 统计研究, 2007(02): 87-94.[6] 漆威. 函数型数据视角下的空气质量政策效应评估——以兰州市机动车单双号限行效应测算为例[J]. 统计与信息论坛, 2014(09): 79-85.[7] 陈丽琼. 函数型数据分析方法在股票价格预测上的应用[D]. 厦门大学, 2014.[8] 王劼, 黄可飞, 王惠文, 李莹. 一种函数型数据系统聚类分析方法应用[J]. 北京航空航天大学学报(社会科学版), 2011. 24(01): 86-88 102.[9] 梁银双. 基于函数型数据分析的京津冀空气污染问题研究[D]. 首都经济贸易大学, 2017.[10] C S, M C Chen. Identifying important variables for predicting travel time of freeway with non-recurrent congestion with neural networks[J]. Neural Computing Application, 2013, 23(6): 1611-1629. [11] 韦凌翔, 陈红, 王永岗, 蔡志理, 钟栋青, 李玉华. 短时交通流量预测方法[J]. 山东交通学院学报, 2017, 25(3): 22-29.[12] Williams B.M, Hoel L.A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664-672. [13] Okutani I, Stephanedes Y.J. Dynamic prediction of traffic volume through Kalman filtering theory[J]. Transportation Research Part B: Methodological, 1984, 18(1): 1-11. [14] 丛新宇, 虞慧群, 范贵生. 基于组合模型的交通流量预测方法[J]. 华东理工大学学报(自然科学版), 2011, 37(03): 340-345.[15] 张婉琳. 遗传算法优化支持向量机的交通流量预测[J]. 激光杂志, 2014. 35(12): 116-119.[16] 唐毅, 刘卫宁, 孙棣华, 魏方强, 余楚中. 改进时间序列模型在高速公路短时交通流量预测中的应用[J]. 计算机应用研究, 2015, 32(01): 146-149.[17] 张佳宁. 基于神经网络的城市交通流量预测模型研究[D]. 广东工业大学, 2016.[18] 谢凯兵. 基于马尔可夫链组合模型的交通流量长时预测[D]. 北京交通大学, 2017.[19] 李海蓉. 函数型数据视角下中国空气质量的预测及聚类研究[D]. 南京信息工程大学, 2018.[20] 苏飞. 城市道路路网交通运行状态分析方法及应用研究[D]. 北京交通大学, 2017.