基于深度学习的短时交通流预测研究文献综述
2020-04-15 20:31:08
随着经济与科技的发展,车辆的普及程度也得到了长足地提升,导致道路上的车流数量急剧增加,因而对交通流量进行管控与疏导就显得尤为重要。与此同时,随着数据驱动(Data-driven)算法的发展与计算机的计算能力的进步,智能交通系统[1](IntelligentTransportation System)的概念也逐渐成形,关于智能交通系统应用的研究也成为国内外学者的焦点。智能交通系统能够实现道路车辆的管控与诱导,对可能发生的拥堵状况进行提前疏导,也能降低交通事故的发生概率,更加重要的是,它能够在尽可能减少人为干预的情况下对于交通状况进行自适应地调整,对交通状况进行自动化监控与调整,使得交通管理的效率得到了提高,因而智能交通系统的相关应用研究具有重要的实用价值。
智能交通系统的主要功能在于进行交通监控与疏导,如果能对未来时段的交通状况进行准确预测,那么交通管理的效率将大大提升。因此,对于交通状况指标的预测便显得尤为重要。例如,对于车流平均速度的预测有助于了解未来时段的交通拥堵状况,对车流量的预测则可以提早实施交通管制策略。总而言之,对于道路占用率、车速、车流量等指标的研究都能对交通系统的管理与监控起到积极的作用。在此次设计中,我们主要对道路的拥堵程度进行检测与控制,而与之关系最为密切的指标便是交通流量,因此,我们的重心主要放在交通流量的预测中。
短时交通流预测的目的是根据当前与先前时段的交通流量数据,对于数秒或数小时之后的交通流量进行预测。短时交通流预测一般是为了达到在线计算的目的而进行的,需要通过实时计算以得到下一个时段的流量数据。因此,交通流数据是一个以不变的时间间隔而排列的数据序列,因而短时交通流预测的大部分研究都是基于序列预测的。这不同于长期交通流预测,因为它的目的在于给出交通流量的长期演变趋势。短时交通流的预测方法大致可以分为两类,即经典统计学策略与数据驱动策略。其中,经典统计学策略一般使用经典概率学模型进行数据建模。而后者则会使用数据分析处理及机器学习算法。从方法层面而言,短时交通流预测应属于有监督学习的范畴,且属于一种递归(Regression)分析,即根据已知的输入输出关系,先对数据进行建模,再通过优化算法等学习机制进行数据模型参数的整定与学习。
针对于不同的预测方法与数据建模方案,国内外学者对于短时交通流预测问题都进行了全面研究,并对该领域的研究方法与未来展望进行了详细阐述。Eleni I. Vlahogianni等[1]在文章中指出,绝大多数的短时交通流预测研究都将高速路车流量作为数据源,且大多使用单点数据源。除此之外,大多数学者都专注于根据可获得的交通数据源,验证自己提出的预测方法是否可行,而他在文章中指出了十个短时交通流预测领域的挑战与亟待解决的问题,包括模型对于交通状况的自适应调整、数据处理与聚合等。Ermagun A等[2]对时空相关性方法在该领域的运用进行了详细研究,并且指出经典的统计学模型的预测效果一般弱于数据驱动的方法,但改进的统计学模型方法则不然,并且,多模型融合的预测方式往往能达到更好的预测效果。此外,他还对利用时空相关性的具体研究方法进行了总结,包括考虑道路上下游因素的建模方法与加入相关性系数的预测方法等。此外,作为数据驱动方法的经典理论,神经网络模型在短时交通流预测方面的应用也相当广泛。Do L N N等[3]就对神经网络模型在这一方面的应用进行了详细阐述,并给出了相关学者的基于各种神经网络模型的预测方案。
由前文所述,经典的概率模型在处理序列预测问题时,其预测精度一般不能和数据驱动的新型方法相比较,并且多模型混合也成为该领域的研究趋势,因此单纯使用概率模型的预测方法较少,但也有直接使用机器学习的方式进行交通流预测的方案。Zhao Z等[4]直接使用改进的LSTM模型进行预测,并利用多个存储单元组成的二维网络来计算交通系统中的时空相关性。
由于短时交通流预测属于一种递归型的分析与预测,因此,除了数据模型以外,选取合适的参数优化与学习的方案也会直接影响到预测的效果和精度。近年来,优化算法的性能得到了极大的提升,其应用领域也愈加广泛,许多学者也将这种启发式算法应用到短时交通流预测中。李松等人[5]结合BP神经网络,利用改进的粒子群算法,对神经网络的权重与阈值等参数进行优化,并将训练得到的参数用于交通流量的预测。在另一篇文章中[6],他还将遗传算法与BP神经网络相结合,也取得了较好的预测效果。钱伟等人[7]将灰色算法与ELM神经网络相结合,前者用于对平稳的数据序列的预测,而后者具有更好的抗干扰性。文中将这两种子模型分别进行学习,并根据两者的预测偏差决定二者在最后输出的预测值中所占的比重。Lin L等[8]利用粒子群优化算法与ELM神经网络相结合,其重点在于确定最佳的预测间隔。Guo J等[9]将模糊信息造粒法与KNN神经网络及BP神经网络相结合,还使用了支持向量机模型进行对比与模型融合,并得到了较好的预测效果。其研究还指出数据的分辨率越小,即数据序列的间隔越大,则数据中包含的干扰与噪声就越小,预测的精度也越高。Raza A等[10]使用了混合模型,并利用遗传算法对神经网络的参数进行了优化,提升了模型的预测精度。Bing Q等[11]提出了一种基于遗传算法-粒子群算法的混合优化算法,并使用了改进的支持向量机模型(LSSVM),并利用前面的混合优化算法对该模型的核函数进行优化。
除了对参数的学习机制的优化以外,对交通流数据的建模与信息挖掘也可以改善预测的精度。其中K近邻法(KNN)是一种常用的模型,许多学者基于该方法对交通流数据的时空相关性进行挖掘。Cheng S等[12]将KNN与MVL-STKNN多视图学习算法相结合,弥补了传统K近邻模型只考虑时间相关性而忽视空间相关性的缺点,并引入了时空关联性矩阵,对交通数据的时空紧密型、周期性、趋势进行建模与挖掘,使得预测模型可以基于这三个维度对多源数据进行融合与处理。Kou F等[13]提出了考虑上游交通信息的K近邻模型。他将交通状态设置为包含上游交通信息的状态矩阵,并利用上游路段度量目标状态矩阵与历史状态矩阵的相似性,最后根据数据对KNN模型进行训练,确定最优K近邻模型的参数K值。Xiangxue W等[14] 提出了改进的半监督K均值聚类算法,并采用基于小波分解的混合多尺度预测方法,将之运用于交通流量阈值识别。Cheng S等[15]考虑到固定预测模型和相邻街道流量关联的方法不能得到准确预测结果的问题,并提出了考虑空间关联性的自适应K近邻法。Sun B等[16]考虑到KNN算法中确定K参数一般比较困难的问题,提出了一种能够实现参数自整定的动态KNN算法,并在研究中考虑到了假日流量与工作日流量的差异以采用对应的预测手段。除了K近邻算法以外,还有许多研究成果考虑到了时空相关性这一因素。熊亭等人[17]将改进的差分整合移动平均自回归模型(ARIMA)与随机森林算法相结合,前者的线性拟合能力可以用于捕捉交通流数据的周期性特征,而后者具有较强的泛化能力,用于发掘数据的时空相关性。Wagner-Muns I M等[18]利用底层功能性特点分析手段,对数据的底层功能性信息进行挖掘,并将之用于在线预测。Duan P等[19]提出了时变时空相关性的概念,以适应不断变化的交通环境,并将影响时空相关性的各种参数合并,减小了计算复杂度。
时空相关性研究是短时交通流预测的重要组成部分,此外,基于多模型融合的算法以及多源数据融合的方法也逐渐得到了大家的关注。Zhang H等[20]采用多变量混合模型流量预测法,将流量和占用率作为输入数据,利用小波去噪与ARIMA模型,针对交通流的季节性影响进行研究。Zhang L等[21] 利用SVR与随机森林结合的混合模型,选择最佳特征子集,并用改进的遗传算法用于优化模型参数。Zhang H等[22]将流量序列分解为周期性、趋势、静止、波动性部分,并利用时间序列分析、统计波动率分析等方法提高预测精确度。Alfred R等[23]将统计学模型与数据驱动模型进行混合,并运用遗传算法来优化模型参数。实验中发现其效果由于ARIMA的预测效果。李琦[24]利用专用车辆检测器、感应式交通控制系统、道路收费系统、车辆跟踪定位系统等多种数据源进行数据融合,并在学习与预测前对交通流数据进行预处理。Jin Y等[25]采用时空维度上的多源数据融合策略,利用堆叠自编码器与LSTM策略,分别提取时空特征。该研究还指出基于多源数据融合的方法能够得到较好的预测效果,因为多源数据可以充分考虑影响交通流量的各种因素,使之在复杂多变的交通状况下保证一定的鲁棒性。
此外,许多学者对于短时交通流预测问题提出了新的方案与思路。Xiao J等[26]指出传统的模型和固定的参数选择并不适用于不断变化的交通环境,在外界因素变化的情况下,模型也会发生改变,使得预测的精度到不到要求。文章中提出了一种先分类后优化的思路,先将交通流数据进行二值分化,在确定损失函数,并进行超平面的更新。Salotti J等[27]提出了一种基于时间序列图形模型和信息论的变量选择算法与多变量预测算法,并在研究中考虑了城市中心街道的流量特征与郊区公路的流量特征的不同点,并对他们分别进行预测与实验。Huang W等[28] 提出了一种考虑季节性波动的在线短时交通流预测算法。文章中提出在预测中加入季节性调节因子,并使用自适性卡尔曼滤波法进行训练与预测。Ma D等[29]考虑了交通流量模式存在显著差异的天数,提出了一种基于模式匹配的预测算法。文章中先将交通流历史数据进行聚类分析,再运用卷积神经网络(CNN)与长短期记忆网络(LSTM)相结合进行分组训练,并对每个时间点选择与实际数据相似度最高的模型参数进行预测。Liu L等[30]提出了一种数据预处理策略。针对数据融合策略,文章中讨论了模型的输入向量应该使用哪些特征进行融合。Zhan H等[31]针对不断变化的外在环境,采取了一种多模型的预测方法,针对不同的交通流状况选用不同的模型以达到较好的预测效果。夏元清等人[32]提出了一种基于云控制管理中心服务器的预测技术。文章中使用超限学习机(ELM)对拥堵状况与交通流进行预测,并且,文章中还利用调度优化算法对交通状况实现了管理与控制。Angarita-Zapata J S等[33]针对预测模型选择困难的问题,尝试将Auto-WEKA等多种模型自选择算法应用于交通流预测中,但如何提高这种模型自选择算法的效果与性能仍需进一步进行研究。
{title}
2. 研究的基本内容与方案
{title}本次设计主要对短时交通流预测的背景及应用进行详细分析,并对机器学习算法进行简要概述,随后列举出已有文献中的一些预测方法,并对其中一些方法进行实现,最后提出一种新的交通流预测算法。