A Probability-based and Data-Driven Approach for Highway Vehicle Speed Forecasting
-
摘要:
为改善高速公路车辆速度预测过程中因数据非正态分布而造成的预测误差,提出一种深度时间卷积网络(deep temporal convolutional network, DeepTCN)和Copula理论相结合的混合概率性预测方法。为给出考虑多个特征的确定性预测,建立了DeepTCN框架。根据DeepTCN得到的预测结果,基于预测误差的条件概率分布来拟合适当的Copula函数。通过误差补偿得到概率性预测结果。利用在广州市机场高速收集的实际交通数据来验证所提出的混合方法的有效性。数据分析与实验结果表明,实际数据反映出交通流确实存在高度随机性,而这种随机性在低车辆密度与高车辆密度时相对较小,在中等密度时相对较大;与现有的各种方法相比,DeepTCN在处理长时间序列信息时存在优越性,适用于高速公路车辆速度预测场景;结合Copula函数可以在一定程度上补偿数据随机性带来的预测误差,进一步提高预测精度。
Abstract:To cope with the forecast errors caused by non-normal distributions of data in the process of forecasting vehicle speed on highways, this paper proposes a probabilistic forecasting method, which is a hybrid of deep temporal convolutional networks (DeepTCN) and Copula theory. DeepTCN is established first to give a deterministic forecast considering multiple features. Then, an appropriate Copula function is fitted based on the conditional probability distribution of prediction errors according to the obtained forecasts by DeepTCN. Finally, probabilistic results are provided by error compensation. Real traffic data collected on a highway road in Guangzhou, China are utilized to verify the effectiveness of the proposed hybrid method. Data analysis and experimental results show that real-world data reflects significant randomness in traffic flows, with this randomness being relatively mild at both low and high vehicle densities, but more evident at medium densities; DeepTCN demonstrates superior performance in handling long-term time series information compared with various existing methods, making it well-suited for highway vehicle speed forecasting; by incorporating Copula functions, it can compensate for forecast errors caused by data randomness to some extent, further improving forecast accuracy.
-
快速的城市化进程和人口增长加剧了城市交通负担。目前,不仅是一线大城市,许多中型城市也面临着一系列与交通相关的问题,包括交通拥堵加剧、交通事故频繁、空气质量降低以及化石能源不足等[1]。针对以上问题,路网重规划与改建是提高道路通行能力、缓解交通压力的重要途径之一,但它需要大量的人力、物力、财力和时间资源[2]。而交通流控制是更具成本效益的方法,在智能交通系统(intelligent transportation systems, ITS)领域有着广泛的应用[3]。
由于实时交通流控制的决策可信度取决于交通状态的准确性(即模型的输入),作为ITS重要的组成部分,短期交通流预测的可靠性能够直接影响交通流控制的效果。在这一背景下,高速公路车辆速度预测作为交通流预测的重要组成部分,发挥着重要的指导作用。得益于检测技术的发展,多类型检测设备,如线圈检测器、电子收费(electronic toll collection, ETC)检测器、车辆以及智能手机的全球定位系统(global positioning system, GPS)等,为高速公路车辆速度预测提供了有力的数据支持[4],在此基础上,数据驱动的人工智能方法被广泛应用 [5]。相比于传统的基于统计学习的方法[6],如线性回归、小波分析、混沌理论等,基于机器学习的预测方法具有精度高、泛化能力好的优点。
由于影响高速公路车辆速度的因素较多,如需求时空分布、路网拓扑结构、天气、人的主观因素等,高速公路交通大数据中各特征存在强相关性特点[4],而这种相关性的确切机制尚未得到充分研究[7]。在机器学习方法中,深度学习由于其强大的数据挖掘能力,在预测方面显示出巨大潜力。目前,递归神经网络(recurrent neural network, RNN)、卷积神经网络(convolutional neural network, CNN)和图神经网络(graph neural network, GNN)是车辆速度预测中常用的深度学习模型[7-8]。具体来说,RNN、CNN及其变体,例如长短期记忆(long short-term memory, LSTM)网络、门控递归单元(gated recurrent unit, GRU)、时间卷积网络(temporal convolutional network, TCN),在时间特征提取方面具有良好的性能[9-10],而基于CNN和GNN的方法分别通过以网格和图形形式建模网络来提取空间相关性特征。
现今,自动驾驶等技术的发展对车辆速度预测的准确性和效率性提出了更高的要求,但交通流的高度随机性给这一要求带来巨大挑战。这种随机性主要来源于不确定的需求、异质的路网拓扑结构和多样的相关因素,导致所产生的数据具有非线性、非平稳、多尺度特征的特点[5]。当数据呈现完全相同时,实际交通状态也可能不同。对此,概率性预测方法能够较好地应对这一问题。其中,Copula理论作为变量间相关性建模的有力工具,是重要的概率性预测方法之一,在ITS领域已得到广泛应用。Yang等[11]提出基于多元Copula的车祸计数与碰撞风险建模方法,其中碰撞风险由离散事件计数与连续随机变量来衡量。实验表明,所提出的方法在风险评估与碰撞位置预测方面取得良好的效果。Luan等[12]定义了行程时间波动率(travel time volatility),利用基于Copula的蒙特卡洛模拟方法刻画路段和路径的行程时间变化,在极端情况下实现了准确的预测结果,并证明该方法在预测路径行程时间可靠性方面的优势。
以上研究促使本文将深度学习技术与Copula理论相结合并应用于高速公路车辆速度预测。由于基于深度学习的交通流预测易受数据输入影响,且深度学习模型存在不可解释性的问题,常产生令人费解的预测误差。Copula理论的引入能够从一定程度上改善因数据非正态分布造成的误差,并通过误差补偿提高预测精度。
本文聚焦于高速公路车辆速度预测,提出一种结合DeepTCN和Copula理论的混合概率性预测方法。首先,建立DeepTCN框架以得到确定性预测结果;在此基础上,选择并拟合适当的Copula函数来补偿DeepTCN产生的预测误差,得到概率性预测结果。利用广州市机场高速的实际数据对所提出的模型进行训练与验证,实验结果验证了所提出方法的有效性。
1. 混合预测框架
本文的主要目的是利用相应的随机误差来补偿确定性预测结果,从而得到考虑交通流参数随机特性的概率性预测结果。所提出的预测方法框架如图1所示。
本文所提出的框架包含两个主要模块,分别为DeepTCN模块以及Copula模块,各模块中的具体流程由箭头表示。整体数据集被拆分为4个部分,其中数据集1、2分别用于训练与验证DeepTCN模型;数据集3用于得到最优Copula函数;数据集4用于得到最终的确定性预测结果与给定置信度条件下的概率性预测结果。
2. 基于DeepTCN的确定性预测
本研究采用的DeepTCN结构如图2所示,主要由4个模块组成,包括输入模块、编码器、解码器以及输出模块[13]。在本节中,将按照这4个模块的顺序详细阐述所提出确定性预测的步骤。
在输入模块中,输入数据集以P
× Q矩阵的形式给出,其中,P是历史观测长度;Q代表影响因素的数量。对于每个时间序列t,均可以得到一个从t−P+1序列开始到t序列结束的P× Q矩阵。通过堆叠这些矩阵,可将二维P× Q矩阵转换为三维矩阵。由于样本数据量巨大,采用小批量梯度下降算法(mini-batch gradient descent algorithm)进行训练,以平衡模型精度和计算效率。为此,所得到的三维矩阵需进一步划分为几个小批量,作为第2模块,即编码器的输入。在编码器模块中,所输入的数据信息特征通过扩张因果卷积(dilated causal convolutions)进行编码。通过堆叠多个时间块(time block),即残差块(residual block),可以得到相当大的感受野,同时避免数据信息“泄露”于未来时间。基于此,可调整卷积核尺寸、扩张因子、卷积层数,来实现对一定时间序列范围内的数据信息的整体感知。式 (1) 给出了输入x与卷积核w之间在时间序列为t时的扩张因果卷积。
s(t)=(x∗w)(t)=KS−1∑k=0w(k)x(t−dk) (1) 其中,s (t) 为对应的输出;*代表卷积计算;KS为卷积核尺寸;d为扩张因子。
编码器中的每一时间块又包含两个扩张因果卷积层、两个批量归一化层(batch normalization)以及一个ReLU激活函数层,其具体排列顺序见图2左侧部分。以上网络层组成一个时间块的基本结构,而第2个批量归一化层得到的输出即为该时间块的输入。此后,再次应用一个ReLU层,以在避免梯度消失的前提下提高模型的鲁棒性和泛化能力。
给定一个N
× P× Q的小批量输入数据矩阵(即N个P× Q的二维矩阵),通过上述编码器,即可得到一个Q× 1× N的矩阵,由ht表示。第3模块解码器的输入包含两个部分:一为编码器的输出ht;二为外部给定变量Xt+1。前者代表历史信息,后者则为一系列能够影响未来交通需求的因子,如天气、时间序列等,又称未来协变量。本文中的解码器通过式 (2) 提取ht和Xt+1的信息。
δt+1=R(Xt+1)+ht。 (2) 其中,δt+1为解码器输出。
值得注意的是,式 (2) 中的R (.) 是一个非线性残差函数,它将未来协变量Xt+1映射为预测值δt+1与观测值ht之间的残差。这一过程由残差神经网络变体实现,如图2右侧部分所示。在该变体后应用一个额外的ReLU层,即可得到解码器的输出δt+1。
最后,通过全连接层的线性降维,可以得到最终的确定性预测结果
ˆy ,这一部分即为所建立DeepTCN的输出模块。本文研究的车辆速度预测属于回归问题,故采用应用广泛的均方误差损失作为损失函数,如式(3)所示。
J=N∑j=1(ˆyj−yj)2+L 。 (3) 其中,N为数据规模,即样本量;j为样本索引;
ˆyj 与yj 分别为预测值与实际值;L为正则项。本文采用L1正则化算法,即Lasso回归,用于自动选择最重要的特征,从而降低模型复杂度,防止过拟合。3. 基于Copula理论的预测误差补偿
前文已分析交通流的随机性会反映到交通数据,进而影响以数据驱动的深度学习预测模型效果,那么,有必要建立预测结果的误差模型以对预测误差进行统计分析。为此,考虑利用Copula理论构建预测误差的概率分布。
3.1 Copula函数
Copula理论由Sklar在1959年提出[14]。他指出存在一种名为Copula函数的关联函数,能够描述多个随机变量(random variable)的联合累积分布函数(cumulative distribution function)与其各自的边缘累积分布函数之间的关系。具体定义如下。
定义1 给定n个随机变量,它们的联合累积分布函数记为F (x1,
⋯ , xn),它们各自的边缘分布函数记为Fi (xi) , i = 1, 2,⋯ , n。那么,存在一个如式 (4) 所示的n维Copula关联函数用于描述F (x1,⋯ , xn) 与Fi (xi) 的关系。F(x1,⋯,xn)=C(F1(x1),⋯,Fn(xn))。 (4) 其中,C (.) 为Copula函数。
定义2 若边缘分布函数 Fi (xi) , i = 1, 2,
⋯ , n为连续的,那么Copula函数C (.) 唯一确定。根据定义1以及累积分布函数的逆变换,令ui = Fi (xi) , i = 1, 2,
⋯ , n,则可得到Copula函数的表达式为C(u1,⋯,un)=F(F−11(u1),⋯,F−1n(un))。 (5) 其中,Fi−1 (ui) 为Fi (xi) 的反函数。
对于多个连续型随机变量,基于定义1、定义2以及概率论基本原理,可将Copula函数C (.) 拆分为各边缘分布的积以及Copula密度函数两个部分,如式(6)所示。
f(x1,⋯,xn)=∂nF(x1,⋯,xn)∂x1∂x2⋯∂xn=∂nC(F1(x1),⋯,Fn(xn))∂x1∂x2⋯∂xn=∂nC(u1,⋯,un)∂u1∂u2⋯∂un⋅n∏i=1∂Fi(xi)∂xi=c(u1,⋯,un)⋅n∏i=1fi(xi)。 (6) 其中,f (x1,
⋯ , xn) 为F (x1,⋯ , xn) 对应的概率密度函数(probability density function);c (.) 为Copula密度函数。3.2 预测误差补偿
本质上来说,确定性预测结果的误差补偿是为了估计实际值y与预测值
ˆy 的关系。将二者分别视为连续随机变量Y与ˆY ,根据定义1与定义2,存在一个唯一的Copula函数C (.) 使之满足式(7)。HYˆY(y,ˆy)=C(FY(y),GˆY(ˆy))。 (7) 其中,FY (y) 和
GˆY(ˆy) 分别为随机变量Y和ˆY 的边缘累积分布函数;HYˆY(y,ˆy) 则为随机变量 (Y,ˆY ) 的联合累积分布函数。要利用Copula函数来构建联合累积分布函数,条件之一是各随机变量的边缘分布函数已知。常用方法是对于某随机变量事先假定一种类型的分布,再利用实际数据拟合得到该分布的具体参数。然而,在实际预测过程中,随机变量的分布类型是未知的,假定的边缘分布类型可能影响最终的联合分布。这也导致本文提出的误差分布拟合无法建立在深度学习框架的损失函数中。为解决这个问题,本文采用非参数核密度估计方法来拟合适当的边缘分布,该方法无需事先假定分布类型。具体表达式为
ˆFh(x)=1NhN∑j=1KER(x−Xjh)。 (8) 其中, h为带宽,用于控制估计的平滑程度;Xj为观测的样本数据值;KER (.) 为核函数(kernel function)。本研究所选择的带宽h由考虑估计偏差及其方差的最优平滑规则得到。
由于误差补偿涉及到两个随机变量,即Y与
ˆY ,本文选择五类最常用的二元Copula函数来对Y与ˆY 的联合分布进行拟合,包括两类Elliptic Copula函数(Gaussian Copula、t-Copula)以及三类Achimedean Copula函数(Gumbel Copula、 Clayton Copula、Frank Copula)。每类二元Copula函数的参数由最大似然估计法得到。具体过程如下。根据式 (6),将Y与
ˆY 的联合概率密度函数表示为fYˆY(y,ˆy)=c(FY(y;θy),GˆY(ˆy;θˆy),α)⋅fY(y;θy)⋅gˆY(ˆy;θˆy)。 (9) 其中,θy与
θˆy 分别为随机变量Y与ˆY 的边缘密度函数涉及的未知参数;c (FY (y; θy) ,GˆY(ˆy;θˆy) , α) 则为对应的Copula 密度函数,α为其未知参数。通过非参数和密度估计,根据实际观测到的离散数据序列 (y,
ˆy ),可以得到第j个样本数据的经验累积分布函数为ˆuj=FY(y) 和ˆvj=GˆY(ˆy) 。在此基础上,Copula密度函数中的未知参数估计值由式(10)得到。ˆα=argmaxN∑j=1lnc(ˆuj,ˆvj,α)。 (10) 估计未知参数值后,可以基于总体样本数据建立经验Copula函数。假设数据规模为N,经验Copula函数
ˆC (.) 由式(11)得到。ˆC(uj,vj)=1NN∑j=1I[FY(yj)<ˆuj]⋅I[GˆY(ˆyj)<ˆvj],ˆuj,ˆvj∈[0,1]。 (11) 其中,I (.) 为示性函数,用于表示事件发生与否。具体来说,在式 (11) 中,若事件
FY(yj)<ˆuj 或GˆY(ˆyj)<ˆvj 发生,则I[FY(yj)<ˆuj] 或I[GˆY(ˆyj)<ˆvj] 等于1,反之,等于0。在得到经验Copula函数之后,可以计算Copula函数C (.) 与经验Copula函数
ˆC (.) 各个对应数据点之间的欧氏距离,如式(12)所示。dis=√N∑j=1(ˆC(uj,vj)−C(uj,vj))2。 (12) 通过比较所选择的五类二维Copula函数的欧氏距离,可以判断距离最短的Copula函数即为最优函数,并将其用于补偿确定性预测的误差。
建立Copula函数后, (Y,
ˆY ) 的联合分布即可由式 (7) 确定。如前所述,ˆY 的取值由基于DeepTCN的确定性预测得到,即ˆY=ˆy 。在此条件下,可以得到Y的条件概率分布为HY|ˆY(y|ˆy)=∫y−∞hY|ˆY(y|ˆy)dy=∫y−∞hYˆY(y,ˆy)gˆY(ˆy)dy。 (13) 其中,
HY|ˆY(y|ˆy) 为ˆY=ˆy 条件下的随机变量Y的条件概率分布函数;hYˆY(y,ˆy) 为对应的条件概率密度函数;hYˆY(y,ˆy) 与gˆY(ˆy) 为概率密度函数,分别与分布函数HYˆY(y,ˆy) 与GˆY(ˆy) 对应。当HYˆY(y,ˆy) 与GˆY(ˆy) 确定时,hYˆY(y,ˆy) 与gˆY(ˆy) 即可确定。假设预测误差e为实际值与预测值之差,即e = y −
ˆy ,那么误差e可由式(14)计算得到。e=H−1Y|ˆY(y|ˆy)−ˆy。 (14) 综上,便可对确定性预测进行补偿,并以概率得到最终的预测结果。
4. 实例分析
4.1 数据收集与预处理
将所提出的方法应用于广州市机场高速车辆平均速度的预测。如图3 (a) 所示,广州市机场高速公路全长50.47km,作为交通枢纽,连接广州市北部地区与新白云国际机场。因此,该高速路交通压力较大,迫切需要一种有效的方法来预测日交通流量,以便制定相应的控制策略。
本研究为深度学习训练与测试采集了丰富的实际数据,覆盖时间为2021年9月15日到2021年10月15日。从图3可以看出,数据类型分为两类,分别为收费站数据(4C2265,4D226E,4D2267,4D2276,4C2266,4C2268)以及龙门架ETC数据(4C2201,4C2202,4C2203,4C2204, 4C2206,4C2207)。两类数据包含的字段相同,分别为检测器ID、车辆ID、检测器位置、车辆通过检测器的时间节点。
由于龙门架ETC检测器仅能记录装有ETC设备的车辆信息,因此,收费站数据与龙门架数据中的车辆信息存在差异。由于检测器故障和通信干扰等问题,龙门架数据存在数据丢失的问题。为避免因数据质量影响预测结果,首先需要对数据进行预处理。以三元里收费站为起点,机场收费站为终点这一交通流方向为例,根据检测器位置对车辆数据进行排序,可以得到具有时间序列的数据集。在此基础上,按照以下方法补全缺失的数据。
令T (veh, m) 表示车辆veh经过第m个检测器的时间节点。此外,令D (m, m') 为第m个检测器与第m'个检测器之间的距离。T (veh, m) 与D (m, m') 均可由上述提到的实际数据直接得到。假设车辆veh经过第mFor个检测器与第mLat个检测器的数据记录存在,且mFor<mLat,而经过第m个检测器的数据记录丢失,那么T (veh, m) 可以根据以下3种情况估算。
情况 1 若 mFor<m<mLat, 那么
T(veh,m)=T(veh,mFor)+(T(veh,mLat)−T(veh,mFor))⋅D(mFor,m)D(mFor,mLat)。 (15) 情况 2 若 m<mFor<mLat, 那么
T(veh,m)=T(veh,mFor)−(T(veh,mLat)−T(veh,mFor))⋅D(m,mFor)D(mFor,mLat)。 (16) 情况 3 若 mFor<mLat<m, 那么
T(veh,m)=T(veh,mLat)+(T(veh,mLat)−T(veh,mFor))⋅D(mLat,m)D(mFor,mLat)。 (17) 通过以上轨迹复原处理,本实验中的ETC车辆渗透率由60%增加至90%,为交通流参数估算提供了数据基础。具体由式(18) ~ (20)得到。
K(θ,t)=TTT(θ,t)lθ⋅Δt; (18) Q(θ,t)=TTD(θ,t)lθ⋅Δt; (19) V(θ,t)=TTD(θ,t)TTT(θ,t)。 (20) 其中,K (θ, t)、Q (θ, t) 和V (θ, t) 分别为t时域内第θ个路段的平均车辆密度、流量和速度,即交通流三参数,本实验将所选高速公路分为多个路段,如图3 (b) 所示;TTT (θ, t) 和TTD (θ, t) 分别表示t时域内第θ个路段的车辆总体行程时间和总体行驶距离;lθ代表第θ个路段的长度,由实际地理位置信息得到;Δt为数据统计时间步长,本文设为5 min。
基于以上统计方法,本研究共采集
75178 条数据记录。这些数据被划分为4个数据集,分别为数据集1、数据集2、数据集3、数据集4(具体用途见图1),划分比例为4∶1∶3∶2。4.2 交通流随机性分析
选择第3个路段(见图3 (b) )对交通流的随机性进行分析。
图4为所选路段的交通流基本图(fundamental diagram),它反映了平均车辆密度与平均车辆流量之间的关系。以5min为统计间隔,图中每一个红点代表一条数据记录。在此基础之上,利用三次多项式函数对这一关系进行拟合,见图中蓝色曲线。拟合得到的曲线走势表明,在自由流状态下,路网性能随着车辆密度的增加而提高。然而,当密度超过一定阈值时,即120 veh/km,路网性能随密度增加而降低,表明拥堵产生。曲线拐点对应的车辆密度称为关键密度,它代表最优路网性能所对应的密度,通常是交通流量控制研究中的关注点之一。值得注意的是,图4中的基本图是高度离散的,这意味着所选路段中的交通流是高度不均匀的,证实了交通流存在随机性特点。产生这种不均匀性的原因可能是车辆时空分布不均、人员驾驶行为不同、检测器分布不均匀等。目前,主要通过将路网划分为多个区域的方法来消除交通流不均匀带来的影响[15]。本文对这种随机性特征进行了进一步分析,以便得到更好的预测结果。
图5展示了所选路段上车辆的平均密度与速度之间的关系。可以明显看出速度与密度之间存在强负相关性。然而,这一关系的离散程度与红点分布的纵向宽度存在非线性相关性。图5所呈现的结果表明,低车辆密度(小于50 veh·km−1)与高车辆密度(大于250 veh·km−1)对应的离散程度相对较小,而中等密度(介于50到250 veh·km−1之间)对应的离散程度较大。一个可能的原因是,在自由流状态下,出行者倾向于以最高限速行驶,各车辆相互作用较小,因此速度差异较小。而在中等密度状态下,由于交通流之间的相互作用变得更大,驾驶行为的多样性被放大,导致离散程度变高(即交通流不均匀性增加)。类似地,当路网处于拥堵状态时,由于相互作用太强,速度只能在很小的范围内变化。
上述现象也可以在图5 (b) 中得到证实,该子图展现了各给定密度下的速度概率分布。图5 (b) 显示当密度很小或很大时,速度的概率分布比密度中等时更集中。
通过以上分析,可以证实交通流系统存在时空动态性与随机性,进一步强调了交通流预测的重要性。
4.3 确定性预测结果
确定性预测的数据输入包括由式 (15) ~ (20) 预处理得到的交通流数据以及对应时间段的天气信息(温度、湿度、降水量)。此外,DeepTCN的超参数设置为训练迭代次数E = 200,学习率η = 0.05,批量大小B = 128,扩张因子d = [1,2,4,8,16,32]。
选择RNN、GRU和LSTM网络与DeepTCN比较,根据各方法得到的指标值,来验证本文的确定性预测方法的有效性,所选指标为平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean squared error,RMSE)。表1为比较结果。
表 1 各方法预测结果Table 1. Prediction errors obtained by different methods方法 MAPE/% RMSE/(km·h−1) DeepTCN 5.866 3.923083 RNN 9.765 5.786401 LSTM 7.102 4.862808 GRU 7.273 4.918785 从表1可以看出,本文的DeepTCN的预测效果优于其他方法。相比于次优结果(由LSTM网络得到),本文提出的方法对于指标MAPE提升了22.4%,对于指标RMSE提升了23.9%。此外,GRU得到的结果与LSTM网络得到的结果相近,而RNN得到的结果最差。原因可能在于RNN在处理长时间序列信息时存在梯度消失或梯度爆炸的问题。这也进一步证明了DeepTCN在处理长时间序列信息时的优越性。
图6展示了由DeepTCN得到的确定性预测结果,横坐标代表时间,纵坐标代表车辆平均速度。其中红色实线为实际观测值,绿色虚线为预测值。从这两条曲线的走势可以看出预测结果与观测值十分接近,然而部分时间间隔内预测误差较大,如t = 90到t = 100,以及t = 250到t = 264。对此,利用Copula理论对得到的预测误差进行补偿,具体结果见4.4节。
4.4 概率性预测结果
在给定概率性预测结果之前,首先需要确定合适的Copula函数以描述相关随机变量的联合分布。本文采用车辆速度的预测值与实际值为相关随机变量,以反映预测误差的情况。表2对比了三类Copula函数的结果,分别为Gaussian Copula、Gumbel Copula以及t-Copula。
表 2 不同Copula函数的预测结果对比Table 2. Forecast comparison between different Copula functions方法 MAPE/% RMSEE/(km·h−1) DeepTCN 0.05866 3.923083 DeepTCN + Gaussian Copula 0.051726 3.637456 DeepTCN + Gumbel Copula 0.052523 3.643571 DeepTCN + t-Copula 0.051652 3.647342 从表2结果可以看出,DeepTCN与Copula函数的混合方法优于单独的DeepTCN方法,验证了DeepTCN与Copula理论结合的必要性。此外,Gaussian Copula对于指标RMSE最优,而t-Copula对于指标MAPE最优,在此基础上仍然难以判断二者孰优孰劣。对此,表3给出进一步的对比结果。
表 3 不同Copula函数的预测效果对比Table 3. Comparisons of prediction effectiveness using different Copula functionsCopula函数 欧氏距离 置信度/% PICP/% PINAW/% Gaussian Copula 0.1527 80 83.96 15.09 90 90.41 19.41 Gumbel Copula 0.1470 80 79.33 15.57 90 87.76 20.88 t-Copula 0.1475 80 78.34 13.09 90 88.09 17.18 本文采用Copula函数与经验概率分布函数之间的欧氏距离来反映Copula函数的拟合效果,距离越小代表效果越好。从表3第2列可以看出,三类Copula函数的拟合效果十分相近。此外,表3还给出不同置信度条件下的预测区间覆盖率(prediction interval coverage probability, PICP)以及预测区间标准化平均宽度(prediction interval normalized average width, PINAW)。结果表明,三类Copula函数的指标PINAW,但只有Gaussian Copula的指标PICP超过了给定的置信度水平。这意味着Gumbel Copula与t-Copula的预测结果可靠性不满足要求。根据以上分析,本文选择Gaussian Copula来进行后续的概率性预测。
图7展示了由所提出的混合概率预测方法得到的速度与时间关系图。红色曲线表示所选高速路上车辆平均速度的实际值,而浅蓝色和深蓝色带分别表示90%和80%置信度水平条件下的预测区间。结果表明,两个区间都能很好地覆盖红色曲线,验证了该方法的有效性。
5. 结论与展望
尽管深度学习技术促进了交通流预测的发展,但由于交通流具有高度随机性,在该领域仍然具有很大挑战性。考虑到这些特点,本文提出一种基于DeepTCN和Copula理论的交通流混合概率预测方法。首先,建立DeepTCN框架,并以此模型得到确定性预测结果。然后,通过合适的Copula函数来构建预测值和观测值的联合概率分布。在此基础上,得到预测误差的条件概率分布。最后,利用Copula学习DeepTCN的预测误差规律。结合区间估计理论,最终得到不同置信度水平下的概率预测结果。基于实际高速公路进行实验,得出以下结论:1)即使在相对简单的高速路路网上,交通流也存在很高的随机性,这不仅与时间和空间有关,还与交通流参数(如车辆密度和速度)有关;2) 与传统的基于深度学习的预测方法相比,DeepTCN可以提供更高的预测精度;3) Copula理论通过考虑不同交通流参数之间的关系,可以进一步提高预测精度。
本文提出的预测方法目前仅适用于高速公路,未来将拓展至城市路网。由于城市路网的拓扑结构比高速公路复杂得多,同时考虑到需求的时空分布,更应该提取空间相关性。此外,还将考虑多模式交通(公交车、私家车、行人、货车等)对模型的影响,有必要通过考虑各种交通模式之间的相互作用来进行交通流预测。
-
表 1 各方法预测结果
Table 1 Prediction errors obtained by different methods
方法 MAPE/% RMSE/(km·h−1) DeepTCN 5.866 3.923083 RNN 9.765 5.786401 LSTM 7.102 4.862808 GRU 7.273 4.918785 表 2 不同Copula函数的预测结果对比
Table 2 Forecast comparison between different Copula functions
方法 MAPE/% RMSEE/(km·h−1) DeepTCN 0.05866 3.923083 DeepTCN + Gaussian Copula 0.051726 3.637456 DeepTCN + Gumbel Copula 0.052523 3.643571 DeepTCN + t-Copula 0.051652 3.647342 表 3 不同Copula函数的预测效果对比
Table 3 Comparisons of prediction effectiveness using different Copula functions
Copula函数 欧氏距离 置信度/% PICP/% PINAW/% Gaussian Copula 0.1527 80 83.96 15.09 90 90.41 19.41 Gumbel Copula 0.1470 80 79.33 15.57 90 87.76 20.88 t-Copula 0.1475 80 78.34 13.09 90 88.09 17.18 -
[1] ZHENG F, ZUYLEN VAN H. Urban link travel time estimation based on sparse probe vehicle data[J]. Transportation Research Part C: Emerging Technologies, 2013, 31: 145-157. DOI: 10.1016/j.trc.2012.04.007
[2] OUMAIMA E J, JALEL B O, VERONIQUE V. A stochastic mobility model for traffic forecasting in urban environments[J]. Journal of Parallel and Distributed Computing, 2022, 165: 142-155. DOI: 10.1016/j.jpdc.2022.03.005
[3] CHEN S, FU H, WU N, et al. Passenger-oriented traffic management integrating perimeter control and regional bus service frequency setting using 3D-pMFD[J]. Transportation Research Part C: Emerging Technologies, 2022, 135: 103529. DOI: 10.1016/j.trc.2021.103529
[4] JIANG W, LUO J. Graph neural network for traffic forecasting: A survey[J]. Expert Systems with Applications, 2022, 207: 117921.
[5] LIU J, WU N, QIAO Y, et al. Short-term traffic flow forecasting using ensemble approach based on deep belief networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(1): 404-417. DOI: 10.1109/TITS.2020.3011700
[6] 刘甚臻, 马超. 基于小波变换和混合深度学习的短期光伏功率预测[J]. 可再生能源, 2023, 41(6): 744-749. DOI: 10.3969/j.issn.1671-5292.2023.06.006 LIU Shenzhen, MA Chao. Short-term photovoltaic power prediction based on wavelet transform and hybrid deep learning[J]. Renewable Energy Resources, 2023, 41(6): 744-749. DOI: 10.3969/j.issn.1671-5292.2023.06.006
[7] YU B, LEE Y, SOHN K. Forecasting road traffic speeds by considering area-wide spatio-temporal dependencies based on a graph convolutional neural network (GCN)[J]. Transportation Research Part C: Emerging Technologies, 2020, 114: 189-204.
[8] LV Y, DUAN Y, KANG W, et al. Traffic flow prediction with big data: A deep learning approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(2): 865-873.
[9] 王雪琴, 许心越, 伍元凯, 等. 基于混合深度学习模型的城轨短时客流预测[J]. 铁道科学与工程学报, 2022, 19(12): 3557-3568. WANG Xueqin, XU Xinyue, WU Yuankai, et al. Short term passenger flow forecasting of urban rail transit based on hybrid deep learning model[J]. Journal of Railway Science and Engineering, 2022, 19(12): 3557-3568.
[10] WU Y, TAN H, QIN L, et al. A hybrid deep learning based traffic flow prediction method and its understanding[J]. Transportation Research Part C: Emerging Technologies, 2018, 90: 166-180. DOI: 10.1016/j.trc.2018.03.001
[11] YANG D, XIE K, OZBAY K, et al. Copula-based joint modeling of crash count and conflict risk measures with accommodation of mixed count-continuous margins[J]. Analytic Methods in Accident Research, 2021, 31: 100162. DOI: 10.1016/j.amar.2021.100162
[12] LUAN S, CHEN X, SU Y, et al. Modeling travel time volatility using copula-based Monte Carlo simulation method for probabilistic traffic prediction[J]. Transportmetrica A - Transport Science, 2022, 18(1): 54-77. DOI: 10.1080/23249935.2019.1692959
[13] CHEN Y, KANG Y, CHEN Y, et al. Probabilistic forecasting with temporal convolutional neural network[J]. Neurocomputing, 2020, 399: 491-501.
[14] SKLAR M. Fonctions de repartition à n dimensions et leurs marges[J]. Paris: Université Paris, 1959, 8: 229-231.
[15] CHEN S, WU N, FU H, et al. Urban road network partitioning based on bi-modal traffic flows with multiobjective optimization[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11): 20664-20680. DOI: 10.1109/TITS.2022.3184082