融合时序和空间特征的车辆异常轨迹检测方法

资源描述

《融合时序和空间特征的车辆异常轨迹检测方法》由会员分享，可在线阅读，更多相关《融合时序和空间特征的车辆异常轨迹检测方法（9页珍藏版）》请在金锄头文库上搜索。

1、融合时序和空间特征的车辆异常轨迹检测方法夏英,张安洁(重庆邮电大学计算机科学与技术学院,重庆 400065)0 引言近年来,大量研究人员致力于研究如何处理轨迹数据并使其服务于智能交通、智慧城市等领域1-3。基于度量的方法主要根据轨迹段之间的距离进行异常检测。文献4提出基于Hausdorff距离进行轨迹划分的异常轨迹检测框架。文献5在聚类基础上建立基于离散状态的路径模型。文献6结合有向Hausdorff距离进行异常检测,考虑方向差的同时降低计算复杂度。基于度量的方法主要考虑轨迹的距离特征,对轨迹的序列信息考虑不足。基于统计的方法主要依赖历史数据的支持。文献7通过计算网格序列频度来检测异

2、常轨迹。文献8提出一种两阶段轨迹异常检测框架,解决寻找局部异常轨迹和绕行问题。文献9在网格序列基础上提出新的DIS距离计算轨迹之间的相似度。这类方法未充分考虑到历史数据少、数据规模大等情形。基于学习的方法主要利用序列建模。文献10提出的XGBoost方案是经典的分类算法;文献11基于循环神经网络,采用轨迹嵌入捕捉轨迹序列信息;文献12基于行驶时间和距离的循环神经网络实现异常检测;文献13结合循环神经网络和卷积神经网络检测异常轨迹。基于学习的方法目前较为主流,但循环神经网络存在长距离依赖问题,无法长久记忆。对网格化轨迹进行序列建模仅提取轨迹时序特征,难以充分提取轨迹空间特征,如轨迹偏转角度、行驶

3、距离等11。为充分利用轨迹数据的时空特征,本文提出融合时序和空间特征的车辆异常轨迹检测方法(vehicle abnormal trajectory detection method based on fusing temporal and spatial features, ATD-TS)。该方法具有以下特点:在编码器部分引入自注意力机制(stacked sequence auto-encoder with self-attention, SSA),解决传统循环神经网络的长序列依赖问题,充分提取轨迹时序特征;提取轨迹偏转量和行驶距离,并使用全连接神经网络进行特征提取(full connecte

4、d network with deflection and driving-distance, FDD),以此挖掘轨迹中更多空间信息。1 相关基础1.1 原始轨迹原始轨迹T=p1,p2,pn是记录位置信息的时间序列14,位置点pi由(loni,lati,ti)表示,其中(loni,lati)是位置经纬度,ti是对应的时间戳。p1和pn是原始轨迹的起点和终点。1.2 映射轨迹根据原始轨迹经纬度的空间范围,将空间区域分割成相同大小的网格grid14,建立网格与原始轨迹点的对应关系,将原始轨迹T=p1,p2,pn映射为tr=grid1,grid2,gridn。1.3 异常轨迹在出租车、物流等特定应用

5、场景下,车辆移动轨迹会有预设的正常路径,通过这些路径的概率相对较高,异常轨迹产生的原因可能是主观上的(如绕路行为)或客观上的(如道路拥堵等)。1.4 行驶距离已知轨迹起点p1和终点pn,p1和pn的行驶距离s表示为15(1)(1)式中,dist(pi,pi+1)表示相邻两点之间的空间距离。1.5 轨迹偏转角偏转角16是相邻两个轨迹运动方向上的夹角。已知由p1、p2、p3这3个点构成的夹角称为开放角,开放角的补角称为偏转角,偏转角与开放角如图1所示。偏转角越大表明运动发生偏转程度越大。和的计算式为(2)=-(3)图1 轨迹偏转角与开放角Fig.1 Trajectory deflection an

6、gle and opening angle1.6 轨迹偏转量轨迹偏转量为轨迹偏转角度的和,计算公式为(4)(4)式中:k表示第k个相邻两轨迹运动方向上的夹角,即轨迹偏转角;n表示一条轨迹有n个偏转角。2 ATD-TS方法设计2.1 总体框架ATD-TS总体框架分为轨迹预处理、轨迹特征提取和异常检测3个组成部分,如图2所示。轨迹预处理将原始轨迹转换为映射轨迹,同时提取轨迹偏转量和轨迹行驶距离;轨迹特征提取在编码器(Encoder)每层引入SSA,构建融合SSA的堆叠序列自编码器模型以提取轨迹偏转量和轨迹行驶距离等空间特征;异常检测融合轨迹偏转量、轨迹行驶距离和轨迹时序特征,输入到多层感知机(mu

7、ltilayer perceptron, MLP)降维后输入softmax层计算轨迹的异常概率,进而对轨迹进行异常检测。图2 车辆异常轨迹检测总体框架Fig.2 Overall framework of vehicle abnormal trajectory detection2.2 融合自注意力机制的堆叠序列自编码器模型构建车辆轨迹数据相邻点有着上下文关系,本文引入自注意力机制结合堆叠的序列自编码器来自适应学习。图3为融合自注意力机制的堆叠序列自编码器示意图。图4为门控循环单元(gate recurrent unit,GRU)结合自注意力机制示意图。图3 融合自注意力机制的堆叠序列自编码器F

8、ig.3 Stacked sequence auto-encoder fusing self-attention2.2.1 堆叠序列自编码器为充分提取轨迹时序特征,采用GRU作为基础单元构建堆叠序列自编码器,其结构如图5所示17。堆叠序列自编码器通过编解码过程提高特征提取能力。图4 GRU结合自注意力机制Fig.4 GRU combined with self-attention图5 序列自编码器网络结构Fig.5 Network structure of sequence auto-encoder假设GRUEncoder()是编码函数,GRUDecoder()是解码函数,对每个时间步骤t、输

9、入xt,轨迹序列编码表示为ht=GRUEncoder(xt,ht-1)(5)获取编码后得到语义向量S,并由解码器解码得S=f(h1,h2,hn)(6)(7)(6)式中:语义向量S作为解码器的初始隐藏状态,并不作用于之后的时刻;f()是从编码器隐藏层中总结信息并为解码器生成上下文向量的函数。单层序列自编码器虽能学习轨迹的上下文关系,但对于轨迹数据更为抽象的内在特征的提取较欠缺,为进一步提高特征提取能力,本文将图3和图4所示结构扩展为四层堆叠序列自编码器,原始数据作为最底层的输入,每一层的输入都是上一层的输出,使用dropout机制避免过拟合问题。在四层堆叠序列自编码器中,使用局部无监督准则对每一

10、层进行预训练操作,优化堆叠序列自编码器以提高后续分类性能,预训练目标函数为(8)(8)式中:n为批量样本个数;xt为输入数据;yt为解码器的拟合分布。利用上述预训练好的编码器对轨迹数据进行特征提取,编码器最后一层输出则可作为最终的时序特征。2.2.2 自注意力机制自注意力机制的核心就是在不依靠外来信息的情况下根据输入数据自适应选择最相关的特征18。在堆叠序列自编码器的每一层引入自注意力机制,上一层编码器的输出作为自注意力机制的输入,得到的特征向量作为下一层编码器的输入,编码器的输出状态H为H=(h1,h2,hn)(9)(9)式中,ht表示t时刻编码状态。注意力向量a的计算公式为a=softma

11、x(Ws2tanh(Ws1HT)(10)(10)式中:向量a的每一个元素代表一个概率;Ws1Rdau以及Ws2Rda是可学习参数,da是一个超参数。将H的每个元素与a中对应的元素相乘后相加得到最终的编码状态A为A=aH(11)将编码状态A与输出状态H对应相加以进行特征融合,得到下一层的输入H,最终堆叠序列自编码器中编码公式可更新为(12)2.3 结合偏转量和行驶距离的特征模型构建在具有相同起点与终点的轨迹中,正常行驶的车辆其轨迹偏转量及行驶距离等特征往往在一定范围内具有一定的相似性。图6为行驶距离实例,图7为偏转角度实例。当发生异常行为时,轨迹行驶距离及偏转角度通常与正常轨迹具有较大差异。正常

12、轨迹的偏转量远低于异常轨迹的偏转量,轨迹偏转量也是异常轨迹检测的一个重要依据。因此,为进一步提高车辆异常轨迹的检测效果,提取轨迹偏转量和轨迹行驶距离特征作为参考指标。图6 行驶距离实例Fig.6 Driving-distance example图7 偏转角度实例Fig.7 Deflection example轨迹行驶距离为轨迹中相邻两点的空间距离之和,Haversine方法19能够有效减少相邻两点之间的短距离求解误差,其满足的关系为cos(1)cos(2)hav(2-1)(13)(13)式中:R为地球半径;1和2分别表示pi和pi+1的纬度;1和2分别表示pi和pi+1的经度。全连接神经网络作

13、为特征提取网络,包含输入层、隐藏层和输出层。将轨迹偏转量和行驶距离作为输入数据分别输入到两个全连接神经网络中,通过隐藏层进行训练得到最终的轨迹偏转量和行驶距离等特征。假设输入特征向量为x,输出为y,则计算公式为z=Wx+b(14)y=f(z)(15)(16)(14)(16)式中:z为未激活的输出;W和b为可学习参数;f()为非线性的激活函数sigmod。2.4 异常检测经过特征提取阶段,原始轨迹被表示为一个融合后的特征序列。异常轨迹标号为1(正类),正常轨迹标号为0(负类)。为有效检测异常,利用多层感知机实现特征降维,降维公式为Mi=(WiEi+bi)(17)(18)3 实验与分析3.1 数据

14、集实验采用葡萄牙波尔图市的出租车轨迹数据集,包含442辆出租车在2013年1月到2014年6月的轨迹数据,每辆出租车每隔15 s报告其位置。为与传统的异常轨迹检测方法进行对比,在给定源-目的地对(SDPair)之间进行对比试验,抽取5对含有充分轨迹的SDPair。本文采用文献20中的方法,每对SDPair包含5%左右的异常轨迹,具体数据描述如表1所示。实验按811划分训练集、验证集与测试集,对原始轨迹进行网格划分,网格大小为100 m100 m,然后利用唯一标识标记网格,建立网格与原始轨迹点的一一对应关系。表1 SDPair的轨迹数据信息3.2 对比方法及参数设置为验证所提方法的有效性,将本文

15、方法与XGBoost10、IBAT7、ATDC9等方法进行比较。实验在64位Ubuntu18.04操作系统下的Intel Xeon W-21333.6GHz CPU上进行,使用Tensorflow框架和python3.6完成神经网络的搭建,堆叠序列自编码器的层数设置为4,词向量降维之后的向量维度为64, dropout机制比例为0.5,神经网络模型优化器为Adam。3.3 评价指标实验选用准确率(Accuracy, ACC)及F1评分(F1-score)作为实验定量评估指标,其定义式为(19)(20)(21)(22)(19)(22)式中:P为精确率,表示正确预测为正的占全部预测为正的比例;R为召回率,表示正确预测为正的占全部实际为正的比例;F1为对P与R的综合评估。3.4 实验结果分析实验均在同一实验环境下进行,且均选用最优结果。ATD-TS方法与XGBoost、IBAT、ATDC、ATD-LSTM和ATD-GRU 5种异常轨迹检测方法的异常检测效果如表2所示。从表2可知,本文提出的ATD-TS方法无论是在准确率还是F1评分上均

展开阅读全文