出租车统计－金锄头文库

资源描述

《出租车统计》由会员分享，可在线阅读，更多相关《出租车统计（26页珍藏版）》请在金锄头文库上搜索。

1、答卷编号（参赛学校填写）：答卷编号（竞赛组委会填写）：论文题目：(D题)用出租车GPS数据分析深圳道路交通情况组别：本科生参赛学校：长春工业大学报名序号：（可以不填）参赛队员信息(必填)：姓名专业班级及学号联系电话参赛队员1马畅电气工程及其自动化080307班 2008062413756028303参赛队员2叶金凤电气工程及其自动化080308班 2008048115948016443参赛队员3隋成阳电气工程及其自动化080307班 2008043015044153025 答卷编号（竞赛组委会填写）：评阅情况（省赛评阅专家填写）：省赛评阅1：省赛评阅2：省赛评阅3：省赛评阅4：省赛评

2、阅5：题目：用出租车GPS数据分析深圳道路交通情况一、摘要GPS终端作为能反映车辆实时数据的工具已被越来越多的出租车司机安装，本文就D题给出深圳市的出租车GPS的数据进行研究与统计，展开讨论、分析和建立数学模型，利用数学知识进行求解。问题一对数据进行分析，从中剔除一些无效的数据和提取出不完整的数据；其次利用概率统计的理论，分别对不同数据群中数据进行抽样；最终根据所抽样出的实时数据进行整理，从而得到出租车起讫点分布图，并根据实际区域适当地划分出交通小区。问题二在小区划分的基础上，根据出租车GPS数据，得出载客出租车的OD时空分布，并将其数据信息映射到区域起讫图矩阵中，清楚直观地反映人们出行的OD

3、时空分布。问题四假定拥堵标准为平均行驶速度为20公里/小时，从抽样出的行驶数据中，分别以时间段、经纬度作为其自变量，拥堵次数作为因变量进行统计，由于所选的车辆为随机抽取且满足一系列合理假设，所以拥堵的路段、时段近似服从正态分布，求解出拥堵的路段以及时段。然而获得切合实际的现状OD分布却较为困难,传统的方法也由于种种主观因素导致结论和实际偏差过大，交通运输系统是一个不断发展而又相对稳定的系统，过去和目前的交通量在各区域间的分布函数也必然是连续的具有相对稳定性，这样可以最大限度地利用过去和目前已掌握的一些信息，将过去现在及未来有机结合，实现较为准确地测出区域交通量OD 分布的规律,基于以上现状及交

4、通量分布规律，提出了借助主、客观信息及一些运输经济技术指标来推断区域交通量OD的分布的方法，提出Bayes估计量。首先利用主、客观信息和运输技术经济指标建立交通分布的先验概率分布;然后根据抽样所得到的交通量分布情况由Bayes 公式估计出综合考虑了过去和现状信息的交通分布的后验概率分布;最终转化为具体交通量的OD分布。使用Bayes估计就充分利用获得的统计数据实现滚动式预测，以利于最大限度地利用已掌握到的信息对交通量分布的情况进行滚动修正, 从而提高精度。关键字：交通小区、OD分布、Bayes估计。二、问题重述背景各大城市出租车越来越多的安装了GPS终端，这些终端能够每隔1分钟向出租车管理中心

5、发送本车的位置、速度和方向等信息，是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据，这些数据包括序号，车牌号码，GPS时间，经度，纬度，车辆状态(空车、重车)，车辆速度，车辆方向(8个方向)等信息。问题根据提供的深圳市出租车GPS终端所给出的数据（车辆实时数据）:恰当的划分交通小区，并用小区中某点的经纬值作为该点小区的坐标；结合小区划分和出租车GPS数据作出载客出租车的OD时空分布；在合理的假设条件下，对人们出行的OD时空分布进行推断；最后筛选拥堵的路段和拥堵的路口时段（拥堵标准自定）。三、变量声明表示从小区到小区的交通量表示区域交通总量表示从小区到小区的交通量与整个

6、研究区域的交通量之比。分别表示表示各交通量的起点、终点,表示小区的交通量的概率分布之和表示小区的交通生成量用来表示区域的交通生成量与分布到其它各小区之间的关系为交通量后验分布均值四、模型假设假设矩阵中对角线元素为零（即忽略小区内部的交通量）。假设设各小区间的交通量分布为直线分布, 即从小区分布到小区的交通量不经过第三小区。假设研究的各个小区的社会经济地理特点没什么大的区别, 各区的相对位置近似。假设各出租车交通行驶过程中互不影响。且行驶路线及乘客乘车为随机量。假设因出租车所处环境对GPS数据的统计的影响不会对整个模型造成影响。五、问题分析这是一个统计问题，要做的是根据GPS所检测

7、的实时数据推断出人们出行的OD时空分布。但是所给出的数据有很多，对出租车起止点进行枚举是不现实的事，故可以通过合理的假设对所有的数据进行数理统计，剔除对本研究无价值的数据以及与分布偏离过大的数据，从而得到简化的数据群，其数据集合了所有数据的主要信息与特点，能够完成对结果精确度的要求，并在一定程度上简化算法。对于问题一，可根据信息中的车辆状态及车速进行起讫点的推断。由于堵车等限制车速的问题无法忽视，故选用车辆状态的变化作为起讫点的判断量，利用扩大区域的方法排除由于时间的不间断所引起的误差。对于问题二，交通小区之间交通流量的确定，可以对部分车辆进行统计再换算回所需的交通总量。由于结论中小区间交通量

8、所要求的方向性，故利用矩阵图集表示载客出租车车的OD分布。对于问题三，可在画出区域图及交通OD图对人们出行进行分析与推断。对与问题四，由于道路电及车速为已给信息，对拥堵的路段时段以及拥堵的路口时段的筛选便可看作为单纯的统计问题进行分析，得到所需结论。建立统计模型最主要是：1数据的获取与处理，记录、整理和比较数据，并将结果用图表进行显示。2抽样，为问题分析提供统计根据。3数据分析，探索数据中存在的趋势、点群以及简单的或多重的相关性。4假设检验，验证可说明具体现象的原因和起源的概念或模型。5定量预测，对具体问题提供解答。基于以上分析，对于数据的统计过程是明确的，我们的目标之一是从大量的实时数据中提

9、取出与起讫点有关的的数据，并对起讫点进行有依据的统计，从而划分出交通小区并进行OD时空分布的推断。目标之二是针对速度较慢的数据统计出拥堵的路段时段以及拥堵的路口时段。六、模型建立GPS实时数据对于题目中所涉及的问题推断所涉及的关系如图所示：由于传输过程，采样时间等因素所产生的不完整信息或带有部分错误数据的无效信息完整数据信息假设、剔除、归纳、解决所需数据车辆速度车辆状态经纬度GPS时间堵塞情况起讫点交通小区坐标划分节假日工作日OD分布对于问题一：首先应对GPS实时数据进行统计，归纳与简化；由于在一周之内GPS所传回的车辆信息有800多辆，但去除无效信息的车辆以及将在一周内未完全出行的车辆另行统

10、计，则得到全周出行的车辆为400辆。在其余的车辆中可以统计出有200余辆车在一周之内为半周出车。为便于分析比对人们在不同情形下的的出行情况，将统计日期分为工作日（即周一至周五）及节假日（即周六、周日），并在此基础上对其进行分别讨论与计算。对于工作日，即五天内市内出车的车辆所行使的全部交通量总和为式中为工作日每辆车每天所产生的交通量。对于节假日，即两天内市内出车的车辆所行使的全部交通量总和为式中为节假日每辆车每天所产生的交通量。“1/2”由于近半数的出租车在节假日只选择一天出车。为了达到结论的准确性和提高精度，随即对工作日的二十辆车的各自一天进行统计，对节假日的七辆车的各自一天进行统计，从而

11、可得更为准确的数据：式中为工作日二十辆车每天所产生的交通量。对于节假日，即两天内市内出车的车辆所行使的全部交通量总和为式中为节假日七辆车每天所产生的交通量。根据抽取的数据对出租车起讫点进行统计，并根据相同大小的经纬度区域划分交通小区。对于问题二和问题三：假设整个研究区域共划分为m个小区, 则区域交通量OD 分布矩为:()Q11 Q12. 表示从小区到小区的交通量。拟假设矩阵中对角线元素为零。设区域交通为, 则有:= （）并记：（）（）式中表示从小区到小区的交通量与整个研究区域的交通量之比。取随机变量分别表示各交通量的起点、终点，利用参数可构造的联合分布。见表1表1：x、y的联合分布表X

12、Y1,2,mX=i12mY=jP11,P12, ,P1mP21,P22, , P2m, ,Pm1,pm2, ,pmmP1,P2, ,PmP1P2Pm (4) (4)式是的概率分布。现在对矩阵（1）的估计问题转化为对概率分布（4）的估计。变量x的边沿分布为：（）（5）式表示小区i的交通量概率分布之和。设各小区间的交通量分布为直线分布，即从小区i分布到小区j的交通量不经过第三小区k.则有；（）（6）式中表示小区的交通生成量。把条件概率简记为用来表示区域的交通生成量与分布到其它各小区之间的关系。由于即：（）即： ()估计P时，就可以利用公式（）先估计P和P。对于问题四：假定路段在某个时段平

13、均行驶速度小于20公里/小时认为是拥堵，从抽样出的行驶数据中，分别以时间段、经纬度作为其自变量，拥堵次数作为因变量进行统计，由于所选的车辆为随机抽取且满足一系列合理假设，所以拥堵的路段、时段近似服从正态分布，从而求解出拥堵的路段以及时段。七、公式推导为了更准确地计算出P对P进行Bayes估计. 同样的思路可建立的B ay e估计。为讨论方便, 将记为 , 取得小区的交通生成量为,进行全样本抽样, 设为小区的交通生成量, 则显然是随机变量 , 且服从二项分布 , ，若仅仅考虑机会均等,的估计量为, 这仅是一个均值,而对区城和其它各小区的区别未能反映,过去的信息和运行状况未起作用, 通过对采用Bayes 估计, 就能克服上述缺点。Bayes 方法认为参数不是一个确定的常量 , 而被看作是一个随机变量的一个值，因而符合客观实际。根据已获得的关于的信息, 可建立准确程度不同的先验分布,作为对进行修正的后验分布的依据。1 、如果所研究的各个小区的社会经济地理特点没什么大的区别, 各区的相对位置近似。基于这样的情况, 如果对各区间的交通分布情况

展开阅读全文

出租车统计

最新文档