用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛

上传人:简****9 文档编号:107316761 上传时间:2019-10-18 格式:DOC 页数:38 大小:1.50MB
返回 下载 相关 举报
用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛_第1页
第1页 / 共38页
用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛_第2页
第2页 / 共38页
用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛_第3页
第3页 / 共38页
用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛_第4页
第4页 / 共38页
用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛》由会员分享,可在线阅读,更多相关《用出租车gps数据分析深圳道路交通情况2011年浙江科技学院校内选拔赛(38页珍藏版)》请在金锄头文库上搜索。

1、2011年浙江科技学院校内选拔赛(初赛)承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设

2、置报名号的话): 所属学校(请填写完整的全名): 浙江科技学院 参赛队员 (打印并签名) :1. 康文豪 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2011 年 7 月 9 日赛区评阅编号(由赛区组委会评阅前进行编号):2011年浙江科技学院校内选拔赛(初赛)编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):用出租车GPS数据分析深圳道路交通情况摘要本文根据深圳市区出租车实时GPS数据,通过SAS软件、MATLAB软件与E

3、XCEL软件等工具与物理、数学等知识对整个深圳市区交通情况作一个实时动态分析。对于问题一,首先我们利用SAS软件、EXCEL软件与物理运动学知识较精确统计出部分出租车在2011.4.182011.4.26一个星期内所有上下客点的位置坐标,然后用MATLAB软件对这些数据点画出散点图与深圳地图对比,从而不断改进数据以减少误差。接着用SAS软件对这些数据点进行动态聚类分析,进而分成6个区,并以小区的重心坐标作为各小区坐标。对于问题二,我们用SAS软件对以上数据点进行判别分析,可得所有上下客点所属小区,进而得出载客出租车的OD时空分布。对于问题三,我们对人们出行的OD时空分布进行空间和时间两角度推断

4、:空间角度推断,在模型二中得出的人们出行的OD时空数量分布,我们先计算出人们出行的OD时空百分数分布(人们出行的OD时空数量分布=人们出行的总数*人们出行的OD时空百分数分布 );时间角度推断,同问题二研究方法相同,我们再统计出1:00,3:00,5:00,7:00,9:00,11:00,13:00,15:00,17:00,19:00,21:00,23:00十二个时刻下人们的OD时空百分数分布,根据这十二个时刻下的人们出行OD时空百分数分布情况,采用MATLAB拟合工具箱多项式拟合,得拟合曲线,这样即可推断出一天24小时里任一时刻下人们出行OD时空百分数分布情况。对于问题四,我们用MATLAB

5、软件对部分出租车在一天24小时内载客速度关于时间的散点图,从而得出拥挤的时段。再采用问题二的判别分析方法,对部分出租车出行的OD时空分布进行分析,同时统计出采样出租车的车速,计算出每种OD时空分布的平均车速。路段交通情况用各小区之间的交通平均车速大小来表示;路口交通情况用各小区内部的交通平均车速大小来表示。假定:25km/h以上为畅通,25km/h以下为拥堵。本文对各问题皆做了较为完整的回答,并在模型检验时不断修正以减少误差,并对仍存在的误差给出了合理的解释。所用的方法思想在解决本题的同时具备适用范围广与可靠性强的特点。关键词:GPS 动态分析 SAS 动态聚类分析 Matlab 判别分析 O

6、D时空分布36一、问题重述各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。附注网站提供了深圳市出租车GPS数据,从这些数据你是否能够:1. 根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。2. 根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:某时刻从坐标到

7、、的出租车有多少辆。3. 由此,在合理的假设条件下,能否对人们出行的OD时空分布进行推断?4. 根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。二、模型假设一般来说,交通小区的划分应该遵循以下原则:(1)同质性,分区内的经济 社会等特性尽量一致(2)小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料(3)分区数量适当,数量太少又会降低调查和分析的精度(4)对于已做过 OD调查的城市,最好维持原已划分的小区三、符号说明1.name车牌号2.time采集时间点(

8、格式:YYYY/MM/DD hh:mm:ss)3.jd经度4.wd纬度5.status车辆状态(0非打表,即:空载;1已打表,即:重载)6.v 车速(单位为:km/h)7.angle行车方向(0东;1东南;2南;3西南;4西;5西北;6北;7东北)四、模型建立与求解1、问题一我们选择部分出租车在2011.4.182011.4.26一个星期内GPS数据信息出租车作为研究对象,如果出租车在两分钟内完成客人上车又下车两个过程,或者下车又上车两个过程的话,我们先将这些特殊的数据去掉。0-1表示出租车上客过程,1-0表示出租车下客过程,结合匀变速直线运动相关知识,可以计算出客人确切的上客点和下客点位置坐

9、标,然后用matlab软件作出出租车上客点和下客点的散点图,这样我们得到了深圳区人流的分布图。再用SAS统计软件对这些数据点进行动态聚类分析,共分成六类,同时作出对应的聚类图。然后,选取每个聚类中各点的重心坐标作为这个该小区的坐标。1.1模型建立出租汽车上客点与下客点位置的确定:根据装载GPS的出租汽车在传回数据中的运营状态指标来判断出租汽车的载客情况, 0表示空车, 1表示重车(载客)。上客表示相邻两点出租汽车的状况从空车变成重车, 即从0变成1, 下客表示相邻两点出租汽车的状况从重车变成空车, 即从1 变成0。从而可以确定车辆运营状态的转换区间。在找出转换区间之后, 需要确定上下客点的位置

10、。为此, 利用物理学知识求解, 具体过程如下:相邻两点运营状态值为不同值(即0和1), 假定前一个点 (速度为)到停车点(上客或者下客点)之间车辆作匀减速运动, 停车点P(速度为0)到后一个点 (速度)之间车辆作加速度大小相同的匀加速运动, 加速度为a。上客和下客停车时间很短,可以忽略不计。显然,相邻两点之间的距离S、时间t、瞬时速度和为已知的。只要求出从前一个点到停车点的距离或者从停车点到后一个点的距离, 即可确定上下客点的位置。假设线段在P点的定比分比为。这段路程,出租车作匀减速直线运动,对应的物理学规律为:这段路程,出租车作匀加速直线运动,对应的物理学规律为:根据定比分比的定义,我们可以

11、得到:进而可以得到上下客点坐标公式为:根据上面的计算结果, 可以得到较为准确的上下客点的位置, 据此可以得出上下客点所属的路段和小区。1.2数据处理为了作图方便,将采集到的数据点中的经纬度坐标作如下变换处理。经纬度坐标与区域坐标换算公式如下:其中,用excel软件分析可以得到,采集的数据点中纬度的最小值为22.49548,经度的最小值为113.8148。最后我们可以得到出租车上下客点的位置坐标,具体数据见附录一。当用excel软件统计分析计算出上客点和下客点坐标后,然后用matlab软件做出这些数据点的散点图。对应的Matlab程序见附录二。Matlab散点图: 图 上下客点散点图 从matl

12、ab散点图中,我们可以看出,深圳市东南部区域的人流密度比较大,人口比较集中;深圳市西南部区域人流密度相对比较小,人口相对比较稀松。这和实际情况比较符合。同时,将其与深圳市实际地图作对照,散点图的轮廓基本与深圳市的市区边界相符。图 深圳市的区域图为了进一步了解深圳市人流分布情况以及考虑到区域划分实际情况,我们用SAS软件对这些数据点进行动态聚类分析,并且作出对应的聚类图。SAS程序见附录三。通过聚类分析,我们也可以得到每一个区域的数据点坐标。数据见附录四。我们以每个区域的重心坐标作为每个小区的位置坐标。 聚类图:图 上下客点聚类图结合聚类分析的结果,以及上下客点聚类图,我们可以知道:这六个小区的

13、大致位置,具体编号如上图所示,以及这六个小区的位置坐标。小区编号位置坐标1(410.0,58.4)2(1.0 ,152.7)3(304.2 ,67.4)4(124.2 ,47.0)5(222.0 ,115.0)6(240.8 ,47.9)用matlab软件作出每个小区的大致轮廓图以及每个小区的重心。程序见附录五。 图 各小区轮廓图从该图中,我们可以大致看出六个小区的轮廓,这和深圳市实际划分比较符合。聚类分析:聚类分析是研究分类问题的一种多元统计方法。所谓类,就是指相似元素的集合。把相似的东西归成类,根据相似的程度将研究目标进行分类。所谓距离,就是表示测度样品之间的亲疏程度。将每一个样品看作p 维空间的一个点,并用某种度量测量点与点之间的距离,距离较近的归为一类,距离较远的点应属于不同的类。本文中,我们用欧氏距离对数据之间进行测距。动态聚类法 :基本思想:选取若干个样品作为凝聚点,计算每个样品和凝聚点的距离,进行初始分类,然后根据初始分类计算其重心,再进行第二次分类,一直到所有样品不再调整为止。 流程图:图 动态聚类法流程图基本步骤:一、选择凝聚点;二、初始分类;对于取定的凝聚点,视每个凝聚点为一类,将每个样品根据定义的距离向最近的凝聚点归类。三、修

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号