数据挖掘在地铁闸机利用率分析中的应用

上传人:飞*** 文档编号:43107177 上传时间:2018-06-04 格式:DOCX 页数:3 大小:334.63KB
返回 下载 相关 举报
数据挖掘在地铁闸机利用率分析中的应用_第1页
第1页 / 共3页
数据挖掘在地铁闸机利用率分析中的应用_第2页
第2页 / 共3页
数据挖掘在地铁闸机利用率分析中的应用_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据挖掘在地铁闸机利用率分析中的应用》由会员分享,可在线阅读,更多相关《数据挖掘在地铁闸机利用率分析中的应用(3页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘在地铁闸机利用率分析中的应用刘健 1,吴绍春 2( 1.上海地铁维护保障中心上海2000702.上海大学计算机工程与科学学院上海200072 )【摘要 】: 本文从数据挖掘的概念出发 ,针对上海地铁目前的规模及今后的发展趋势 ,提 出 了 时 间 序列预测法客流数据挖掘分析 方 法 ,对目前已经形成网络化运营的上海地铁客流分析非常有效 ,使 得 挖 掘 出 的结果更具指导意义 ,为上海地铁运营 、建设部门提供重要的指导意义 。【关键词 】:数据挖掘 客流 时间序列预测法地铁中的客流系统蕴含了丰富的数据信息 ,如 何呈季节性变化3。统 计 模 型 中 最常用的方法是时间序列预测法 ,从

2、时间序列中找出其中的 特 征 、规律和变化趋势 ,从 而 得 到预测信息 。从这海量的信息中挖掘出有用的知识 , 是 一 个 有 待 研究解决的问题 。 本文将数据挖掘技术用于地铁巨量客 流分析 ,针对地铁客流 的 实 际 特 点 ,使用时间序列预测 法对客流数据进行分 析 ,提取单一线路客流信息进行 时间序列预测法的优点是计算简单 ,使 用 的 历 史数据挖掘分析 , 用于指导地铁客运部门组织闸机设置 方案,服务客运决策 。 提出了今后使用时空预测法对各数据少 , 缺点是不同的时间序列模型预测的结果差别 很大。 但该方法的优点 是 简 洁 实 用 ,预 测 精 度 高 ,能 保 证样本量和计

3、算量不随时间的变化而增加 , 缺 点 是 如条线路之间的客流数据进行分析更加有效 , 地铁建设部门决策新线设计及建设方案1。 1.数据挖掘用 于 指 导果数据样本不多且数 据 波 动 较 大 ,则预测结果偏差较 大。 基于时间序列分析的从研究对象本身出发的微观 研 究 ,属 于 短 期 预 测 ,包 括 实 时 预 测 ,主要考虑的是客 流数据的时间特征4。 3. 时间序列客流预测数据挖掘方法对上海地铁的指 导意义 3.1 时间序列预测法数据挖掘是信息技术自然演化的结果 。 20 世纪 60年代以来 ,数据库和信息技术己经从原始的文件处理 演化到关系复杂 、功能强大的数据库系统 ,数 据 库

4、业 界逐步开发了以下功能 :数据收集和数据库创建 ,数 据 管 理(包括数据存储和检 索 ,数据库事务处理 ),以 及 数 据分析与理解 (涉及数据仓库和数据挖掘 )。数据挖掘是从大量数据中发现并提取知识 , 存放在数据库 、数据仓库或即 从其 他 信 息库中的大量数据中挖掘有用知识的过 程。 它建立在数据库 ,尤其是数据仓库基础之上 ,面 向 非专业用户 ,定位于桌 面 ,支持即兴的联机查询 。 数 据挖掘技术能自动分析数 据 ,进行归纳性推理和联想 ,寻 找数据间内在的某些关 联 ,发 掘 潜 在 的 、对 信 息 预 测 和决策行为起着十分重要作用的模式 ,从而建立新的业 务模型 ,帮助

5、决策者制定市场策略 ,做出正确决策 。 2. 基于时间序列的地铁客流预测数据挖掘方法 当 今 社 会 ,随着交通的日益发达 ,交通运输行业的 客流量变化具有复杂性 、随机性和周期性的特征 。 现在 地铁客流预测大多采用传统的时间序列分析方法进行 短期预测 。 比如每年的春运 、暑期、节假日 ,使用前几年 的这些节假日前 30 日 的 客 流 数 据 ,并选择合适的预测 模型来预测本次节假日期间的客流趋势2。 由于每一种预测模型都有自己的特 点 ,适合某一类的数据 。 因 此 ,模型的选择对于准确的预测是很重要的 。地 铁 客 流 的周 期性一般是以年为周期 ,每 年 的 春 运 、暑 期 、节

6、 假 日表 1 闸机实际利用分析表 2011 年第 12 期福 建电 脑115时间序列预测法对上海地铁统计单一线路的 日 常 客流非常有效 。 通过研究每个时间段相应的客流情况 (如 图 1),很容易发现不同站点的客流高峰时段 ,有 效 指导地铁运营部门在大客流时段集中力量积极组织客 流运输 、疏散及各类应 急 预 案 。 同 时 ,通过分析同一站 点 进站和出站即时客流之间的差值大小 (如 图 2),可以找出影响旅客进出站速度与闸机方向选择 、闸 机 数量设置之间的关系 ,可以指导运营部门决定哪些闸机 按照日常实际平均出站能力 20 人/闸 机?分 钟 作 为理论出站能力 。 通过上表我们可

7、以发现 ,儿童医学中心 和航津路站的闸机实际利用率都达到了 7%左右。 高科设置为进站方向 ,哪些闸机设置为出站方向 ,优 化 闸 机 设置,并且可以决定是否需要增加或减少闸机数量 。 3.2 时间序列预测法在 6 号线客流分析中的应用上 海 地 铁 6 号 线 全 长 33 公 里 ,设 28 个 车 站 ,其 中 地下车站 19 座,高架车 站 9 座 ,北 起 港 城 路 ,西 至 济 阳 路,线路呈南北走向 。 它将外高桥保税区 、金 桥 出 口 加工 区 、陆家嘴金融贸易区 、六里现代生活园区 、三 林 居 住区等有机衔接起来 ,并连接沿线的高桥居住区 、东 沟 居 住 区 、金 桥

8、 新 村 、金 杨 新 村 、罗 山 新 村 、香 山 新 村 、洋 泾 居 住 区 、竹 园 新 村 、潍 坊 新 村 、塘 桥龙 阳 居 住 区 、临 沂昌里居住区 、 三林居住区等 22 个大型居住区连在 一起,是浦东非常重要的一条交通线路 。现 在 , 我 们 使 用 SQL Server 中 Analysis Service 提 供的数据挖掘功能 ,分析构建数据挖掘方案 。 系统随机 抽选高科西路 、儿童医 学 中 心 、洲海路和航津路四个车 站 2011 年 1 月 6 日 的 早 高 峰 7:008:00 时 间 段 的 出西路站闸机数量是航 津 路 站 的 1 倍 ,是儿童医学

9、中心 站的 0.5 倍,但实际利用率只达到 3.33%。闸 机 数 量 虽然多但实际利用率很低 ,出站闸机数量设置过多 。 洲 海 路 站 有 4 台 出 站 闸 机 , 实际利用率只达到 2. 5%,利用率也很低下 。 通过实际调查发现 ,洲 海 路 站 周 边 荒 凉 ,配 套 不 完 善 ,居 民 小 区 不 多 ,还没有形成成熟 的 生 活 区 ,客 流 非 常 稀 少 ,是 6 号 线 28 个 车 站 中 客 流 最少的一个车站 。 高科西路站客流并不少 ,闸机的实际利用率过低 。 为了改变现状 ,拟提高高科西路站的闸机实际利用率到 8%,按以下公式计算 : 8/20*(12-n)

10、=8% 经计算得知 :n=7n: 需要减少的出站闸机数量因此,如果将高科西路站出站闸机的数量设定为 5台,则刚好满足现在闸机实际利用率到 8%。 我们提供了以下参考 :此 数 值 为站客流进行分析 。此四个车站的原始数据信息如下图 3 所示(只选一个车站 ):1、如 果 从 节 能 的 角 度 考 虑 ,理论上高科西路的出 站闸机可以关闭 7 台,而不会对出站速度造成影响 ,达 到最优配置 ;2、可 以 将 7 台闸机出站方向改为进站方向 ,解 决 早高峰进站客流高出站客流低的矛盾 ;3、随 着 客 流 的 逐 步 增 加 ,今后高科西路站短期内 不必再增加新的闸机 ; 4、如 果 目 前 有

11、其它车站客流较大 ,闸 机 数 量 不 够用,可以考虑将高科西路出站闸机移设到客流较大车 站,解决运营成本与客流增长之间的矛盾 。 同 理 ,根据以上分析方法 ,洲海路站的出站闸机如 图 3 高科西路站即时客流统计图 通过以上数据信息 , 我们除了知道每个车站 的 即 时出站客流人数外 , 隐藏在其中的其它信息则一概不 知。 由于列车每天按照固定的时刻表进行投运 ,每天同 一时段到达每个车站的列车到达时间基本是固 定 的 , 每单位小时内到达的列车数量就是固定的了 。 因 此 我 们将单位小时进行缩 短 ,对 10 分钟的即时出站客流数 据进行抽样挖掘 ,则可以代表每个单位小时 、每 天 或

12、每 月的客流规律 。现 在 ,我们使用时间序列数据挖掘方法 ,对 以 上 四 个 车 站 1 月 6 日 的 早 高 峰 7:307:40 之 间 10 分 钟 的 即时出站客流数据进行挖掘 ,挖掘结果如下表 :果只设 2 台,实际利用率可以达到 5%。洲 海 路 站 客 流的稀少直接导致了闸机的实际利用率很低 , 但 考 虑 冗余的需要 ,出站两侧各 设 2 台闸机是必要的 ,数 量 不 能 再减少了 。 4. 结语 上海地铁目前已经建成通车的线路数量排名 全 国所有城市第一 ,研究单条线路客流信息 ,可 以 发 现 目 前 线路设计的优点和缺点 ,可以为今后的新线选址 、车 站 站台的设计

13、长度 、闸机 的 设 置 数 量 、列车的车厢数以及 每条线路需要投运的列车的数量等 ,提供决策参考 。 避 免决策失误 , 从而设 计 、 建设出一条合理的不拥堵线 路。(下转第 130 页)2011 年第 12 期福 建电 脑130常用的动态负载均衡算法主要有 4 种:(1)最 小 连拟机的迁移等管理操作 。4.2 基于虚拟服务器集群的选课系统架构设计接 调 度 (Least Connection Scheduling) 算 法 。 (2)加 权 最 小连接调度(Weighted Least Connection Scheduling) 算在上述虚拟服务器集群架构的基础上 ,对 选 课 系

14、法 。 (3) 基于位置的最小连接 (Locality Based LeastConnections Scheduling ,LBLC)算法。 (4)带复制的基于 位 置 的 最 小 连 接 (Locality Based Least Connections with Replication Scheduling ,LBLCR)算法。 4、虚拟集群技术在高校选课系统中的应用架构设计 4.1 虚拟服务器集群的架构设计 服务器集群技术与虚拟化技术是计算机应用 技 术统的架构做了如下的设计 。 (1)将选课系统从教务管理系统的其他业务中剥 离 出 来 ,通过重定向功能将教务 管理系统的其他功能重定向

15、到指定的服务器上 。 (2)为选课系统建立虚拟机 ,部署到不同的物理服务器上 ,通 过集群负载控制器实现动态负载均衡 。 (3)在非选课期 间关闭选课系统虚拟机 ,节 约 系 统 资 源 ;在 选 课 期 间 通过 VM Manager 快速实现虚拟机的部署和迁移 。 (4)选领域两个不同的分支 ,前者的作用是实现高可用性和 课系统可以和其他的 虚 拟 机 共 存 , 资源利用率 。5、小结以提高物理服务器 负载均衡 , 后者实现资源利用率的最大化和资源的灵 活配置及安全性 。 将两者的结合起来即可以同时集中 两种技术的优点 。为 了 解 决 高 校选课系统中存在的连接数量多 、流根据服务器集

16、群和虚拟化技术的特点 , 虚拟化服务器集群的架构 ,如图 1 所示:给 出 一 种量短时间集中出现而给服务器带来的负荷压力 , 应用了虚拟化服务器集群技术来解决这一问题 ,本 文 从 而在系统的高可用性 、 高可靠性与系统效率之间找到一 个平衡解决方案 。 这一方案在实践中进行了应用 ,收到了良好的效果 。下一步的研究将围绕如何对集群运行 效率的度量来展开 。参考文献:1 吴 祖 峰 高 校 排 、 选课系统的探索与 实践 电子科技大学学报 社 科 版 2005 年(第 7 卷) 增 刊2 李 慧 宗 孟 祥 瑞 基 于 Web 的 高 校 学 生 选课系统的新设 计 郑 州轻工业学院学报(自 然 科 学 版) 2005 年 8 月 第 20 卷 第 3 期 3陆 培 军 基 于 XML Web Ser vice 的高校公共课选课系统实现 福 建 电 脑 2006 年 第 6 期 4Mat

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号