文章编号:l003一l42l(20l5)07一o02l_05 中图分类号:U292.5 2 文献标识码:A 基于T D C S数据分析的铁路区间 通过能力利用研究 Study on Utitization of Railway Section Passing Capacity based on TDCS Data Analysis 王 晓,张星臣,华 WANG Xiao,ZHANG Xing—chen,CHEN dun—hua (北京交通大学交通运输学院,北京 1 00044) (School of Traffic and Transportation,Beijing Jiaotong University,Beijing 100044,China) 摘 要:在阐述区间通过能力利用分析传统流程的基础上,分析基于TDCS数据分 析的区间通过能力分析原理及能力利用的基础数据处理流程设计,提出基于数据 库拆分的海量数据获取技术和基于XML的多源数据处理等TDCS数据处理关键技术, 最后以包神铁路为例,对线路困难区间的能力利用进行分析,并且给出合理化建 议。实践证明,基于TDC8数据分析的铁路区间通过能力方法简单易行,具有实际 推广意义。 关键词:铁路运输;能力利用;TDCS;数据挖掘 Abstract:Based On expounding the traditional flow of utilization analysis of section passing capacity,this paper analyzes the analysis principle of section passing capacity based on TDCS data analysis and the design of basic data processing flow of the passing capacity utilization,and puts forward the key technologies of TDCS data processing such as the technology of mass data acquisition based on database sharding and the multi-source data processing based on XML.In the end,taking Baotou-Shenmu railway as an example,the paper analyzes the capacity utilization in dilemma line section,and gives reasonable proposals.The practice shows the method of utilizing railway section passing capacity based on TDCS data analysis is simple and practicable,and also has practical promotion significance. Key Words:Railway Transp0rtation;Capacity Utilization;TDCS;Data Mining 第37卷第7期 田 基于TDCS数据分析的铁路区间通过能力利用研究王晓等 色 路通过能力具有动态瞬时的特点,如何利用 (3)区间能力利用率等指标计算与图表分析。 先进的技术方法,分析能力利用的波动规律 根据所采集的数据,可以求得平均利用率、分时段 和能力制约影响因素,实现对能力科学、有效、合 利用率等指标,最后结合实际情况提出挖潜扩能的 理的利用,是目前铁路区间通过能力亟待解决的问 合理化建议。题。传统的能力利用分析基于实测数据,主要依靠 1.2基于TDCS数据分析的区间通过能力分析 调查人员实地调研获取,所得数据随机性大、样 传统对能力利用的分析限于数据样本的有限性 本量少、代表性不强,以此为基础进行能力利用 和随机性,很难客观反映能力实际使用情况与实时 分析不能客观反映实际情况 J。事实上,铁路信息 车流、人员操作、天气情况等因素的关联关系,给 化的理想条件为能力利用研究提供数据基础 。调 予管理者的决策支持显得粗犷和模糊。通过TDCS 度管理指挥系统(TDCS)积累了大量的列车运行数 底层的海量数据支持,开发相应的信息系统能够实 据p J,这些数据规模庞大、真实可靠,蕴藏丰富的 现对能力利用的实时分析。能力利用的波动规律和 决策支持信息。利用TDCS数据进行能力利用分析 影响因素关联关系的分析方法如下。 具有精确、实时的特点,能够动态反映特殊区段和 1.2.1 能力利用波动规律分析方法 特殊时期的能力利用情况。通过提出基于TDCS数 定义能力利用率最高、次高的区间分别为第 据的能力利用分析方法,科学掌握线路能力利用情 一饱和区间和第二饱和区间,能力利用长时间饱和 况,为进一步规划决策、挖潜扩能提供依据。通过 的区间可以认为是区间,而传统区间的确 阐述能力利用分析原理,并且设计基于TDCs数据 定方法是通过计算线路各区间运行图周期时间所确 的能力利用分析流程,重点解决海量数据拆分和多 定,运行图周期时间最长的区间即为区间。 源数据处理的技术难点。 采用HP滤波法对不同季节和不同时间段的 能力利用波动规律进行分析。HP滤波法可以将趋 1 基于TDCS的能力利用分析原理及流程 设计 势循环变量(GC,)分解为长期趋势(G,)和周期波 动(C,) 个部分 ,方便了解能力利用波动规律的长 1.1 传统的区间通过能力利用分析 期趋势和周期波动。(G,)通常被定义为损失函数的 能力利用研究是铁路能力理论的核心问题 ], 最小化问题的解,计算公式为 通过分析能力在不同时段和不同区域的使用情况, min{∑ (yf—G + ∑ [(G川一G,)一(G,一 发现制约能力的薄弱环节,找出关键因素,为能力 的加强和发展指明方向。一般情况下,主要从车 G ) 一 , 【1) 站、区间、线路3个方面进行能力利用分析,分析 式中: 为时间序列数据,可分解为y,一G,+C , 基础是能力计算和测定,分析结果的客观性和实时 t=1,2,…,”; 为平滑参数(正数),G,该值越 性取决于计算的精度和速度。 大,越平滑。 (1)区间能力计算(原始资料获取)。查阅铁 1.2.2影响因素与能力利用的关联分析方法 路部门相关文件获取区间运行时分、起停车附加时 影响区间能力利用的因素很多,能力利用的波 分、不同时到达间隔时间及会车间隔时间等列车运 动主要由车流在时间与空间分布的不均衡性、车流 行参数,按照区间实际情况选择适宜的理想能力计 组成结构的差异性,区间设备故障的随机性等原因 算方法,如按追踪运行图、非追踪的平行运行图进 形成 ]。通过处理TDCS数据,可以对这些影响因 行能力计算。 素与能力的关联进行定量研究,考虑采用回归分析 (2)实际能力测箅(人工写实获取)。能力写实 方法进行分析。以确定列车比例与区间能力饱和程 是指统计不同类型的列车在某方向(上行或下行)一 度的关系为例,确定各比例参数的计算公式为 段时间内通过车站的数量,写实工作一般在车站进 a=21lf+22 +6 -(2) 行,并且需要在一段时间(3 d以上)内持续进行。 式中:。c为某时间段内区间平均能力利用率; 为2 目 7期 基于TDCS数据分析的铁路区间通过能力利用研究王晓等 种不同类型列车比例, = / ,其中n ,n 分别 1.3.1 能力利用波动规律数据处理 为A,B类型列车数量,由列车运行实测数据统计 出; ,2 ,b为需要通过回归确定的未知参数。 步骤1:计算理论最大能力。由经典计算公 式 可知,首先需要获取区间纯运行时分。区间纯 1.3能力利用的基础数据处理流程及关键步骤设计 运行时分的处理需要经过以下步骤:①判定列车类 基于TDCS数据分析的区间通过能力分析重点 型,由于同区间不同类型列车如万吨列车(大YU)、 工作是对基础数据的处理,TDCS数据处理流程设 5 000 t列车(小列)的运行时分不同,需要判定列 计如图1所示。首先,获取海量TDCS数据、处理 车类型;②判断列车经由径路,将原始数据表按车 多源数据,从而得到可使用的原始数据;其次,进 次号和时间排序,即可得到每列车的经由径路;③ 行预处理、数据类型划分等基础工作;然后,进行 确定列车区间并为区间编号,列车经由径路上相邻 列车区间运行时分、列车密度等参数分析,统计均 车站之间即为区间,编写区间号;④划分列车通过 值、中位数等描述性指标,用于波动规律分析和影 区间的类型,列车通过区间运行时分类型如表1所 响因素关联分析;最后,重点描述能力利用波动规 示,而纯运行时分只为“通通”类型列车通过区间 律数据处理流程和影响因素关联分析流程。 的时间;⑤获取纯运行时分,统计某种类型列车通 过各区间的“通通”类型的运行时分,绘制频率分 布直方图,进行形态分析,获得不同可达度下的纯 运行时分¨J。 表1第,区间(产1站至 站)运行时分类型 序号 1 2 类型 通通 发通 含义 列车在J一1站及 站都通过 列车从J一1站出发在 站通过 3 4 通到 发到/到发 列车通过J一1站在 站停车 列车从 站出发在 站停车或相反 步骤2:统计区间实际能力。执行步骤1中的 ①至③步,然后统计所有通过区间的列车总数。 步骤3:计算能力利用率,绘制能力利用规律 图表。在绘制不同时段、不同区间的能力利用波动 规律时,加入判定时间、判定区间的步骤。 1.3.2影响因素关联分析 步骤1:计算能力利用率。 步骤2:统计不同类型列车区间列车密度。可 以按照能力利用波动规律中步骤2进行处理,重点 关注不同类型列车的划分。 步骤3:得到回归分析能力利用率与不同类型 列车比例变化之间的关联关系。 2 TDCS数据处理关键技术 2.1 基于数据库拆分的海量数据获取技术 图1 TDCS数据处理流程设计 列车运行过程中记录了海量的运行数据,如 第37卷—国 一 粕  ̄gT101基于TDCS数据分析的铁路区间通过能力利用研究王晓等 何从繁杂的数据中获取能力利用相关信息是一项难 关系进行数据转换,生成用于交换的第三XML文 题。采用数据库拆分的数据获取技术 获取海量数 件。典型的数据转换形式包括重构、数据类型转 据,基本思路为:①将表格初步分类;②建立查 换、日期/时间格式转换等。 询,确定列车运行过程中事件触发与表格记录之间 步骤7:能力利用数据处理。从第三XML文 的关联,方便准确推断表格内容;③根据感兴趣的 件中获取数据,以构建模型对区问能力利用进行 数据垂直拆分表格,并且将拆分内容存储到不同数 分析。 据表空间上,使数据在物理上被分离;④最后建立 1个链接所有分区的视图,使数据在逻辑上仍然为 一3案例分析 以包神铁路为例,选取其能力紧张的东线区段 进行研究。通过对该线区间能力波动规律及大小列 个整体。 2.2基于XML的多源数据处理 TDCS下中心逻辑处理子系统、调度终端子系 的比例变化对能力利用的影响进行研究,以验证该 统、车站子系统、网络子系统等各子系统,以及各 能力利用分析方法的有效性和实用性。选取包神铁 子系统中包含的更多子系统,它们之间数据记录格 路东胜一敖包沟、敖包沟~沙沙圪台、沙沙圪台一 式/类型不同,从而造就数据的多源性。对TDcS数 巴图塔、巴图塔一石圪台、石圪台一瓷窑湾的上下 据处理关键技术之一是对多源数据的处理。通过采 行区间,数据为2012年1月一2O13年2月的TDCS 用XML(eXtensible Markup Language可扩展标记 数据样本。 语言)的异构数据转换技术 】,提出基于XML的 TDCS多源数据处理方法如下。 选取巴图塔一沙沙圪台区间的列车密度,统 计不同时段的列车密度均值、最大值和最小值等指 步骤1:从数据源提取数据。在数据提取文件 标,巴图塔一沙沙圪台不同时间段能力利用分析表 中设置提取数据的规则,可以分别从多个数据源对 2所示,分析可知区间内各时间段平均能力利用均 应的多个数据库中提取信息,如可以根据数据被记 衡,但最大值和最小值差异显著(时间段内相差达 录时的时间、列车类型或关键字等信息从数据库中 到1O列),表明波动较大。通过HP滤波分析法(取 提取数据。 经验值14 400I1伽)得到的巴图塔一沙沙圪台区间日 步骤2:对提取的数据进行预处理。预处理 均能力利用率波动图如图2所示,分析可知每日能 数据包括异常数据剔除、缺失数据补齐、参数修 力利用率差异明显(上行能力利用率在0.4~0.65之 正等。 间,下行能力利用率在0.5~0.75之间)。 表2巴图塔一沙沙圪台不同时间段能力利用表 时间段 2:0 — :00 6:0O一10:00 10:00—14:00 步骤3:生成第一XML文件。将所提取并且经 过预处理的数据直接映射为第一XML文件。 步骤4:生成第二XML文件。将第一XML文 件中的每个元素映射为XML Schema中的内置数据 类型的样式,得到第二XML文件。XML Schema的 内置数据类型可以分为基础类型和派生类型,具有 最小值 6 2 4 4 4 5 平均值 9 7.5 8.5 8 8.5 9 最大值 12 12 12 l1 l2 12 14:00 l8:00 18:O0 22:00 22:00—2:00 统一标准。 步骤5:设置第二XML文件中的元素表现样 式。在设置元素间的关系时,应考虑最终的表现 样式尽可能清楚地反映铁路运输区间能力,同时 速地访问。 东线区段各区间利用率对比如表3所示。通过 考虑计算模型的需要,方便数据能够被更清晰快 分析可知,东线区段下行方向比上行方向能力利用 率高5%~l5%;第一饱和区间为沙沙圪台~巴图塔 步骤6:生成第三XML文件。第二XML文件 区间,第二饱和区间为石圪台一瓷窑湾区间,因而 中的元素根据表现样式文件中所定义的元素间的 建议如下。①列车在这2个区间应加速运行,减少 目 7期 基于TDCS数据分析的铁路区间通过能力利用研究王晓等 O.75 O O.65 0.55 。 0.45 。 o.35 m =至 羯羹羹 0 0.15{... .... 201 1/12/27 2012/1/24 201 日期 大小列比例 图2巴图塔一沙沙圪台每日区间能力利用率波动图 图3巴图塔—石圪台下行回归分析 基础,由于能力利用的影响因素很多,分析结果很 表3各区间能力利用率对比 难达到准确、全面和实时,不能达到决策支持的目 区间 上行方向 下行方向 标和要求。因此,提出基于TDCS数据分析的能力 东胜一敖包沟 0.42 0.44 利用分析技术、方法和流程,通过设计基于TDCS 敖包沟一沙沙圪台 0.28 0.32 数据的能力利用波动规律和影响因素关联分析的算 沙沙圪台一巴图塔 0.53 0.59 法流程与步骤,解决数据获取和处理难点。通过包 巴图塔一石圪台 0:37 0.42 神铁路的实例分析,表明所提分析方法和数据处理 石圪台一瓷窑湾 0.47 0.5l 技术简单易行、可靠度高、实时性强,可以为管理 人员实时掌握能力利用情况、进一步研究运行图 其对线路能力的。②石圪台是支线与主线的交 指标兑现率和运行图结构等问题提供研究思路和 叉点,开行支线列车时应充分与主线协调,尽量在 借鉴。 主线空闲时开行,以减轻第二饱和区间的能力紧张 程度。 参考文献: 开行大列对缓解区间能力紧张作用明显,在实 …1 王军,张星臣,张懿,等.基于监控数据挖掘的运行 际工作中确定大列开行的数量很难做到科学合理。 图参数查定与修正方法[J].中国铁道科学,2011,32(4): 以巴图塔一石圪台下行区间为例,通过数据挖掘分 117—121. 析大、小列比例与能力利用率间的定量关系,为确 WANG Jun,ZHANG Xing—chen,ZHANG Yi,et a1. 定大小列数量提供参考,计算公式为 Method for the Measurement and Correction of Train Diagram =一0.653 5op+o.222 98 +0.816 35 (3) Parameters based on Monitoring Data Mining[J].China 经F检验,拒绝原假设的可能性为3.12×10 < Railway Science,2011,32(4):117-121. 0.05,表明拟合成功,该模型可行。通过对巴图 [2]马钧培.中国铁路信息化建设与展望[J].交通运输系统工 塔一石圪台区间数据结果进行分析可知:①随 程与信息,2005(5):5-9. MA Jun—pei.Construction and Prospect of Information 着区间开行大列的数量增加,区间能力利用率 Systems for Chinese Railways[J】.Journal of Transportation 从60%下降到30%,输送能力却从25万t上升 Systems Engineering and Information Technology,2005(5): 至35万t,巴图塔一石圪台下行回归分析如图3所 5-9. 示;②根据图3可知,随着大列数量增加,区间能 [3]王兴中.铁路调度指挥系统中数据存储体系及索引结构的 力利用率降低的速度明显减缓,比例超过1.5后变 研究[D].北京:中国铁道科学研究院,2011. 化不再明显。 WANG Xing-zhong.A Study of Data Storage System and 4结束语 Indexing Structure for the Railway Dispatching System 【D】.Beijing:ChinaAcademyofRailwaySciences,2011. 铁路通过能力利用分析是现场管理人员决策的 (下转第41页) 粕 目 商合杭铁路引入阜阳铁路枢纽的方案研究刘志强 经济,2008,30(9):14-18. [6]李庆生.客运专线车站设计有关问题的研究[J].铁道工程 ZHU Zhi—guo.Study on the Design of PDL Station and 学报,2006(7):86 90. Yard[J】.RailwayTransport and Economy,2008(9):14—18. LI Qing・sheng.Research on Problems about Design [3】徐瑞华,杜世敏,陈百磊.城市铁路枢纽布局的调整优化 of Railway Station for Passenger Dedicated Railway 研究[J].同济大学学报:自然科学版,2005(5):631—635. Line[J].Journal of Railway Engineering Society,2006(7): XU Rui-hua,DU Shi-min,CHEN Bai-lei.Adjustment 86-90. and Optimization of Urban Railway Joint Terminal 【7]严新平.商杭铁路淮南至合肥线路走向及引入合肥枢纽方 Layout[J】.Journal of Ton ̄i University:Natural Sciense, 案研究[J].铁道标准设计,2011(5):1-4. 2005(5):631-635. YAN Xin-ping.Design on Alignment of Huainan-Hefei [4】彭文盛,彭辉。高速铁路引人既有枢纽客运站的布局 Section on Shangqiu—Hangzhou Railway as Well as It [JJ.交通运输工程学报,2004(]2):62—65. Induction into Hefei Terminal[J].Railway Standard Design, PENG Wen・sheng,PENG Hui.Passenger Station Layout of 2011(5):1-4. High-speed Railway Existing Terminal[J].Journal of Trafifc [8]李长淮,宋 剑.高速铁路引入枢纽及站型布置研究 and Transportation Engineering,2004(2):62-65. [J].铁道标准设计,2010(4):6—11. 【5]杜文,文东.客运专线客运站通过能力仿真研究 LI Chang—huai,SONG Jian.Study on High Speed Railway 【J].西南交通大学学报,2006,41(5):549~553. Leading into Hub as Well as Layout of Station Types[J】. DU Wen,WEN Dong.Simulation Research on Carrying Railway Standard Design,2010(4):6~11. Capacity Of High Speed Passenger Railway Line Stations[J].Journal of Southwest Jiaotong University, 收稿日期:2015—03—25 2006,41(5):549-553. 责任编辑:吴文娟 (上接第25页) 2014(66):190 209. [4]Abril M,Barber F,,Ingolotti L,et a1.An Assessment of [9]华,张星臣,徐彬,等.信息化条件下车站作业 Railway Capacity[J].Transportation Research Part E Logistics 标准时间查定方法研究[J].交通运输系统工程与信息, &Transportation Review,2007,44(5):774—806. 2011(3):119-123. [5]He Y,Wang B,Wang J,et a1.Correlation between Chinese CHEN Jun—hua,ZHANG Xing-chen,XU B in,et and International Energy Prices based on A HP Filter and Time a1.Research on Railway Station Operation Standard Time Diference Analysis[J】.Energy Policy,20 1 3,62(9):898— Assessment Method under the Conditions of Informatization 909. of Railway[J].Journal of Trnasportation Systems Engineering [66]杨芳.线路通过能力利用率的研究【D].兰州:兰州交通 and Information Technology,2011(3):119 123. 大学,2012. [10]高铁梅,王金明,梁云芳,等.计量经济分析方法与建模 YANG Fang.Study on the Degree of Railway Line’S Capacity [M].北京:清华大学出版社,2009. Utilization[D】.Lanzhou:Lanzhou JiaoTong University, GAO Tie-mei,WANG Jin—ming,LIANG Yun—fang,et 20l2. a1.Econometircs Analyzes Methods and Modeling[M].Beijing: [7]Villarroya S,Viqueira J.Geodadis:A Framework for TsinghHa University Press,2009. the Development of Geographic Data Acquisition and Dissemination Servers[J].Computers and Geosciences, 收稿日期:2015—05~20 2013,52(3):68-76. 基金项目:国家自然科学基金资助项目(U1361114) [8]Agreste S,De P,Ferrara E,et a1.XML Matchers: 责任编辑:吴文娟 Approaches and Challenges[J】.Knowledge・Based Systems, :E 第37卷第7期 _