【摘要】:本文介绍智能客流探测与预警方法,通过WIFI和蓝牙探针采集客流数据,判别客流性质。并根据采集到的乘客数据推算关键路径走行时间,随后使用历史关键路径的走行时间训练得到关键路径走行时间估计模型。建立以下客人数、进站人数,关键路径的走行时间为输入条件的各瓶颈密度估计模型。最后对比客流拥堵指数,得到客流拥堵预警等级,为地铁大客流预测与预警提供有效依据。
[关键词]:大客流预警、WIFI蓝牙、行走时间
引言
本文以WIFI和蓝牙两种主流客流监测技术为基础,开展地铁车站大客流智能智能客流探测与预警系统的研发。通过WIFI和蓝牙探针来提取地铁车站内的客流,融合WIFI和蓝牙所探测的客流数据求得车站的客流密度以及每列列车到站人数;根据历史走行时间训练得到走行时间估计模型;最后输入下客人数、进站人数,根据站内不同节点间乘客走行时间,预测各瓶颈的密度。
1、预警机制研究
1.1确定拥堵点
本文在参考了许多文献[4-8]的研究,并通过前往地铁站进行实际调研,以及询问地铁站内的工作人员后,发现许多地铁站的在高峰客流时段发生拥堵点位置大都一致,在客流高峰时段,地铁车站的拥堵点总在楼扶梯、闸机处、出入口等地。因此可以选取地铁车站的进出口闸机和楼扶梯处作为拥堵点,也可针对不同车站的实际情况来确定拥堵点。
1.2客流特征
参考针对我国国情的《行人交通》及进一步研究发现,在众多的指标如行人密度、单位宽度流率、速度和负荷度中,行人密度和单位宽度流率能够较为全面地表征步行通道、楼梯和进出站口的客流状态; 而对于排队区和候车区用行人密度即可反映出其当前的客流状态。
行人密度是指在道路或排队区域内单位面积的平均行人数量,一般用区域人数和区域面积的比值表示,单位宽度流率是指人行道单位有效宽度平均通过的行人数量。
行人密度 单位宽度流率
.png)
式中:为行人密度: 人 ; 为探测区域的面积;为区域长度; 为区域宽度; 为区域内的行人数量;
为单位宽度流率: 人; 为时间内通过区域内某一断面的行人数量。
而行人密度与行人占据空间互为倒数。据统计,我国成年人静止时垂直投影面积约为0.18 m^2。由专家的实验统计可知,行人与行人或设施之间需要保持一定距离的缓冲空间,其最低要求范围为0.22 ~ 0.26 ; 行人在楼梯通道内行走时需要0.7 的活动空间,当行人占据空间在0.4时,行走速度严重受到限制,当行人占据空间在0.9以上时,行人以正常速度在楼梯内行走;当行人占据空间在1.4 以上时,行人可按自己意愿去行走; 当行人占据空间在1.9以上时,行人可以赶超其他行人。按照不同的占用空间对行人有不同的约束,行人对楼梯通道空间需求可以分为: 静态最低需求区域、行动受限区域、行动基本区域、正常行动区域、自由选择速度区域和赶超他人区域6个等级, 如表1所示。
.png)
表1:行人特征类别数据
1.3确定客流拥堵指数
客流在地铁站内的各项数据指标,主要参考了反映我国国情的《行人交通》,结合文献[6-7]对我国多地铁站的服务水平调查评估,并结合已有的服务平等级划分标准,通过行人密度和单位宽度流率在楼梯通道和步行通道服务水平的阈值来定义的客流拥挤指数。
本项目用一种的量化数据——枢纽客流拥挤指数来表征地铁站的客流状态。分为5个等级。其中分别对应“畅通”、“基本畅通”、“轻度拥挤”、“中度拥挤”、“严重拥挤”5个级别,如表2。
表2客流拥堵指数
2、客流采集处理方法
目前市场上的探测方法众多,本文结合各种探测设备的特征[1],选用WIFI和蓝牙探针为探测设备进行客流采集。
2.1探针特性
根据高见、张浩[6-7]等人的研究得WIFI和蓝牙的探针特性(表3)出,并实地进行测试得出:在车站内采用网格式布设探针设备,以50M为采样半径每分钟可采集车站内的150—200条数据,采样率可达到65%。
表3探针设备特性
.png)
在地铁车站内,非地铁乘客的干扰或乘客个人行为等会影响WIFI与蓝牙探针捕获的数据总体样本量,导致输出不可靠的结果,包括以下情况:
1.在地面或高架车站可能采集非站内乘客的设备;
2.站内存在具有WIFI功能的固定设施设备;
3.车站工作人员自身携带的电子设备;
4.乘客在站内长时间停留。
2.2客流筛选算法
为筛除干扰数据识别有效的MAC地址,本文创建了一种新型的探针地址筛选方法:
首先我们根据发车间隔时间,确定每t分钟为一个周期,分别收集站厅层和站台层的全部的探针数据。
a.消除数据中5min时间间隔内重复出现的MAC地址,据此可筛除探针捕获的非移动设备,如员工携带具有WIFI或蓝牙功能的设备以及测试期间未移动的任何其他智能设备;
b.依据设备供应商提供的RSSI与距离的关系表,如表3。RSSI低于-80dBi的设备,RSSI为-80dBi的设备大约对应于距离探针的40M,据此可筛除非站内或距离拥堵点较远的设备。
c.为了解决由于工作人员或乘客在站内来回走动而产生的重复计数问题,步骤如下:
第一步:以第1min到第5min的MAC地址创建第一个循环块;
第二步:检测第6min与第一个循环块中是否出现相同的MAC地址,若重复则剔除;
第三步:以第6min到第10min30s的MAC地址创建第二个循环块,并检测第min与第二个循环块,若重复则剔除。重复以上步骤对30s时间间隔的MAC地址进行检测去重。
d.根据探针设备安放的位置。将仅被出入口处探针探测到的MAC地址定义为站外乘客;
仅被站台层的探针探测到MAC地址为未下车乘客,将其删除。
e. 将首次被出入口探针探测,并且被其他站内探针也探测到的MAC地址视为进战乘客;将最后一次被出入口探针探测到MAC地址时间距周期末时间差已超过1min的定义该乘客为出站乘客,删除;将在列车到达前被探测到,而列车出发后就消失不见MAC地址定义为上车乘客,删除; 将在列车到达前未被探测到,而列车出发后还存在的MAC地址定义为下车乘客。
f.最后将一个周期统计的数据进行对比,剔除探测到多次的MAC地址,完成所有数据的去重。
3、拥堵点客流估计模型
3.1关键路径走行时间探测方法
本文应用统计分析法来探测某时段乘客通过关键路径的走行时间,步骤如下:
①首先,基于同一MAC地址的信号强度及探测时间绘制信号强度脉冲曲线图,从而获得各手机通过WiFi探针的准确时刻。
②计算各条路径上同一MAC地址经过该路径上关键探针点的时间差,并统计分析其10%-90%的百分位水平值。
③计算各百分位水平值的偏差率指标,偏差率计算公式如公式(1)所示:
(1)
.png)
为乘关键路径走行时间与百分位水平值之间的偏差率,为乘客关键路径走行时间与百分位水平值之间的偏差值,为乘客关键路径走行时间百分位水平值。
④选取平均偏差率最小的百分位水平值作为该时段乘客关键路径走行时间。
3.2基于神经网络构建行人走行时间估计模型
3.2.1 BP (Back Propagation)神经网络
BP (Back Propagation)神经网络,1988年 6月首次提出,是按照误差逆传播算法训练的多层前馈网络,也是最常见的神经网络模型之一。BP神经网络设计结构简单、工作状态稳定、易于通过硬件实现,由此成为使用频率最高的神经网络模型之一。
本文在参考了许多文献研究之后选择单隐层的标准BP网络,通过调节隐层节点数来满足预测未来短时的行人关键路径行走时间。隐层节点涵盖了一些列权值参数,是数据处理和储存的核心所在。针对本文研究内容所选定的单隐层设计,节点数可以根据众多专家学者总结的方法进行计算和推导,采用法、 法或法等,但其中部分方法的使用具有局限性,不适合全面推广。针对本文的内容,我们也可以先大致确定一个范围,之后逐一训练,比较各项参数后选择最适合的隐层节点数。隐层传递函数首选双极性型正切函数,其饱和非线性和可微分性提高了网络的非线性映射能力。输出传递函数使用函数,使得网络的输出限制在[0,1]内,可以最大限度符合网络输出要求。学习速率即为神经网络处理数据的快慢程度。如果学习速率过低,会拉长训练时间,降低收敛速度;如果学习速率过高,会造成调整量加大,使得训练过程出现剧烈抖动。综上,为使系统更加稳定,我们会在满足训练要求的前提下尽可能降低学习效率。学习速率可以凭借经验选取[0-0.03]之间的值。
3.2.2建立行人走行时间估计模型
行人走行时间估计模型是一种基于复合神经网络的学习模型,目的在于修正单种客流提取方法在现有技术局限情况下产生的误差。根据地铁车站客流基数庞大且具有较强的时变规律等特点,以数据为输入,以采样统计周期末的乘客关键路径走行时间数据为输出,基于采集的大量历史数据对神经网络模型进行迭代训练,输出短期该关键路径内的行人行走时间。构建BP神经网络模型,进行迭代训练,调整模型各层的权重、权重动量和误差初始值,建立满足训练精度要求的估计模型,直到满足既定的精度要求。
4.案例分析
为了对建立拥堵点客流估计模型的进行验算,选取上海市南京东路地铁站作为WIFI 探针设备采集客流数据的测试车站,以验证模型的有效性及应用性。
4.1豫园站地铁站调查研究
位于上海市黄浦区河南南路福佑路,福佑门小商品市场对面,濒临豫园及上海城隍庙。豫园地铁站的客流主要以旅游性的客流为主,出现的明显高峰客流。其客流特征主要为:(1)以节假日的出行高峰为主;(2)早高峰晚高峰客流量明显增多,期间图5-1中的1号口、4号为主要的出入口;(3)高峰期间,客流主要从1号口进,在编号通道位置进行安检并通过通道,经过进站闸机进站。
在实际调研和询问工作人员后,发现大部分乘客在站厅层会从1、4号出入口进出,并且选择D处的楼扶梯进行上下楼。因此根据乘客在地铁站内的走行流程顺序,确定了入站闸机处以及楼扶梯处作为拥堵点。并将车站区域范围划分为站厅走行区段、站厅与站台间通行设施(包括楼扶梯和无障碍电梯)共两个区段作为行人的关键路径。因为就近原则乘客仅会选择离自己近的楼扶梯,所以在站台层仅设置两个探针,用来探测上下客流。且站台层都呈长方形,并两侧上下客,因此取站厅中间前往楼扶梯处作为站厅层的关键路径。
在设置探针设备采集数据后,取得了很好的效果。其中采用豫园路站非高峰时段15点05分-16点05分和高峰时段18点00分-19点00分的6个探针采集的共49.5万条数据记录进行实证分析,在此基础上进行处理。
4.2源数据处理
利用探针采集的源客流数据建立客流量数据库,根据设计过滤的算法进行布设8个探针点采集得到的源数据进行预处理WIFI探针A的源数据处理前后的对比图如图1所示 。
.png)
图1探针A采集数据过滤前后对比图
从上图中可见,筛选前采集得到的源数据量较筛选后的数据多且曲线的走势曲折,波动性大,说明源数据并不符合实际客流数据的情况;筛选后的数据曲线波动小,走势平缓,符合实际客流情况,说明设计的客流数据筛选算法较为合理。
4.3预测关键路径客流走行时间
根据上文的关键路径走行时间探测方法乘客关键路径走行时间,以五分钟为周期,把探测到行人行走时间作为输入层,根据数据的特性设置,设置相应的初始参数如表 4所示。
表4 BP网络基本参数设置
,用给定的训练集、学习率进行网络的训练。随着迭代次数增加训练集误差逐步减小。最终满足输出误差将预测出来的结果进行估计精度分析,本次实证分析估计值与实际值的对比分析图见图2。
.png)
图2乘客站厅关键路径走行时间对比图
从 图2可见预测走行时间曲线与实际走行时间曲线的重合度较高,预测结果的绝对误差值为20%左右,在可接受的预测误差阈值以内,说明该模型的说明该模型的预测精度较高, 稳定性较好。
4.4结果分析
最终根据每次下客的客流量来预测未来拥堵点的客流密度,结果如下图3。客流量的预测与实际基本一致,说明创建的拥堵点客流估计模型可行性强。
.png)
图3 D点拥堵点客流量对比图
5.结语
本文提出了本文基于目前城市轨道交通车站面临高峰客流在一些拥堵点容易产生安全隐患及缺乏有效的客流量采集手段的背景下,使用两种较为有效经济的采集设备WIFI和蓝牙探针到车站进行客流数据的采集,并通过研究同类论文以及实际调研确定了客流量拥堵点指标。但在一些复杂的大型换乘车站,车站客流的流性大、拥堵点较多,不易探测关键路径走行时间以及各种客流的客流量。本文的探针技术仍未实现站内乘客的定位无法精确地获取到站内乘客的具体位置,造成采集的数据与实际的数据存在一定的误差,虽然构建的模型基本符合要求精度,但由于没有对BP神经网络进行创新,模型的精度仍需进一步提高。这也是本文未来的研究方向。
【参考文献】
[1]陈菁菁.城市轨道交通客流检测技术的特征及其应用分析[J].城市轨道交通研究,2018,21(01):137-142.
[2]周继彪,赵鹏飞,董升,张水潮.基于蚁群算法的地铁车站行人拥挤等级划分方法[J].城市交通,2019,17(04):105-113.
[3]唐金金,赵勇,林园.大型铁路客运站大客流预警及应对方案设计——以北京西站为例[J].中国安全生产科学技术,2016,12(02):143-147.
[4]冯冬焕.城市轨道交通大客流安全评估关键技术研究[D].东南大学,2017.
[5]李得伟.《行人交通》.人民交通出版社, 2011,01(08):417.
[6]高见,袁得嵛.基于WIFI探针的预警系统设计与研究[J].中国人民公安大学学报(自然科学版),2016,22(03):89-93.
[7]张浩,赵千川.蓝牙手机室内定位系统[J].计算机应用,2011,31(11):3152-3156.