一、解读手机信令大数据采集过程
据了解,各大运营商是手机信令大数据的直接提供者,诸如:在移动通信系统中包含有大量接口,通过各接口间的连接实现通信。又如:基站同手机之间的联系需使用到Um接口;基站同基站控制器之间的联系需使用到A-bis接口;基站控制器同交换机之间的联系需使用到A接口;不同交换机之间的联系则需使用到E接口。不同接口所采集到的手机信令有所不同。由于A-bis这一接口的数据量较大,因而对运营商来讲,只需通过A与E接口采集信令即可。
来源不同,可将手机信令大数据划分成三类,即PS域信令数据、话单数据和CS域信令数据。其中,在PS域信令基础上增添了上网信令,受智能手机与4G网络的影响,通过手机上网的人数逐步增多,随之便延伸了PS域;话单数据信令是三个分类中最少的一类,只有当用户拨打或接听电话、发送或接收短信时才可以触发信令;CS域信令则在不断发展中完成了BSC切换、位置更新、开关机和位置区切换等信令。需注意的是,虽然获取话单数据的方式最简便,但容易受到各因素限制,诸如:应用价值受限、缺乏轨迹点样本及信令采集频率不高等,若使用A E接口轨迹点结合的方式,则可以大幅度提升信令采集频率,进而实现多类型数据应用分析。
二、剖析手机信令大数据处理流程
手机信令原始大数据需要经过一系列的模型处理方可转变成能够对交通规划及整个城市规划有意义的信令指标。结合已有经验,手机信令大数据基本的处理流程为:数据预处理-基站小区定位-出行链识别-分区统计-结果扩样。
第一步数据预处理。条件确立后,逐一筛选记录,随后提出唯一且难以识别的IMSI号、无法定位等异常记录,然后便获得与条件相符的信令大数据样本。此外还需一一评价数据空间缺失、数据连续性等情况。
第二步基站小区定位。根据手机提供的服务基站位置,将手机当前处于的基站位置确定出来,主要采用单个基站小区所在服务范围内的精度来确定。诸如:若为城区基站,基站密度较大,且服务半径较小,因而其定位精度控制在300-500m以内;若为郊区,基站密度较小,服务半径较大,则精度控制在500-2000m以内。
第三步出行链识别。根据时间来提取用户信令数据,进而便能获得各用户手机的全天候移动轨迹,紧接着便能将出行链识别模型构建出来,在这一模型中可以把手机移动轨迹划分成若干个连续出行点,进而便能识别出每次用户出行的起始点和停留点。
第四步分区统计。首先按需划分空间分析单元,以此获得能够被用来统计和分析的交通分区,随后建立起交通分区和基站小区间的对应关系,然后根据交通分区要求来对用户出行记录进行相应的汇总统计,进而便能获得基于交通分区背景下的出行记录。
第五步结果扩样。虽然当前的手机信令样本量非常庞大,但是依然无法在同一时段内获取到三家运营商数据,加之获得的一些数据为无效数据,针对此,为了剔除无效数据,确保手机信令样本有效性,便要求实施扩样处理。在具体的扩样操作中,需对居民手机保有量、有效样本筛选量、空间分布和运营商市场占额等内容进行考虑。此外还可以在社会经济调查报告、人口普查数据和岗位调查数据等资料借鉴下,对扩样结果的准确性进行校验处理。
三、在智慧交通中的具体应用流程
(一)明确决策树工作原理
决策树实际上是一个预测模型,用以反映对象值和对象属性间的映射关系,决策树中每一个节点对应的对象不同,每一个分叉路径表示的可能属性值有所差异。此外每一个叶节点所代表的以根节点到叶节点经过的路径对象值存在差异。经过不断发展,决策树算法从经典的ID3算法逐步发展到今日的Hadoop自带算法,即随机森林,其优势在于可以通过投票方式将多棵决策树判断结果判断出来。
(二)在智慧交通中的具体应用
首先应明确智慧交通状态检测的实现流程。第一步是划分网格,确立移动用户位置,掌握用户速度;第二步是模型构建,目的是为了有效掌控交通状态,判定交通轨迹,这一过程要求收集用户信令数据中有效的30%数据当作训练数据,获得训练数据后,再在交通状态、环境变量与速度等三者关系的分析下,利用C5.0决策树将与之相对应的训练模型构建出来,进而便可以获得交通状态预测判定规则;第三步为实验校验,目的是为了了解模型准确性,具体实验操作需随机打乱校验数据秩序,从中抽取50%的数据样本,连续10次测试,以确保训练模型扩展性充足;第四步需将实时环境变量数据输入通过验证的模型之中,以此获得智慧及哦啊同拥堵状态的有关预测结果。
其次便是基于手机信令背景,掌握交通状态。第一步是做好移动用户手机信令速度大数据的预处理和提取工作,即将用户定位在特定网格中(30mx30m),经计算后可得到两个网格中心点间的距离,而后在时间间隔比值的利用下,获得用户在各个路段上通过额速度,最终便能获得同一时段内用户在某一道路上通过的平均速度;第二步为考虑影响智慧交通拥堵环节的因素,诸如:大雾、晴天、雨雪天等(如:表1)均为考虑内容。此外节假日、早高峰等时间段以及主干道、国道等均需考虑;第三步便是确定交通速度和状态度量间的关系;第四步便是建立随机森林训练模型。
四、总结
综上所述,随着智能手机与4G网络不断普及,越来越多的手机信令大数据分析被应用到智慧交通中,而文章主要是通过有关含义分析,阐述了其在智慧交通中的具体应用流程。
参考文献
[1]唐嘉立.基于分析手机信令数据的路网运行监控系统[D].南昌大学,2015.
[2]毛晓汶.基于手机信令技术的区域交通出行特征研究[D].重庆交通大学,2014.