数据融合下的移动通信数据流量模式浅 析

(整期优先)网络出版时间:2020-01-14
/ 2

数据融合下的移动通信数据流量模式浅 析

蒋国景

四川长江职业学院 四川成都 610000

摘要:随着移动电话的普及,它已广泛深入人类的工作、学习、娱乐等各种日常生活,所产生的移动通信数据,在一定程度上体现了人类的活动规律。基于移动通信数据来探索人类活动规律,已引发业界关注,产生诸多研究热点。工作对移动通信流量模式进行了观察与分析。出于隐私保护的需要,汇聚网格区域中所有用户的通信数据,得到该网格区域的移动通信数据。我们对在地理空间上构成一个行政上的1978网格的移动通信流量模式分别进行了空间和时间两个维度上的分析,得到以下两个结论。首先,移动通信流量模式更多体现的是人员在流动过程中产生的活动规律(我们称之为“动态”规律),却无法全面反映人类在特定空间中特定活动的固有规律,我们称为“静态”规律。其次,在特定的物理空间中,在工作日、周末和节假日三个不同的时间区间内,人类的活动规律不尽相同。

关键词:数据融合;移动通信;流量模式分析;

1引言

移动通信数据是指人类在生产生活中,通过移动电话所产生的关于呼叫,短信,上网流量等业务的数据。每个地区的基站都会记录该地区用户的移动通信数据,通过基站记录的移动通信数据,我们可以得到每个地区的移动通信数据随着时间的变化趋势,这个变化趋势就是该地区的移动通信数据流量模式。由于人类的生产生活存在着一定的规律,比如白天上班晚上休息,去商场购物回小区居住,所以随着时间的变化和人口的流动,不同的空间地点在不同的时间段内会形成不同的移动通信数据流量模式,而这个流量模式正是人类活动规律的体现。基于移动通信数据来探索人类活动规律已经有了很多方面的应用研究。比如,在城市计算领域中,为了应对能源消耗增加和交通拥堵等问题,需要对人类出行情况进行监测与分析,提出相应解决方案以创建改善城市环境。在社交领域中,基于人类活动可以构造社交网络,关注网络的变化,可以监测到很多异常情况。

2数据集介绍与预处理

本文主要介绍论文用到的三个子数据集,即意大利特伦蒂诺省的电信数据,电力公司的电力负荷、电力线分布、电力客户站点数量等数据,以及该省的每日新闻数据,(包括新闻发生所在地的经纬度位置)。另外,为了保护用户的隐私,数据提供方将电信数据集中基站记录的每个用户的CDR(呼叫详细记录)数据,包括呼叫次数、短信数量和移动上网流量,汇聚起来,作为离基站最近的一个单位空间上的通信数据。综上所述,电信数据集中的各类数据都是以空间网格为基本单位,描述的是空间网格中人类的电信活动。为了保证观察与分析对象的一致性,本章对电力数据和新闻数据也根据其经纬度位置,进行了汇聚到网格的处理,以展示每个网格的电力活动和新闻事件。

3. 移动通信数据流量模式分析

移动通信数据能够体现人类活动,探索人类活动规律,但是它是如何体现人类活动的,又该如何从中探索人类活动规律,需要对数据的流量模式进行观察与分析。由于现如今,人们使用移动电话上网的频繁程度要远大于通话和短信的使用,所以为了更好刻画人类活动规律,本节选取移动通信数据中的移动通信上网流量这一业务数据的流量模式进行观察

3.1移动通信上网流量模式分析

首先对数据集提供的所有数据,即所有网格在61天内的移动通信流量模式进行了观察。为了便于观察,将61天(即两个月)的观察窗口划分为八个完整星期。在初步观察中发现每个网格的移动通信流量在不同的时间尺度上呈现了相似的规律性。在“天”的时间尺度上,每个网格在每天的流量都会有高峰和低谷。在“周”的时间尺度上,每个网格周末两天的流量与前五天明显不同。在两个月的时间尺度上,每个网格前7周与第8周的流量变化有所不同。为了更好的观察移动通信流量值的变化规律,本文选取了其中一个网格进行具体分析。

从人类活动的角度出发,不难发现,上述特点正好体现了不同的人类活动的规律。由于人类在工作日和周末不同的出行模式,导致在这两个时间段的移动上网流量变化不同。同理,由于在节假日和非节假日里,人类出行模式的不同,导致在第八周圣诞节的流量模式不同于前七周非节假日的流量模式。综上所述,从本节的观察与分析中,可以得出,不仅工作日和周末的移动通信流量模式可以体现不同的人类活动规律,假期的移动通信流量模式也体现了独特的人类活动规律。

3.2同种类型区域流量模式分析

本节在对所有网格的流量模式进行观察中发现,有些网格之间,对应时间段的流量模式是相似的。通过google地图查找到网格的具体位置之后发现,这些具有相似流量模式的网格都具有相同的空间承载功能,比如都是农村,我们称它们为同种类型的区域。于是我们选取了其中同类型的网格进行具体的观察与分析。由于假期和非假期会带来不同的人类活动规律,导致前七周的流量模式很相似,但是与第八周不太相同。所以本节选取了第一周和第八周的流量模式,来分别体现出非假期和假期的人类活动。

人类活动模式除了在时间上具有周期性之外,同种类型区域的人类活动一般也是相似的。比如不同的办公区虽然在不同的位置,但是其人员上下班的活动模式是相似的。换言之,通过观察网格之间的流量模式是否具有相似性,可以来判断这两个网格空间承载的区域功能是否相同。

3.3不同类型区域流量模式分析

在对所有网格的流量模式进行观察中发现,存在一些网格,虽然其对应时间段的流量模式是相似的,但是通过google地图查找到这些网格的实际位置之后,发现这些网格属于不同的区域类型,比如有的网格是旅游区,有的网格是农村。同上节分析一致,本节选择了其中两个网格,分别体现非假期和假期人类活动的第一周和第八周流量曲线,进行了具体的观察与分析。

具有不同功能的地区由于相似的人类出行流动模式,可能具有相同的移动通信流量模式,但并不代表具有相同的人类活动规律。土地空间上的人类活动规律不仅包括移动通信数据体现出的人类流动过程中产生的动态活动规律,还包括土地空间上固定的人类生产活动规律,而电力消耗数据作为固有空间人类生产消耗的能源数据,正好体现了空间中人类生产活动的固有规律。所以为了更全面的探索土地空间上的人类活动规律,本文提出融合电力消耗数据和移动通信数据,以观察出更多的人类活动规律。对于融合数据是否可以体现更全面的人类活动规律,本文将在下一章进行观察与分析。

4.结束语

在对移动通信数据的流量模式进行分析过程中发现了以下几个结论。第一,由于人类活动在某些特定时间段具有周期性,所以在这些特定时间段的流量模式也具有周期性,于是提出这些特定时间段内的平均流量模式可以用来表示人类活动规律。第二,由于人类在同种类型地区的活动规律是相似的,所以其流量模式也一般是相似的,于是得出可以通过流量模式的相似性,来判断区域功能具有相似性。第三,人类在不同类型地区的活动规律虽然不相同,但是其移动通信数据的流量模式却有可能是相似的,这是因为移动通信流量模式只能更多体现的是人员在流动过程中产生的活动规律(我们称之为“动态”规律),却无法全面反映人类在特定空间中特定活动的固有规律,我们称为“静态”规律。

参考文献

张慧杰,王蓉,陈斌等.基于轨迹和兴趣点数据的城市功能区动态识别与规律可视分析[J].计算机辅助设计与图形学学报,2018(9):1728-1740.

陈泽东,谯博文,张晶.基于居民出行特征的北京城市功能区识别与空间交互研究[J].地球信息科学学报,2018,20(3):291-301.

于翔.基于城市公交刷卡数据和兴趣点的城市功能区识别研究—以北京市为例[D].浙江大学,2014.