面向用户行为理解的移动通讯数据可视分析

上传人:小** 文档编号:34129128 上传时间:2018-02-21 格式:DOC 页数:11 大小:121.50KB
返回 下载 相关 举报
面向用户行为理解的移动通讯数据可视分析_第1页
第1页 / 共11页
面向用户行为理解的移动通讯数据可视分析_第2页
第2页 / 共11页
面向用户行为理解的移动通讯数据可视分析_第3页
第3页 / 共11页
面向用户行为理解的移动通讯数据可视分析_第4页
第4页 / 共11页
面向用户行为理解的移动通讯数据可视分析_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《面向用户行为理解的移动通讯数据可视分析》由会员分享,可在线阅读,更多相关《面向用户行为理解的移动通讯数据可视分析(11页珍藏版)》请在金锄头文库上搜索。

1、面向用户行为理解的移动通讯数据可视分析 蒋宏宇 吴亚东 赵韦鑫 唐楷 西南科技大学计算机科学与技术学院 西南科技大学四川省军民融合研究院 摘 要: 通信数据包含人类活动的时空以及社会关系等信息, 对人类行为分析有重要的价值.为了帮助分析者对用户的行为进行分析和理解, 构建了从通信数据中探索用户的时空、社交等信息以分析用户行为的可视化流程, 旨在理解用户的行为模式并通过行为的对比发现用户的社会角色以及用户之间的真实社交关系, 通过迭代式交互过程, 对用户不同时段的行为进行有效的理解和分析.在此基础上, 构建了用户行为可视分析系统, 采用半年的通信数据对该方法以及系统进行评估, 结果显示, 本方法

2、能够有效理解个人行为、识别用户之间的关系.关键词: 用户行为; 时空数据; 稀疏轨迹; 作者简介:蒋宏宇 (1994) , ORCID:http:/orcid.org/0000-0003-1534-188X, 男, 硕士研究生, 主要从事可视化、城市计算研究.作者简介:吴亚东, ORCID:http:/orcid.org/0000-0003-0919-9151, E-mail:.收稿日期:2017-07-01基金:国家重点研发计划项目 (2016QY04W0801) Mobile data visual analysis for human activity understandingJIAN

3、G Hongyu WU Yadong ZHAO Weixin TANG Kai Southwest University of Science and Technology; Abstract: Mobile data imply various information, including spatio-temporal characteristics and the social relationship of human activities, which have great value for human behavior exploration.In order to analyz

4、e and understand the activities of mobile users, a mobile data visual analytics framework is proposed focusing on usersactivity understanding based on the spatio-temporal and social features of mobile data.And, a visual analytic system for mobile data is also built, which aims to explore mobile user

5、sbehavior patterns in different period, detect their social roles and discover their real social relationship.It has been examined with mobile data in a city, and the results prove the effectiveness of the proposed method.Keyword: activities of users; spatio-temporal data; sparse data; Received: 201

6、7-07-01移动通信技术的发展不但改变了人们传统的生活和工作方式, 亦大大影响了人们的观念和思维方式.电信企业之间的竞争推进了移动业务的创新和服务质量的提高.移动设备持有量迅速增加, 手持设备通信占据越来越重要的地位, 与人们的生活相关性亦越来越强.通信网络数据中包含了社交信息和时空信息, 通过对通信网络数据进行分析, 可有效掌握用户的行为特点、社会角色、社交网络、用户之间的真实关系等特征, 据此服务提供商便可针对不同用户群体、用户个体进行精准营销, 完成较人性化的消费推荐.安全部门也可据此对个人行为进行取证和分析.1 相关工作1.1 用户行为分析CHEN 等1使用微博位置标记数据构建了可视

7、分析系统, 帮助用户理解和分析移动信息.KRGER 等2分析了用户目的地的 Twitter 数据, 并通过其自行车轨迹提取地图中的关键标签.在轨迹语义方面也有诸多研究, 例如, ANDRIENKO等3将位置轨迹转换为语义轨迹.CHU 等4通过使用文本分析中的 LDA 算法提取出租车数据的主题.每个主题都在一定概率下包含一些道路, 每个出租车轨迹均具有一定概率, 属于一个话题.GONZLEZ 等5发现人的运动模式是有规律的, 个体运动模式与个体概率分布模型具有很高的相似性, 认为人们的运动轨迹在不久的将来会重演.ZHU 等6着眼于用户位置数据中经常出现的地点, 并根据出现时间推测用户所处的位置是

8、家还是公司.谭钧元等7提出用生活熵概念作为用户移动轨迹规律程度的度量, 用个人每天同一时段移动序列的算法弥补稀疏数据采样不足的缺点.SHAD 等8则结合地理信息与用户提供的上下文语义信息增加用户行为预测的准确性.1.2 通话数据分析对蜂窝网络数据的分析一直是研究领域的热点.CALABRESE 等9和 PULSELLI 等10对米兰进行了案例分析, 得到的用户活动的强度和时空特征可以通过对基站的呼叫量进行可视化表示.READES 等11对基站的呼叫量与其附近的公共活动的相关性进行了研究.另外, 针对用户的行为痕迹, 文献11对 150 万人 15个月的移动数据进行了分析, 发现每个人的行为痕迹是

9、不同的, 通过行为痕迹能够识别人.文献12的研究表明, 人们流动模式的基本相似会对流行病预防、应急响应以及城市规划有所启发和帮助.WU 等13设计了一个名为 TelCoVis 的可视分析系统, 旨在帮助分析师利用其领域知识和电信数据深入了解城市用户的移动共现.此外, GONZLEZ 等14总结了长时间大规模人群的手机通话的分析流程.ANDRIENKO 等15设计了一个可视分析系统, 对城市的属性进行了预测.另一方面, ARIETTA 等16基于社交网络的分析思想对基站网络的流量进行了分析和识别.有别于以上工作, 本文用基站序列相似性衡量用户相似程度, 并对用户在基站上的活动痕迹进行可视化, 旨

10、在帮助分析者识别用户行为模式和用户之间的关系.2 设计依据2.1 数据来源数据由 M 市某匿名移动运营商提供.该运营商在 M 市共有 2 032 个基站包含 9 777 个天线.通话记录由手机用户接听电话时产生的, 每次通话将产生一个包含主被叫用户、开始时间、持续时间和与该事件相关联的基站位置的详细通话记录.该数据包含从 2015 年 3 月 1 日到 2015 年 8 月 8 日 150 余天, 共 3 000 万条通话记录, 涉及 1 632 732 个用户和 M 市 2.5 万本地用户.2.2 数据描述与统计使用通话数据进行用户行为的研究, 需要考虑以下数据特征:用户行为的不确定性:用户

11、通话属于随机事件, 易导致数据密度变化大、采样率不稳定、用户轨迹位置不完整等情况发生.用户位置的不确定性:在通话记录中, 承载用户本次通话的基站被记录, 通过基站的 ID 以及基站的信号覆盖面积, 可推测用户通话的大致位置, 但具有很大的不确定性.用户以及记录数据庞大:由于数据周期较长, 数据中包含所有注册为 M 市的用户, 用户数量庞大, 产生的通话记录规模较大.基于这些数据特征, 将从以下几个方面对用户行为进行分析:用户移动轨迹:作为最基本的需求, 用户的地理位置用来表达用户长时间的移动特征、移动频率、移动趋势等特征, 需要将其展示在地图中.用户行为模式:用户在不同基站中呈现的不同的行为模

12、式以及用户的领域路径, 根据用户拥有的领域路径, 能够识别用户的社会角色和行为模式.用户社交关系:用户社交关系作为用户一个重要的属性, 不仅能帮助分析人员推断用户之间的关系, 还能根据用户自我网络上的节点属性推测其自身属性, 联系密切的用户其社会角色也相近.此外, 用户之间的关系是可以传递和推理的, 例如 A 与 B 为亲人关系, B 与 C 也为亲人关系, 毋庸置疑 A 与 C 也为亲人关系.根据数据特征和分析任务, 设计了使用通话数据分析用户行为的流程, 如图 1所示.数据清洗并处理后抽取用户通话关系以及轨迹, 通过可视化模型描述用户行为以及用户之间的关系, 分析者在交互过程中能够完成不同

13、的分析任务.图 1 用户行为分析流程图 Fig.1 The analysis flow of user behavior analysis 下载原图3 用户行为关系用户行为分为社交行为和移动行为, 社交行为表示用户之间的通话关系;移动行为表示用户在基站间的移动.为了分析个体行为以及个体之间的关系, 将从用户紧密度以及用户相似度两方面对用户之间的关系进行讨论.3.1 社交紧密度移动用户之间的通信行为隐藏着用户之间的社会关系, 通过对用户之间大量以及长时间的通话数据进行分析和挖掘, 能够发现用户之间长期稳定的社会关系.人与人之间的社会关系较为复杂, 具有多样性、随机性和不确定性, 联系较多且较密集

14、的用户对不能说明两者之间的关系绝对亲密, 相对地很少进行通话交流的用户对也不能说明他们之间没有亲密关系.作为用户关系的初步分析, 能够通过用户的联系数量、联系的间隔以及联系时段等因素对用户对的关系进行评估.为了处理人与人之间这种复杂多样的关系, 并且更为真实地反映用户之间联系的稳定性和持久性, 本文采用不同的时间窗口对数据进行聚合, 分析者能够对这 3 个重要的元素进行多层次查看和理解.3.2 基站使用模式相似度用户在长时间的活动中会在不同的基站上留下使用痕迹, 通过总结使用痕迹, 可知道用户对于基站的使用模式.例如在公司附近的基站会留下工作时间使用多、休息时间使用少, 工作日使用频率高、休息

15、日使用频率低的痕迹;而在家附近的基站会留下相反的痕迹.为了计算用户在单个基站上使用模式的相似度, 需要计算每个用户在基站上各时段的使用频率:式 (1) 中 i, j 分别表示小时和基站, R k, Rk分别表示记录 k 的通话开始时间和结束时间, R k表示记录 k 中的基站, 在 , 函数中, 如果小时 i 在通话记录 k 的开始和结束时间区间内, 基站 j 等于通话记录 k 的基站, 则返回 1, 否则返回 0.有了每个用户在基站上各个时段的使用频率, 可通过此频率对用户之间的基站使用模式相似度进行计算:式 (2) 中, N 表示用户 i 和用户 j 访问过的基站的集合, 如果该基站只有其

16、中1 个用户访问过, 则他们在该基站上的相似度为 0.3.3 轨迹相似度为了找到和用户关系相近的用户, 使用轨迹相似度对用户相似性进行衡量, 用户的移动轨迹可以用基站序列表示, 利用该基站序列, 对用户相似度进行计算.3.3.1 基站权重基站权重是对轨迹中基站的普遍重要性的度量, 基站权重的计算公式为式 (3) 中, b 表示基站, P 为用户访问所有基站次数的总和, T u表示用户 u 经过的所有基站的集合, |u:bT u|表示用户访问基站 Tu的次数.3.3.2 时间窗口为了对时间进行统一, 针对稀疏轨迹需要设置时间窗口对基站序列进行分割, 设窗口间隔为 1h, 基站序列 BS=b1b2b3bibn, 对应的时间序列T=h1h2h3hihn, 则分割后的基站序列为BS.3.3.3 主导基站序列经过时间窗口划分后, 每个时间窗口下可能包含多于 1 个基站, 于是需要从中选择 1 个最能代表

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号