统计用户行为数据的方法及用户行为数据统计系统的制作方法

上传人:ting****789 文档编号:310042615 上传时间:2022-06-14 格式:DOCX 页数:4 大小:18.47KB
返回 下载 相关 举报
统计用户行为数据的方法及用户行为数据统计系统的制作方法_第1页
第1页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《统计用户行为数据的方法及用户行为数据统计系统的制作方法》由会员分享,可在线阅读,更多相关《统计用户行为数据的方法及用户行为数据统计系统的制作方法(4页珍藏版)》请在金锄头文库上搜索。

1、统计用户行为数据的方法及用户行为数据统计系统的制作方法专利名称:统计用户行为数据的方法及用户行为数据统计系统的制作方法技术领域:本发明涉及数据统计技术,尤其涉及一种统计用户行为数据的方法及用户行为数据统计系统。背景技术:随着互联网的发展,使用互联网的用户数急速增多,为用户提供服务的互联网网站数量也越来越多,为了更好地运营互联网网站以及服务互联网网站的用户,互联网网站运营者需要对大量的用户访问互联网网站的行为数据进行分析、统计,以获取用户访问互联网网站的趋势行为,以及,基于用户访问互联网网站的趋势行为,对用户访问的互联网网站进行排行,并根据处理、统计出的用户行为数据结果趋势、排行进行深入分析,以

2、进一步提升互联网网站的影响力,例如,根据用户行为数据结果趋势、排行,调整互联网网站的运营策略。其中,用于执行用户行为数据统计的统计时间段与互联网网站的运营调整策略密切相关统计时间段越短,互联网网站根据统计结果做出的反馈就越及时,运营策略调整也就越及时,就越能提升互联网网站的影响力。目前,用户行为数据统计主要是二维度统计,分别是用户行为数据发展趋势维度统计以及用户行为数据集的排行榜维度统计。具体来说,互联网网站在自身所属的网站服务器上,通过追加写入格式统一的日志文件,用以记录用户行为数据,各网站服务器以天或月为单位存储记录有用户行为数据的日志文件,在设置的时间(一天或一月)到时,将存储的、通过追

3、加写入的日志文件发送到统计服务器,统计服务器对接收的日志文件进行合并,分析合并的日志文件的脚本,以进行后台处理,通过后台处理,计算出时间单位内的用户行为数据统计结果,例如,用户行为数据发展趋势统计结果以及用户行为数据集的排行榜统计结果,并且录入到相应的数据库中,以方便相应互联网网站运营者进行查询。由上述可见,现有的用户行为数据统计方法,由于以天或月为单位进行用户行为数据统计,使得用于统计的用户行为数据具有一定的时间滞后性,造成用户行为数据统计的滞后性,导致统计结果的实时性较差;进一步地,统计服务器集中处理各网站服务器按日或月记录的日志文件,使得统计服务器实时资源压力较大,需要增大统计服务器进行

4、数据处理的资源量,而在进行统计处理后至下一次进行统计处理之前,统计服务器的资源又处于闲置状态,使得资源利用效率较低。发明内容本发明的实施例提供一种统计用户行为数据的方法,提高用户行为数据统计的实时性、提升资源利用效率。本发明的实施例还提供一种用户行为数据统计系统,提高用户行为数据统计的实时性、提升资源利用效率。为达到上述目的,本发明实施例提供的一种统计用户行为数据的方法,包括在映射存储服务器中预先设置用户行为数据统计映射关系表;接收网站服务器按照预先设置的统计策略实时上报的用户行为数据,更新预先设置的用户行为数据统计映射关系表。其中,所述用户行为数据统计映射关系表包括用户标识信息、时间轴信息、

5、时间轴单位信息以及用户行为数据属性信息。其中,所述用户行为数据中包含用户标识信息以及时间信息。其中,所述更新预先设置的用户行为数据统计映射关系表包括获取用户行为数据中携带的用户标识信息以及时间信息;以用户标识以及时间信息为索弓丨,索引用户行为数据统计映射关系表,判断是否索引成功;如果索引成功,获取与用户标识以及时间信息相匹配的用户行为数据统计映射关系,对用户行为数据统计映射关系中的用户行为数据属性信息进行相应更新;如果索引不成功,将接收的用户行为数据存储至用户行为数据统计映射关系表。进一步包括将更新的用户行为数据统计映射关系表输出至网站服务器。进一步包括根据更新的用户行为数据统计映射关系表,按

6、照预先设置的排序策略,对用户行为数据统计映射关系表中的用户行为数据属性信息进行排行。一种用户行为数据统计系统,该系统包括网站服务器、数据趋势统计服务器以及映射存储服务器,其中,网站服务器,用于监测用户行为,按照预先设置的统计策略,将监测到的用户行为数据进行实时上报;数据趋势统计服务器,用于接收网站服务器实时上报的用户行为数据,更新映射存储服务器中预先设置的用户行为数据统计映射关系表;映射存储服务器,用于预先设置用户行为数据统计映射关系表,根据数据趋势统计服务器的更新,对用户行为数据统计映射关系表进行相应更新。所述映射存储服务器采用Redis存储服务器。进一步包括统计数据输出服务器,用于接收网站

7、服务器输出的统计数据输出请求,根据统计数据输出请求中携带的用户标识以及时间轴信息,查询映射存储服务器,从用户行为数据统计映射关系表中获取与所述用户标识以及时间轴相匹配的用户行为数据统计值,输出至网站服务器。进一步包括通用数据排行统计服务器,用于根据预先设置的排序策略,基于时间段的数据累力口,根据接收的用户行为数据,对映射存储服务器中的用户行为数据统计映射关系表进行实时排行。所述统计数据输出服务器进一步用于接收网站服务器提交的排行榜分类,根据排行榜分类,从Redis排行存储服务器中,查找出相应的榜单数据,然后将查询得到的数据输出给网站服务器。由上述技术方案可见,本发明实施例提供的一种统计用户行为

8、数据的方法及用户行为数据统计系统,在映射存储服务器中预先设置用户行为数据统计映射关系表;接收网站服务器按照预先设置的统计策略实时上报的用户行为数据,更新预先设置的用户行为数据统计映射关系表。这样,基于时间轴对用户行为数据进行实时趋势统计以及排行统计,可以提升统计结果的实时性;进一步地,基于时间轴进行用户行为数据统计,可以使得统计服务器能够较为平均地处理接收的日志文件,从而提升统计服务器的资源利用效率。为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,以下描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,还

9、可以根据这些附图所示实施例得到其它的实施例及其附图。图I为本发明实施例统计用户行为数据的方法流程示意图。 图2为本发明实施例的用户行为数据统计系统结构示意图。具体实施例方式以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。现有统计用户行为数据的方法,由于以天或月为单位进行用户行为数据统计,统计具有一定的时间滞后性,造成统计结果的实时性较差;进一步地,由于涉及较长时间段内日志文件合并以及统计服务器数据

10、库的性能问题,导致统计性能不高,统计所需时间较长;而且,在统计时,统计服务器所需资源开销大,造成统计服务器资源压力过大,统计后,统计服务器资源又大量闲置,使得统计服务器的资源利用效率较低。本发明实施例中,考虑基于时间轴,对用户行为数据进行实时趋势统计以及排行统计,并使用高性能的Redis存储服务器存储基于时间轴的统计结果,以降低以天或月为单位进行用户行为数据统计导致的数据结果滞后的技术问题,提升统计结果的实时性;进一步地,基于时间轴进行用户行为数据统计,可以使得统计服务器能够较为平均地处理接收的日志文件,使得统计服务器所需的实时资源较为均衡,降低统计服务器进行实时处理所需的资源量,从而提升统计

11、服务器的资源利用效率。本发明实施例中,用户行为数据统计分为两部分,一部分是通用的实时数据趋势统计,对应于现有的用户行为数据发展趋势维度统计;另一部分是通用的实时排行榜统计,对应于现有用户行为数据集的排行榜维度统计。对于通用的实时排行榜统计,可以在通用的实时数据趋势统计的基础上,再次进行统计、处理得到。图I为本发明实施例统计用户行为数据的方法流程示意图。参见图1,该流程包括步骤101,在映射存储服务器中预先设置用户行为数据统计映射关系表;本步骤中,用户行为数据统计映射关系表包括用户标识信息、时间轴信息、时间轴单位信息以及用户行为数据属性信息。其中,用户行为数据属性信息可以是用户访问各网站服务器的

12、次数信息,也可以是用户访问每一网站服务器的次数信息,还可以是访问时长信息等;用户标识信息以及时间轴信息也称为用户配置信息。本发明实施例中,根据用户行为数据统计的不同类型,基于时间轴,可以建立不同的用户行为数据统计映射关系表。 例如,如果针对网站服务器的不同用户访问次数进行统计,则建立的用户行为数据统计映射关系表为该网站服务器下,各用户在不同时间段内访问的次数信息;如果针对各网站服务器,分别统计用户访问次数,则建立的用户行为数据统计映射关系表为各网站服务器下,不同时间段内分别访问网站服务器的各用户总访问次数信息。时间轴单位信息可以是小时,也可以是分钟,当然,实际应用中,还可以是日。以网站服务器的

13、不同用户访问次数进行统计为例,表I为本发明实施例示意性的用户行为数据统计映射关系表。表I用户标识时间轴时间轴单位访问次数 12314:00-18:00 TM5 45612:00-18:00 TM10 78910:00-18:00 TM2实际应用中,对于表1,还可以根据时间轴单位,对时间轴进行拆分,形成不同的时间段,并根据拆分形成的时间段,写入相应的用户行为数据属性信息,以用户标识为123的用户为例,用户行为数据统计映射关系表中该用户的相关信息可以如表2所示。表2_用户标识_时间段_访问次数_12314:00-15:00_I_15:00-16:00_I_16:00-17:00_2_17:00-1

14、8:00I表2中,用户123的时间轴被拆分为4个时间段。步骤102,接收网站服务器按照预先设置的统计策略实时上报的用户行为数据,更新预先设置的用户行为数据统计映射关系表。本步骤中,用户行为数据是反应用户行为的数据,例如,访问网站服务器的次数数据、访问网站服务器的时长数据、浏览网站服务器中预设内容的浏览次数数据等。预先设置的统计策略可以是统计服务器根据统计类型的需要,将对应的统计策略下发至网站服务器。用户行为数据包含用户标识信息、时间信息等。对于不同的统计策略,实时上报的用户行为数据中,包含的具体内容也有所不同,例如,对于统计策略为用户访问各网站服务器的次数信息,在上报的用户行为数据中,还包含有

15、互联网网站信息。更新预先设置的用户行为数据统计映射关系表包括All,获取用户行为数据中携带的用户标识信息以及时间信息;A12,以用户标识以及时间信息为索弓丨,索引用户行为数据统计映射关系表,判断是否索引成功,如果成功,执行步骤A13,否则,执行步骤A14 ;本步骤中,首先根据用户标识查询用户行为数据统计映射关系表,确定是否存在与该用户标识相同的用户标识,如果有,再根据时间信息确定所在时间轴的时间段信息。如果用户行为数据统计映射关系表中不存在与该用户标识相同的用户标识,或者,所在时间轴的时间段信息中不包含时间信息,则索引不成功。A13,获取与用户标识以及时间信息相匹配的用户行为数据统计映射关系,

16、对用户行为数据统计映射关系中的用户行为数据属性信息进行相应更新;本步骤中,如果索引成功,表明用户行为数据统计映射关系表中已存储有该用户相关的用户行为数据统计,则对用户行为数据属性信息进行更新,例如,如果实时上报的用户行为数据为123_20120813142006,其中,123为用户标识,20120813142006为用户访问网站服务器的时间信息,则在本步骤中,索引用户行为数据统计映射关系表成功,将表I中用户标识为123的用户的访问次数从5次更新为6次,以及,将表2中时间段为14:00-15:0对应的访问次数从I次更新为2次。A14,将接收的用户行为数据存储至用户行为数据统计映射关系表。本步骤中,如果索引未成功,表明用户行为数据统计映射关系表中还未存储有该用户相关的用户行为数据统计,则存储该用户行为数据。例如,如果实时上报的用户行为数据为1234_20120813142006,其中,1234为用户标识,20120813142006为用户访问网站服务器的时间信息,则在本步骤中,索引用户行为数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号