第五讲: Web点击流分析模型

上传人:枫** 文档编号:569874054 上传时间:2024-07-31 格式:PPT 页数:23 大小:5MB
返回 下载 相关 举报
第五讲: Web点击流分析模型_第1页
第1页 / 共23页
第五讲: Web点击流分析模型_第2页
第2页 / 共23页
第五讲: Web点击流分析模型_第3页
第3页 / 共23页
第五讲: Web点击流分析模型_第4页
第4页 / 共23页
第五讲: Web点击流分析模型_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《第五讲: Web点击流分析模型》由会员分享,可在线阅读,更多相关《第五讲: Web点击流分析模型(23页珍藏版)》请在金锄头文库上搜索。

1、第四讲:Web点击流分析模型主讲:梁满发Web点击流分析Web点击流分析就是通过分析那些访问过的网页的有序数据,预测访问者对WWW站点的访问行为。分析的目的是揭示如何通过Web点击流认识到用户对一个站点最可能的浏览路径,也能求得客户浏览某个特定网页的概率,预测某时间进入网站或离开网站的概率,分析客户浏览某类网页的行为。这些知识可以用来网站在线预测,网页组织设计,电子商务营销宣传等工作。工作目标()了解客户访问网页模式,即各类页网访问频率,链接频率;()分析网页关联和链接关联,分析各类页相近性;()访客访问网页链接秩序,即行为模式;()寻找某网页之间的链接路径。认识数据我们以某个网站服务器记录下

2、某段时间客户访问网站的日志数据为分析对象,文件名为SAMPSIO.WEBPATH,它含有四个变量信息:REFERRER访问网页信息。SESSION_ID客户标识。REQUESTED_FILE访问过程中要提交的信息。SESSION_SEQUENCE访问的次序。REFERRER变量频数表这个变量是服务记录下访客访问网页的记录。从表中看出,有232个缺损值(标记),这个缺损值可能是服务器记录错误,因此,数据要过滤掉它。SESSION_ID变量频数表此变量记录了访客访问的时间。没有缺损值。REQUESTED_FILE变量频数表REQUESTED_FILE表示在访问网页过程被要求提交信息。SESSION

3、_SEQUENCE变量频数表设置变量角色首先,我们进行日志文件分析。从REQUESTED_FILE变量中提取访问网页的信息。因此,我们把SESSION_ID变量设置为ID角色,REQUESTED_FILE变量为Target角色,其它的为Rejected角色。增加InputDataSource节点到工作窗tothediagramworkspace.设SAMPSIO.WEBPATH为源数据.分配SESSION_ID为ID角色.分配REQUESTED_FILE为Target角色.分配REFFERER和SESSION_SEQUENCE为Rejected角色.采集点击流信息增加LinkAnalysis节

4、点.打开LinkAnalysis节点,选择ToolsSettings.点击PostProcessing.关闭DetailedSettings窗和LinkAnalysis节点.保存修改.右击LinkAnalysis节点,选择Run.选择results.MDS分析注意:没有链接方向在圈中的页面可认为是同类的,即目标访问相近链接次序分析为了分析访客访问网页秩序行为,则要增加网页链接秩序的变量,因此,u分配SESSION_ID为ID角色,.u分配REQUESTED_FILE为Target角色u分配SESSION_SEQUENCE为Sequence角色.u分配REFFERER为Rejected角色l增加

5、LinkAnalysis节点.1.打开LinkAnalysis,选择ToolsSettings.2.点击Transactions,并将Minimum Count值设置为13.点击PostProcessing,在Nodes: separate prefix from value下下,将Number of delimiters从0改为10。4.保存修改5.选择运行6.观察结果节点数从30个增加到67个客户点击导航模式显示网页之间的移动模式显示访问路径u点击Transactions,并将Sequences栏中的Minimum Count值设为1.1.设置Keep very long sequence

6、s为“No”.2.设置Retain path positions为“Yes”.3.点击PostProcessing,在Nodes: separate prefix from value内内,将Number of delimiters从0改为10.u运行u浏览结果选择DetailedResults.移去All.增加All在Layout窗中,Technique选择Tree,点击在在方向选择polar,点击OK.u右击工作窗,从弹出的菜单中选择Display,再点击,再点击Links栏.在Direction域中,direction设为_null_.u在Mode栏中,选择Enhanceu设Batch Size为1024。u点击OK,关闭.寻找详细的导航路径右击选择Path菜单.在FindPaths窗中,点击Source Nodes,选择增加Text在SourceNodes窗,选择iset1=/Home.jsp.点击OK.1.点击Sink Nodes,选择增加Value菜单.在SinkNodes窗中,选择Deparment.jsp2.点击OK.流程图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号