基于层次分析法的网页排序技术

上传人:m**** 文档编号:508998952 上传时间:2024-02-11 格式:DOCX 页数:1 大小:11.78KB
返回 下载 相关 举报
基于层次分析法的网页排序技术_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于层次分析法的网页排序技术》由会员分享,可在线阅读,更多相关《基于层次分析法的网页排序技术(1页珍藏版)》请在金锄头文库上搜索。

1、基于层次分析法的网页排序技术1概要经过多年的探究开展,向量空间模型、语言模型、布尔模型、链接分析算法、相关性排序模型等都曾或正被应用到搜索引擎中。目前用得比拟多的排序算法是在链接分析算法的根底上参加更多的排序因素:关键词在网页中出现的位置、点击次数和网页被引用次数等。这些方法最大的缺乏是不同用户搜索得到的网页结果排序是一样。2层次分析法2.1层次分析法原理层次分析法(ahp),其主要思想是通过对复杂系统的有关要素及其互相关系进展分析,将其简化为有序的递阶层次构造,使这些要素归类到不同的层次,形成一个多层次的分析构造模型,最终把系统分析转化为确定最低层(决策方案)相对于最高层(总目的)的相对重要

2、性权值的问题。ahp使用时先将问题中的因素划分到不同层次中,利用一致矩阵法确定各层次因素间的权重,经过归一化得出由同层次因素对于上一层次某因素的相对重要性的权值所组成的矩阵。然后计算某层次所有因素对最高层相对重要性的权值。两次相对重要性权值计算都需进展一致性检验。ahp实现网页排序的原理是以网页和搜索关键词之间的相关度为最高层,点击次数、词频、词位置、引用次数、阅读时间和用户个人信息作为中间层,搜索的结果网页为最底层。通过结合搜索和层次分析法排序完成搜索任务。2.2基于层次分析的网页排序首先对用户提交的关键词进展同义词查询,基于关键词及其同义词进展扩展查询,查询返回关键词在页面中的位置、阅读平

3、均时间、点击率、被引用次数等信息,然后对返回的结果页面结合ahp分析得出相关性排序网页,最终向用户反响排序结果。假设用户提交关键词后得到5个页面,为得到的页面创立searchedpage实例。该实例有以下字段:id(页面在db中的编号),relevance(关键词与页面的相关程度),hitweight(页面被点击次数权重,/100),refweight(页面被引用次数权重),posweight(关键词位置权重,根据关键词第一次出现的位置判断,标题部分取20,正文按每10%减1,正文前10%取10),freweight(关键词频率权重,*100),readtweight(页面平均阅读时间权重,*

4、100),cusweight(用户个性化相关权重,页面类别与用户爱好匹配取3,否那么取1),synweight(词义间隔 权值,取值0-5,直接匹配取0)。假设这5个页面:(hitweight,refweight,posweight,freweight,readtweight,cusweight,synweight)5个页面取值分别为:p1(9.6,24,20,0.93,2.7,1,1),p2(3.1,7,9,0.2,1.76,1,1),p3(8.2,13,10,0.98,0.84,3,1),p4(9.7,8,10,1.15,0.79,1,0),p5(5.4,36,20,0.81,0.8,3,2)。利用ahp求解relevance。根据中间层因素对relevance取值的影响程度,建立比拟矩阵t,其中t12=1/3表示作者认为关键词在页面中的位置比其出现频率更重要。通过计算,得比拟矩阵t的最大特征根=7.3,相应特征变量为w=(0.11,0.34,0.05,0.24,0.10,0.08,0.09)t,一致性检验指标ci=(-n)/(n-1)=0.05,n=7。查表知随机一致性指标为ri=1.32,一致性比率cr=ci/ri=0.038

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号