信息检索十LinkAnalysis

上传人:第*** 文档编号:122117745 上传时间:2020-03-01 格式:PPT 页数:39 大小:364KB
返回 下载 相关 举报
信息检索十LinkAnalysis_第1页
第1页 / 共39页
信息检索十LinkAnalysis_第2页
第2页 / 共39页
信息检索十LinkAnalysis_第3页
第3页 / 共39页
信息检索十LinkAnalysis_第4页
第4页 / 共39页
信息检索十LinkAnalysis_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《信息检索十LinkAnalysis》由会员分享,可在线阅读,更多相关《信息检索十LinkAnalysis(39页珍藏版)》请在金锄头文库上搜索。

1、湖南大学计算机与通信学院刘钰峰 互联网信息搜索十LinkAnalysis 社会网络 socialnetwork 任何一种用于建立个体之间联系的自然现象 社会活动或技术机制都可能形成一张网 朋友关系 对称 无向图 知晓关系 不对称 有向图 文献引用关系 不对称 有向图 co author关系 对称 无向图 成块 clique 通电话 通信病毒传染 生物 计算机 网页链接关系 不对称 有向图 还可以考虑不同的 尺度 网站之间 城市之间 省份之间 国家之间 WebGraph 研究这些 关系图 有什么意义 一阶指标 入度 知晓关系 社会知名度引用关系 认可程度 高阶指标 和一个著名人物 共同发表 论文

2、的 距离 越短似乎显得越 有荣誉 例如 Erdosnumber 仅仅是 结构 就可以带来丰富的 语义 例如省份之间的链接数差别可能有有意义的解释 知名度 声望 重要性 reputation prestige importance 完全靠 入度 来评价可能显得比较粗燥 即这种评价模型不一定很准 认识甲的人可能和认识乙的人一样多 但认识乙的人都是些 重要人物 于是通常应该认为乙比甲重要不仅是人 论文也是一样 被重要的文章引用的文章可能就比较重要些例子 按照入度 节点1 3同样重要 2 4同样重要 但我们似乎感到3比1重要些 2比4重要些 如何用一个模型来刻画这种感觉 使算出来的 重要性 反映这种感

3、觉 在Web之前就有社会网络分析学术领域 文献计量学 bibliometry 研究文献的贡献程度哪些文章是 有影响的 文章 研究文献的聚类 从而可能得到一个领域发展的状况co citation分析 如果a引用了b和c 称b和c有co citation关系流行传染病学 侦察 谍报学发现那些关键节点 删除它们使得其他节点之间的距离显著扩大模型 指标体系的 合适性 取决于应用目标 图论 线性代数若干概念回顾 图 有向图 邻接矩阵 两节点间的距离 d 节点的半径 r 图的连通 有向图的强连通 连通分支d u v 从u到v的最短路径的长度r u 最大的距离c G 具有最短半径的节点矩阵 A 矩阵的转置 AT 行列式 A 特征值 特征向量 线性相关性 应用举例 Co citation分析 给定一个文献的集合 希望表达这些文献两两被同时 同一篇文章 引用的情况coc i j 越大 表示这两篇文章的相关性越强形成文章之间的邻接矩阵E 使得E i j 1 当且仅当文章i引用了j 否则E i j 0 这意味着 E的第i列反映文章i被引用的情况 同时引用文章i和文章j的文章数量等于E i 和E j 在相同的行出现1的个数 考虑到E元素的 0 1 特性 即coc i j E k i E k j k 1 2 n或者coc ETE

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号