基于小世界现象的学科信息门户链接设计优化策略

上传人:jiups****uk12 文档编号:90775311 上传时间:2019-06-16 格式:DOC 页数:18 大小:309.01KB
返回 下载 相关 举报
基于小世界现象的学科信息门户链接设计优化策略_第1页
第1页 / 共18页
基于小世界现象的学科信息门户链接设计优化策略_第2页
第2页 / 共18页
基于小世界现象的学科信息门户链接设计优化策略_第3页
第3页 / 共18页
基于小世界现象的学科信息门户链接设计优化策略_第4页
第4页 / 共18页
基于小世界现象的学科信息门户链接设计优化策略_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《基于小世界现象的学科信息门户链接设计优化策略》由会员分享,可在线阅读,更多相关《基于小世界现象的学科信息门户链接设计优化策略(18页珍藏版)》请在金锄头文库上搜索。

1、基于小世界现象的学科信息门户链接设计优化策略肖雪2012-9-25 9:14:40来源:情报杂志(西安)2011年10期【英文标题】Design Optimization Strategies of the Hyperlink of Subject Information Gateways Based on Small-world Phenomenon【作者简介】肖雪(1979-),女,讲师,研究方向:信息服务与用户研究,南开大学商学院信息资源管理系,天津300071【内容提要】从平均最短路径、集团系数、对数路径和中心节点描述了小世界网络的特性和模型,从知识组织和用户行为的角度指出学科信息网络

2、具有更为明显的小世界现象。采用小世界度量指标对CSDL4个学科信息门户进行分析,发现网络链接存在的问题。据此提出学科信息门户链接设计的优化策略:采用知识链接技术发展多重链接、基于凝聚子群分析和语义网确定链接集合边界、基于数据挖掘和知识地图技术寻找捷径、运用信息计量和社会网络分析方法识别中心节点。This paper describes the mode of small-world network from characteristic path length, clustering coefficient, short cut and central node. And it further

3、 points out the small-world phenomenon also exists in subject based information gateways from perspective of knowledge organization and user behavior. Using factors of social network analysis, the hyperlinks in four subject based information gateways of CSDL are analyzed and problems are found. Then

4、 the paper proposes optimized strategies for hyperlink design, including developing multiple links, determining link set boundaries based on cohesive subgroup and semantic web analysis, seeking shortcut with the help of data mining and knowledge map, identifying central node using informetrics and s

5、ocial network analysis method.【关 键 词】小世界现象/学科信息门户/网络链接/社会网络分析/知识链接Small-world phenomenon/Subject based information gateways/Network hyperlink/Social network analysis/Knowledge linkage0、引言1967年,美国社会心理学家Milgram通过著名的发信试验,发现任意两个人之间最多通过6个人就能取得联系,由此提出了“六度分离”理论。1970年White运用模型,提出了一个修正估计值约为7个中间人1。尽管对于六度分离的确切

6、数值存在分歧,但与总人口的数量级相比,无论哪一个数值都是非常小的,这就从科学的角度表明世界虽大,但也很小,“小世界现象”由此得名。2002年哥伦比亚大学社会学系Watts和Strogatz通过电子邮件在全球范围开展了一个“小世界研究计划”,再次重复Milgram的试验,结果表明邮件平均经过5步7步传递到目标接收者2,再次验证了人际网络中小世界现象的存在,也使“小世界现象”这一术语广为学术界所接受。此外,研究者们还发现在生物细胞网、脑神经网、电力网、航线网络、互联网等多个领域中链条距离长度各有不同,但基本都表现为一个很小的常数,表明小世界现象对于刻画真实世界十分奏效。根据“大世界悖理”,世界尽管

7、很大,总是可以缩成“小世界”,而“小世界”则能保障信息交流扩大进行3,因而小世界原理为实现从大世界到小世界的渡越、从无序繁衍走向有序控制提供了明晰的思路。1、小世界现象的原理概述任何网络都可以抽象为多个节点(代表网络中的个体)和各点之间的连线(代表个体之间的联系)构成的集合,存在小世界现象的网络也不例外。因此,探究小世界原理首先就要构建具有普适性的小世界网络模型,复杂网络和图论对此提供了很好的分析思路。研究者最早将小世界网络解释为规则网络,即网络中每个节点(共有N个节点)都遵循既定的规则,只和该节点最邻接的K个节点建立连接(见图1的左图);与规则网络相反的是随机网络,即网络中节点之间的连接是完

8、全无规则的,每个节点都有同等的机会和其它节点建立连接,不存在高度连通节点和集聚情况(见图1的右图),这两种情形都与实际不相符。Watts和Strogatz将规则网络上的每一条边按一定的概率p(p0.1)进行重定向,增加与其他节点之间的连接,同时保证没有重复的边和自连接的边,这时就会出现少量的快捷连接,它们会伸展到较远的节点,但由于p很小,网络模型总体仍大致维持规则结构(见图1的中图),也就是说小世界网络是具有一定随机性的一维规则网络4-5,这就是著名的W-S小世界网络模型。图1规则网络、W-S小世界网络和随机网络的简化模型资料来源:Watts Duncan J, Strogatz Steven

9、 H. Collective dynamics of “small-world”networksJ.Nature, 1998,393:440-442图中显示了通过调节p值进行重定向,实现的从规则网络到小世界网络再到随即网络的转化,图中N=20,K=4。W-S小世界模型中涉及四个重要特性,即特征路径长度(Characteristic path length L)、集聚程度(Clustering coefficient C)、捷径(Short cut)和中心节点(Central node),这成为深入理解小世界现象形成机制的切入点。各类网络中的节点数量和位置在建立连接之前都是不确定的,因此难以形成

10、纯粹的随机网络,但节点之间也存在随机的连接,它会有助于产生捷径。另一方面,虽然连接难以受制于某一具体规则,但节点总是围绕某一主题建立相关关系,从而会出现网络中与某个节点相连的节点间又存在彼此相连的现象,表现出很高的集团化聚类效应6。这一效应不仅为其中的各节点提供连接通道,也成为限制网络增长的重要力量,使得网络中所有节点对的平均路径长度L随着网络大小N呈对数增长(L值较小)。此外,节点的连接常常受到优先连接机制和马太效应的影响7。即网络中越是有很多连接的节点越能获得更多的连接,连接数量的累积使得整个网络并不均匀,产生出少量拥有较多连接的中心节点以及一些联系更加紧密的子团体即凝聚子群,中心节点的存

11、在为网络中任意两个节点创造了联系途径,有利于降低网络的特征路径长度。总之,小世界现象的形成展现了网络内部结构和关联关系的建构原理,它与多种网络机制的合力作用息息相关,也会对网络内外的个体产生影响。2、学科信息门户的小世界现象分析学科信息门户(Subject Based Information Gateways,简称SBIGs)通过对某一学科领域的资源进行收集、分析、鉴别、标引和组织,实现学科网络资源内容的高度组织集成,为用户提供访问某一学科资源与服务的单一入口和统一协作的学术交流环境8。作为互联网的一部分,它自然具有了小世界特征,不仅如此,由于学科知识网络、用户信息行为及自身建设的一些特点,学

12、科信息门户的小世界现象表现更为明显。首先,学科知识网络中存在小世界现象。数学界的“艾尔德数”最早反映了数学领域合作网络的小世界现象,此后多项研究表明,在生物医学、计算机科学、物理学、生物学、图书情报与文献学等领域的研究者合作网络中也都存在小世界现象9-10。文本层面的小世界现象也有发现,石晶等人证明了由文本形成的词汇共现图呈现短路径、高聚集度的特性11。从专类网站的链接分析来看,Lada Adamic分别分析了64 826个web网站和11 000个.edu网站,发现两者的集聚程度分别为0.081和0.156,特征路径长度分别为4.228和4.06212,说明后者具有更高的集聚程度和更短的特征

13、路径长度,这与后者主题集中性更强有关。当然,由于同一学科的地区发展差异以及不同学科的发展差异,小世界现象也存在差异,如同是“艾尔德数”,欧美作者就比亚非等地作者的数值普遍偏小。其次,从用户信息行为方面来看,也显示出可获取信息很多,但实际获取信息有限的小世界现象。从获取数量上看,Spink在1997-2002年对Excite搜索引擎的Web日志统计发现,大多数用户只查看返回结果的前十条,每页10个记录的话,平均查看结果的数量是2.35页13。从获取过程来看,用户当超出了一定页数仍对结果不满意,则选择其他方式途径或放弃。即使是较令人满意的检索,也常表现出“适可而止”的行为,通常不甚追求结果的“全面

14、无遗漏”14。这就意味着个体用户会在自身可承受的知识负荷与信息获取成本的前提下,主动的在小范围内获取信息,因而用户信息获取的集聚程度很高。另外,论文引用体现着用户对信息的主动利用,研究发现其中同样存在着小世界现象15。第三,学科信息门户的建设特点有利于形成小世界现象。从资源选择的角度来看,学科信息门户中的资源都是围绕某一学科主题进行集中的,相互之间具有天然的关联性,被链接的信息之间往往又互相链接;从信息组织的角度来看,分类法和主题法提供了学科知识之间有序和多重链接的基础;从用户角度来看,学科信息门户主要针对专业用户,他们希望在信息门户中获得一站式的信息服务,因此建立多个信息点之间的链接必不可少

15、;从技术的角度来看,超链接技术既实现了信息集成和有序组织的功能,也定义了超文本的非线性结构,可以快速实现不同网页和信息点之间的切换,提供信息获取的捷径。综上所述,学科信息门户的小世界现象实质是学科信息、用户需求和知识组织共同作用的结果,超链接则是重要的实现手段。链接具有数量、结构、集聚度、距离、可达性等多维属性,考察链接状况可以获取整体网络的发展状况。3、学科信息门户的链接现状分析我国的学科信息门户建设大约始于1999年上海图书馆的“数字图书馆资源总汇表”和2000年CALLS组织的学科导航库16。目前已有国家科学数字图书馆(CSDL)、中国科技图书文献中心(NSTL)、中国林业科学研究院、武

16、汉大学、武汉理工大学等多个主体参与,建设的学科信息门户涉及生命科学、化学、数学物理、资源环境、图书情报、林业、交通运通等多个领域。其中,CSDL自2001年启动以来先后建立了5个学科信息门户,建设比较规范,在国内学科信息门户中具有很强的代表性。因此,本文重点对这5个网站的链接情况进行调查分析。运用链接获取工具SocSciBot 3分别爬取5个网站,但因生命科学学科信息门户无法爬取,最终仅获得了4个学科信息门户的链接数据。随后,采用社会网络分析工具Pajek和Ucinet 6进行测量,内容包括网络密度、节点数量、链接数量、网络集聚度、特征路径长度等小世界度量常用指标(见表1)。分析发现,这4个学科信息门户的节点数量和链接数量都较多,说

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号