《图书情报工作》2000-2009年网络引文衰减规律实证研究

上传人:I*** 文档编号:209783095 上传时间:2021-11-11 格式:DOCX 页数:7 大小:22.83KB
返回 下载 相关 举报
《图书情报工作》2000-2009年网络引文衰减规律实证研究_第1页
第1页 / 共7页
《图书情报工作》2000-2009年网络引文衰减规律实证研究_第2页
第2页 / 共7页
《图书情报工作》2000-2009年网络引文衰减规律实证研究_第3页
第3页 / 共7页
《图书情报工作》2000-2009年网络引文衰减规律实证研究_第4页
第4页 / 共7页
《图书情报工作》2000-2009年网络引文衰减规律实证研究_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《《图书情报工作》2000-2009年网络引文衰减规律实证研究》由会员分享,可在线阅读,更多相关《《图书情报工作》2000-2009年网络引文衰减规律实证研究(7页珍藏版)》请在金锄头文库上搜索。

1、图书情报工作20002009年网络引文衰减规律实证研究 图书情报工作20002009年网络引文衰减规律实证研究1 引 言网络引文,又称网络(电子)参考文献、Web引文、Online Citations、Electronic References,是指学术论文后面所附的、其来源出处是互联网资源的参考文献,其突出特征是著录内容中含有网址。1近年来,随着互联网技术的飞速发展以及网络信息资源的日益丰富,网络引文作为一种新型的引文文献类型逐渐被学者所认可和接受。与传统的文献引文不同,随着时间的推移网络引文会出现衰减的现象,即网络引文由原来的可链接变为不可到达。对网络引文的衰减规律进行研究,可以揭示目前期

2、刊网络引文的概况以及网络引文的可靠性,为以后学者的网络引用行为提供一定的指导意见。本文以20002009年图书情报工作wWw.LW(以下简称工作)所刊载论文的网络引文为研究对象,分别从网络引文数量、网络引文衰减情况和半衰期、网络引文衰减原因、网络引文域名、网络引文深度等几方面进行统计、归纳和分析,试图找出我国图书情报学网络引文衰减的一般规律。2 数据的获取及处理方法本文采用南京大学中文社会科学引文索引系统,下载了工作所载论文的所有参考文献并从中提取所需要的网络引文,然后使用Remote Link Checker 软件进行URL的衰减测试,并自编程序对URL 进行近一步的处理,最后将测试结果导入

3、到Excel表格中。3 数据处理结果及分析经统计,20002009年工作共刊载论文4 238篇(卷首语、贺信、书评、消息等除外),网络引文7 206个。3.1 网络引文数量分析由表1可以看出,工作近10年来网络引文量在总体上呈现递增的趋势,由2000年的125条上升到2009年的1 507条,增幅达到12倍。究其原因,一方面是由于从2009年开始工作由月刊改为半月刊,载文量大幅度增加;另一方面,这也与著者在撰写文章过程中参考文献数量越来越多有很大的关系。2综合表1中不同时期的数据,我们可以将工作网络引文在20002009年的发展情况分为三个阶段:第一阶段为兴起时期,即20002003年。这三年

4、工作的网络引文量比较低,仅占全部网络引文量的7.1%,网络引文作为一种新型的引文类型还没有受到学者的广泛关注。第二阶段是2003到2007年,为快速发展时期。这一时期工作的篇均网络引文量由1.23条上升到2.48条,呈现逐年递增的趋势。2007年工作的网络引文量达到1 098条,为2000年的8.8倍,发展势头强劲。这说明,随着我国计算机网络技术的发展,网络信息资源以其特有的优势受到学者的青睐。第三阶段是2008年到2009年,为调整时期。2008年工作的网络引文量由原来的1 098条下降到954条,2009年又上升到1 507条,这是由于刊物改版使其载文量大幅增加,平均每篇论文的网络引文量较

5、2008年减少,2008年的篇均网络引文量为2.08条,2009年的篇均网络引文量下降到1.80条。这种下降趋势和国外的一些研究结果相似。Goh 和 Ng的研究显示,情报学期刊论文的网络引文量在2003年有所下降,Spinellis在研究计算机科学领域的论文时发现网络引文的数量在1999年也有下降的态势。4网络引文从兴起到经历一个快速自由发展的时期后受到了期刊编辑的关注。为了提高期刊论文的质量和网络引文的可靠性,期刊编辑对学者引用网络信息资源的行为进行了规范和限定,这就导致了网络引文量在一定程度上的下降。调整期过后,预计以后我国学者对网络信息资源的利用会越来越多,也会越来越规范。3.2 网络引

6、文衰减情况和半衰期分析3.2.1 网络引文的衰减情况分析。网络引文的可链接率是指网络引文可链接的数目占网络引文总数的比例,其大小可以反映出网络引文衰减的快慢。笔者把工作在20002009年网络引文可链接率的年度变化情况用折线图表示出来(见图1)。由图1可见,除2003年之外,随着时间的推移,网络引文的可链接率总体上呈递增的趋势。这表明,时间越往前回溯,网络引文越容易衰减。工作在2000年的可链接率为32.8%,2009年其可链接率上升到63.7%,比2000年增加了30.9个百分点。网络引文可链接率大幅度提高的原因有三:第一,近年来我国网络设备逐步完善,网站建设水平逐渐提高。第二,随着论文著者

7、引用网络资源的意识增强,引用网络信息资源的行为越来越多,这就促使期刊编辑对这种引用行为予以充分的重视,在审核过程中使用了更加严格的标准。第三,网络信息资源具有很强的不稳定性。旧的信息不断地被新的信息所取代,因此时间越往前网络引文被查找到的可能性就越小。尽管2009年网络引文的可链接率提高到63.7%,但是仍然较低,读者通过网络引文查找相关信息wWw.LW以便进行深入研究存在较大的困难,因此网络引文的可链接率仍然亟待提高。3.2.2 网络引文的半衰期分析。国外对网络信息半衰期测度的研究已经非常成熟,本文引用国外的经典测度模型对工作的网络引文历时半衰期进行精确的计算,测度模型为:th=tl(0.5

8、)/lW(t)- lW(0)5。该模型的各个参数为:W(0)某个年份中某个期刊的网络引文总量,W(t)经过t年时间,某个期刊在某个年份网络引文的可链接数量,th所求的该年份期刊的网络引文的历时半衰期。根据这个测度模型,我们可以计算出工作各个年份网络引文的历时半衰期,其平均值就是工作20002009JP2年的网络引文历时半衰期。例如,工作在2009年的网络引文总量为1 507条,到2011年仍然可以链接到的网络引文数量为960条,则工作在2009年的网络引文半衰期为3*l(0.5)/ 1960-11507=4.61(年)。由表2可知,工作在20002009年的网络引文半衰期为6.16年,即约6.

9、16年的时间,网络引文的一半即为不可用。这和国内的研究结果很相近,如朱莹研究的情报学期刊网络引文的半衰期为6年。与国外的研究结果相比则略长一些,如Goh 和Ng研究的英文情报学期刊网络引文的半衰期为5年,Spinellis研究的计算机科学期刊的网络引文半衰期为4.0年,Rumsey研究的法律期刊的网络引文半衰期为1.4年。产生这种差异的原因是国外的网络技术水平以及学科发展水平均高于国内,其网络信息的更新速度比较快。从表2可以看出,2004年以后工作的网络引文半衰期呈递减趋势,说明随着网络技术的发展和学科发展的进步,我国网络信息的更新速度也在加快,这将使我国的网络信息半衰期缩短。3.3 网络引文

10、的衰减原因分析作为本次研究样本的7 206个网络引文中,已经衰减的有3 428个,占全部网络引文的47.5%。在对网络引文测试完毕后,每个网络引文都会根据其链接情况返回一个代码。在本次研究中衰减的网络引文返回的代码有21种,我们就选取数量排名前10位的代码进行统计与分析,统计结果见图2。对衰减的网络引文返回的代码进行分析,可以找出网络引文的衰减原因,从而为提高网络引文的可链接率提供依据。代码404表示服务器找不到对应请求URL的任何资源。由图2可知,http代码404(Not Found)是网络引文衰减的最主要原因,占全部衰减网络引文的 62.34%,这与国内外的研究结果相近。国内朱莹所做的研

11、究中,代码404所占的比例为53%;国外Spinellis的研究显示代码404的比例为60%,Huebsch的研究中其比例为56%。6产生404代码的原因不尽相同,有可能是DNS解析正确后却无法链接到目的主机,也可能是由于文件/目录名更改、wWw.LW文件移除或文件的重新定位而带来的网址的变化。另外3个常见的错误代码是901、12029、403,其所占比例分别为19.46%、7.88%和5.11%。通常在网络设置方面出现问题时会返回http代码901(Name Unresolved),API代码12029(Cannot Connect)指的是无法连接到所需数据,http代码403(Forbid

12、den)表示的是服务器能够理解用户的http请求却拒绝执行,这很可能是因为用户没有访问权限。通过以上分析,我们可以将这4种常见错误分为网络问题和服务器问题。网络问题指的是访问主机时出现的问题,服务器问题指的是到达目的主机后却无法获取所需要的资源。代码901属于网络问题,所占比例为19.46%;代码404、12029和403属于服务器问题,所占比例为75.33%。由此可见,导致网络引文不可链接的主要原因是网络信息的持久性差,文件、网页甚至网站都较易消亡。73.4 网络引文的深度与衰减规律分析首先我们对深度予以这样的解释:网址中每增加一个“/”,就认定其深度加1,若没有“/”或“/”在URL末尾,

13、则深度为0。国外的相关研究表明:网络引文深度和网络引文的衰减有一定的相关性。网络引文的深度越大,网络引文的复杂性就增加,也就更容易衰减。笔者将工作中不同深度的网络引文的数目和衰减情况进行统计(深度大于6的网络引文的数目较少,统一放入其他一项中),统计结果见表3。从表3可以看出,深度为2的网络引文数目最多,占总数的26.2%;其次是深度为3和4的网络引文,分别占总数的21.9%和15.1%,这3个深度的URL一共占了总数的63.2%。深度为0和1的URL占总数的比例分别为15.0%和14.1%。其他深度(510)的所占比例只有7.7%。可见,工作的作者对深度为2、3、4的网络信息资源的引用很高,

14、对深度为0和1的网络引文的引用次之,对深度为5以上的网络引文的引用极少。这是因为由引文检索到全文文献的一般网址著录比较详细,这就使得深度为2、3、4的网络引文的引用高于深度为0和1的网络引文。随着网络引文深度的增加,网络引文包含的元素增多,其衰减的可能性就变大。因此,学者为了提高自己参考文献的可检索率,对深度为5以上的网路引文的引用就较少。由表3还可以看出,不同深度的网络引文的衰减率在22.2%到59.5%之间。随着深度的增加,网络引文的衰减率呈现递增的趋势,深度为3的网络引文例外。深度为0的网络引文的衰减率明显低于其他深度的网络引文,仅为22.2%,但是随着深度的增加,这种衰减的趋势上升得并

15、不明显。因此,本次研究虽然在一定程度上证实了网络引文深度和其可链接率之间有负相关关系,但这种负相关关系目前还没有证实在统计学意义上具有显著性,尚需进一步深入研究。3.5 网络引文的域名分析互联网地址是用域名来进行区分的。不同的域名代表不同的含义。本研究列入分析范畴的域名有:com(工、商、金融等企业)、edu(教育机构)、org(各种非盈利性的组织)、gov(政府部门)、net(互联网络、接入网络的信息中心和运行中心)、ac(科研机构),对于仅提供IP地址的URL全部放入else项。对网络引文的域名进行分析,可以了解网络引文的来源状况、分布的集中程度,可以得出学者们利用网络资源比较集中的域名类型信息。对不同域名的网络引文的可到达性进行统计、分析,可以得出何种类型的网络引文相对稳定,从而为学者的网络信息引用行为提供指导意见。3.5.1 网络引文域名的数量分析由表4可知,工作在这10年中含有6个顶级域名的网络引文数目为6 312条,占网络引文总数的87.6%,其他网域的网络引文仅占12.4%。在这6个顶级域名中,著者引用最多的是com网站的信息,其所占比例达到25.7%;其次为来源于org和edu网域的信息,所占比例分别为24.0%和17.4%;另外,gov、net、acKG*93个网域的信息被引用的比

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 调研报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号