《虚拟图书馆的信息组织》由会员分享,可在线阅读,更多相关《虚拟图书馆的信息组织(5页珍藏版)》请在金锄头文库上搜索。
1、虚拟图书馆的信息组织摘要虚拟图书馆都是专题性的,没有综合性的虚拟图书馆。虚拟图书馆要对链接进展鉴定核实,不产生死链。虚拟图书馆要对搜集的信息进展分类、编排等合理组织。虚拟图书馆的主要工作可以概括为两点:信息搜集和信息组织,即一次文献的搜集和二次文献的组织。关键词虚拟图书馆信息意识信息搜集信息组织一、虚拟图书馆的概念虚拟图书馆是更具特定的目的,选定信息资源的学科领域,对有关的网站网页进展搜集和整理,加以鉴定核实,并对核实后的网址进展合理组织,为有关网址进展特征描绘,编制或采用一定的软件以供信息存储与检索,并实现对网页网站的链接,对数据的不断维护与更新,包括对原有网址的定期核实和新网址的纳入,使之
2、可以提供检索、阅读和链接的信息集合。虚拟图书馆从本质上讲是一个专业性的搜索引擎,一般是采用人工著录的方法。它将互联网上某一特定领域中的网页搜集起来,作为一次文献,然后对其进展标引和著录,著录的结果形成以款目的形式构成的中央数据库,在中央数据库的根底上抽取有关著录工程形成相应的倒排挡。用户检索时,输入检索式,在相应的倒排档中进展匹配,根据匹配后的结果调出中央数据库中相关款目,显示在计算机屏幕上,并给出相应网页的URL,供用户进一步阅读一次文献。在这个定义中,我们可以把虚拟图书馆的本质特征概括为下述三点:其一是虚拟图书馆都是专题性的,没有综合性的虚拟图书馆。其二是虚拟图书馆要对链接进展鉴定核实,不
3、产生死链。其三是虚拟图书馆要对搜集的信息进展分类、编排等合理组织。虚拟图书馆的主要工作可以概括为两点:信息搜集和信息组织,即一次文献的搜集和二次文献的组织。二、虚拟图书馆的信息搜集虚拟图书馆的信息搜集有选定专题和搜集网站网页两个步骤。1.拟图书馆的选题从选题根据角度来讲,虚拟图书馆选题的根本根据是用户的需求与因特网上信息资源的现状相结合,用户需求是推动虚拟图书馆建立的原动力。纵观因特网上存在的虚拟图书馆,每一个都是用户需求驱动的直接结果。另外,因特网上所选专题信息资源的多寡构成了虚拟图书馆选题的另一个根据。假如信息资源过少,就失去了建立所选专题的虚拟图书馆的必要性。从选题内容角度来讲,虚拟图书
4、馆都是以学科专业或专题作为选题对象的。与其他网络二次信息系统(如搜索引擎)相比,虚拟图书馆的选题内容都比拟狭窄。例如,目前清华大学虚拟图书馆现有的选题有人工智能、计算机仿真、形式识别、机器人等。又如,目前虚拟图书馆中具有代表性的选题有AIDS(爱滋病)、DistaneEduatin(远程教育)等。从选题来源来讲,虚拟图书馆的选题来源一般有两种:其一是单位机构的信息资料中心(图书馆、资料室等)选题,这在大学图书馆的网站中比拟普遍。许多大学图书馆选择本校的重点学科专业、特色学科专业以及重大课题工程建立虚拟图书馆,以满足有关用户的信息需求。其二是专家学者个人选题,以此来构建虚拟图书馆,上传到因特网上
5、的EB效劳器,供广阔网络用户使用,用户在使用过程中参与维护。例如,虚拟图书馆中的许多专题就是这样产生的。2.搜集网站、网页1搜集方式目前虚拟图书馆常用的搜集方式有以下两种:手工搜集:对于数量宏大、纷繁复杂的网络信息资源,手工搜集看似大海捞针,但在自动搜集走向智能化之前,手工搜集仍然是必不可少的一个环节。事实上,目录型检索工具如Yah的信息归类主要还是依靠人工。少数公司,如美国联机计算机图书馆中心的L的Netfirst完全是依靠专业人员来分编和标引网络信息。自动搜集:自动搜集就是指被称为机器人RBRT、蜘蛛SPIDER等的计算机程序定期或不定期拷贝所访问的互联网主机,绝大多数是万维网的效劳器的部
6、份或是全部内容然后由提供检索效劳的公司或单位对之标引和组织,虚拟图书馆要根据本学科、本专题的特点编制合适于本学科专业信息搜集的自动搜集软件。具备自动搜集功能是一个优秀的虚拟图书馆必须具备的根本条件,否那么就难以对互联网上的日益增长的信息进展追踪。2虚拟图书馆搜集的内容虚拟图书馆中的网页网站搜集与其他网络二次信息系统相比,虚拟图书馆所收录的网页网站都具有学科专业及专题性的特点。从内容上讲,虽然不同的虚拟图书馆收录的网页网站存在着较大差异,但除了与所选学科专业专题相关的特殊问题的信息资源外,笔者认为,一个虚拟图书馆,无论是什么专题,假如有网络信息资源保障的话,都应该收录下述类型的网页网站。网络图书
7、是因特网上一种常见的信息资源,它具有出版发行周期短、“修订及时、内容相对系统全面、成熟可靠等特点。网络图书的来源有三种:现有图书数字化后上网、原有的封装型电子图书(如软盘图书、DR图书等)上网和直接在网上出版发行的图书。网络大致可分为两类:其一是传统的网络版,其二是纯网络型。前者大多为商业性的,而后者目前根本是免费的。另外,因特网中目前已出现了许多电子预印本系统,如较有影响的e_PrintarXiv电子预印本文献库。网络及其预印本出版周期短,报道速度快,刊载的多是一些学术性较强的论文,因此成为虚拟图书馆重点收录的对象。因特网上的学术会议信息有会议通知(包括征文通知)和会议论文集两种。学术会议通
8、知的生命周期很短,一旦过期就失去了存在的价值,应及时从虚拟图书馆中删除。会议论文的学术性较强,内容新颖,往往反映了某一学术领域国内外的最新开展状态,利用价值较高。组织机构包括从事虚拟图书馆所选领域的研究机构、实验室、教育机构、学术团体(学会、协会等)及产品的推广机构等。实际上每一个学科领域或专题都有相应的研究机构,绝大多数领域或专题都有相应的教育机构和学术团体。这些组织机构在进展教学、科学研究、组织学术交流以及其他日常活动中,产生了大量的原始信息。通过访问它们的网站,可以得到大量的技术报告、学位论文及教育教学信息等。主要人物的网页网站或个人主页,一般记载了联络方式、主要的出版著作和论文、主要的
9、研究领域、研究经历和在研工程及进展情况等,利用价值也较高。因特网上的一些交流方式往往针对某一感兴趣的问题在网上进展讨论,其中包括了许多与科技有关的话题,这些讨论的议题经常是某一学科领域的热点或疑难问题。这些信息交流的主要方式有BBS、Usenet/Nesgrups、Listerv/ailinglist等。有关软件、专利和标准的网页网站,它们是涉及到自然科学专题尤其是工程技术专题的虚拟图书馆的主要收录对象。随着政府信息化的推进,因特网上的政府信息日益增多,是学术研究的重要信息资源。目前,因特网的政府信息大致包括介绍政府部门的职能、人员、机构、政策、法规、成果以及出版物信息等。近年来,因特网上出现
10、了众多学术价值甚高的数据库,其中有的是综合性的,有的是学科专业性的,还有的是专题性的。免费数据库资源是虚拟图书馆的重点收录对象,但对于商业化的数据库,目前公益性的虚拟图书馆只能调出页面,无法调出其全文。三、虚拟图书馆的组织方式虚拟图书馆通常采用主题树和数据库这两种方式来组织信息。1.主题树方式所谓主题树方式,就是将虚拟图书馆所选定学科领域的所有已获得的信息资源按照某种事先确定的概念体系构造,分门别类地逐层地加以组织,用户通过阅读的方式逐层加以选择,层层遍历,直到找到所需要的信息线索(即相关网页链接),进而通过信息线索找到相应的网络信息资源,这种组织方式的优点在于:简单易用,屏蔽了网络信息资源系
11、统对于用户而言的复杂性,提供了一种基于树形阅读方式的阅读界面;信息检索按照一定的体系构造,逐次查看,因此对用户而言,目的性强。其缺点在于:体系的构造不能过于复杂,每一类目录下细分的主体不宜过多。因此,这种组织方式对于小型的虚拟图书馆而言,由于体系构造简单,类目的专指度较高,检准率也高。但假如虚拟图书馆学科主题范围较宽,相应的分类体系就较复杂,为了方便显示和使用,就要牺牲类目的专指度,导致检准率下降。2.数据库方式即将虚拟图书馆所包含的这一学科或领域所有已获得的网络信息资源以固定的记录格式存储,并提供一些检索入口,就可以找到所需要的信息线索,进而通过信息线索直接链接到相应的网页。这种方式的前提是
12、关键词标引,从而形成关键词倒排档。这种组织方式通过对信息进展标准化和优化处理,大大进步了数据操作的灵敏性,因此成为应用广泛的网络信息组织方式。它对用户也提出了较高的要求,要求用户掌握一定的检索技巧,包括关键词及其组配方法的选择,等等。实际上,虚拟图书馆的信息组织往往是上述两种方式的结合,既有主题树,为用户提供分类检索,又有数据库,为用户提供主题检索。对Internet网上信息资源进展精心筛癣分类、标引、注解,针对特定的用户群体建立Internet网上的虚拟图书馆是目前开发利用Internet网上资源的一种有效途径。假如单纯使用主题树方式组织信息,那么就形成了专业学术导航这样一种组织结果,其组织
13、的手段和形成的结果都包含在虚拟图书馆内涵中,笔者认为,专业学术导航是虚拟图书馆的一个子集,是虚拟图书馆建立中的一个中间产品,故在此不多加赘述。四、虚拟图书馆的组织过程1.网页、网站的著录从功能构造上讲,虚拟图书馆相当于传统检索工具中的一部主题索引,而每一网站网页在虚拟图书馆中那么相当于主题索引中的一个款目。对网页网站的著录事项是决定其信息含量、引得深度和检索途径的基矗虚拟图书馆中网页网站的著录事项主要有:(1)网页网站的标题。这是每一个虚拟图书馆中必备的著录事项,也是用户选择阅读网页网站的主要判断根据。(2)网址。这是用户阅读原始网页网站的链接入口。目前有的虚拟图书馆在显示用户的检索结果时,网
14、址作为一个字段加以显示,但大多数都将网址隐含在网页网站的标题字段内容之中,作为该项内容的超链指针(如虚拟图书馆中所有的专题都采用这种方式)。采用第一种显示方式时,对于由于镜像等原因导致一样网页网站产生多于一个网址的,可以方便地将这些网址都记录和显示,各网址间用一定的分隔符隔开。同时,对于产生死链的链接,用户还可选择其他链接来调出原始的网页网站。假设采用第二种显示方式,对于上述情况系统管理员只能人为地选择其中一个网址作为用户的链接入口。地址可用文字型地址,也可用数字型地址。(3)内容简介。该著录事项为用户提供了虚拟图书馆中所收录的网页网站的内容概要,也是用户判断是否需要进一步调出原始网页网站进展
15、详细阅读的主要根据之一。目前,几乎所有虚拟图书馆对收录的大多数网页网站都有该著录工程。内容简介除指明其覆盖面外,还应指明其收录材料的起始时间、更新周期及有无检索手段等。(4)关键词。这是虚拟图书馆实现词汇控制的方法,也是向用户提供关键词检索的前提,应该提倡人工关键词标引。目前因特网上的虚拟图书馆对信息组织有些比拟简单,仅提供分类阅读功能。但也有不少虚拟图书馆提供关键词的词汇控制功能,如虚拟图书馆的Anthrplgy(人类学)专题。(5)国别及站点的类型。这个著录事项应视虚拟图书馆的学科专题性质而选择,它是提供虚拟图书馆中所收录网页网站来自的国家以及站点类型检索途径的基矗目前在虚拟图书馆理论中,
16、已有不少选择了该著录事项,并提供了相应的检索途径,如虚拟图书馆中Agriulture(农业)专题中的Database类。(6)分类号。它是虚拟图书馆提供分类检索途径的前提。在进展分类之前,需要编制一个专用的分类表,不同专题的虚拟图书馆所编制的专用分类表有所不同。目前在虚拟图书馆理论中,有些编制的分类表比拟简单,如清华大学虚拟图书馆的几乎所有专题的分类表都设置有组织机构、研究人员、电子出版物、软件、电子通告、特殊问题、其它地址等类目,并且只有这些一级类目,没有设置二级类目。有些虚拟图书馆的分类表比拟复杂,如虚拟图书馆中heistry(化学)专题的一级类目就有11个,每一个一级类目都设置有二级类目。还有些虚拟图书馆设置了三级类目。至于分类方法,目前所有的虚拟图书馆都采用人工分类。2.网页、网站的序化著录后的信息进入中央数据库,由计算机软件对其进展转换、排序,以适应检索软件的需要。五、虚拟图书馆的实化虚拟图书馆的出现是为了适应人们对网络检索效率的进步而产生的,它可以只为一个团体效劳,也可以提供应广阔网络用户。为了进步网络效率、适应网络信息不稳定的和