《最新北京大学化学信息学第四讲电子资源PPT课件》由会员分享,可在线阅读,更多相关《最新北京大学化学信息学第四讲电子资源PPT课件(26页珍藏版)》请在金锄头文库上搜索。
1、北京大学化学信息学第四北京大学化学信息学第四讲电子资源讲电子资源1.电子资源传统上也称为电子出版物,指一切以电子方式或机读方式生产和发行的信息资源。电子资源中的信息,包括文字、图片、声音、动态图像等,都是以数字代码方式存储在磁带、磁盘、光盘等介质上,通过计算机输出设备和网络传送出去,最终显示在用户的计算机终端上。21电子资源检索系统电子资源检索系统:由硬件、软件、数据库三部分组成。硬硬件件:大型计算机主机、服务器、存储器(硬盘或光盘)、通讯网络、计算机终端等。软软件件:数据库系统管理软件、检索软件。包括:信息采集、信息标引加工、建库、词表管理、用户检索界面、提问处理、网络发布等模块。数数据据库
2、库:按一定方式存储的相互关联的数据集合。由于数据库中的信息都经过了详细、精心的选择和加工,主题化,有序,能够提供多种检索途径,因此相对互联网上无组织和大量无用的信息来说,检索结果准确,价值高。按按设设备备和和检检索索方方式式划划分分检检索索系系统统类类型型:联联机机数数据据库库检检索索系统、光盘数据库检索系统、网络数据库检索系统。系统、光盘数据库检索系统、网络数据库检索系统。22 联机数据库检索联机数据库检索联机检索(onlineretrieval)是指用户利用计算机终端设备,通过通信线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程。检索终端通讯网络中央计算机数据库联机检索中心外设
3、联机检索系统的网络结构联机检索系统的特点是:联机检索系统的特点是:l数据库数量多,信息量大。l数据库更新快。l数据库和系统集中式管理,安全性好,可以在存储设备上直接处理大量数据,但主机的负担重,网络扩展性差。l检索模式:主仆式,即所有的工作都在主机上进行。l信息组织模式:普通线性文本。l检索机制:检索功能强,索引多,所有的数据库使用统一的命令检索,必须由专业人员检索。l系统连接需通过通讯线路或网络进行,需支付通讯费用。l检索费用贵。l检索界面单一,过于呆板。现有的联机数据库检索系统:Dialog,STN,LEXIS-NEXIS,2.3 光盘数据库检索光盘数据库检索光盘数据库通常是指CD-ROM
4、数据库。CD-ROM(CompactDiscRead-onlyMemory),意为只读光盘,轻便、灵活、体积小、容量大,一张只读光盘的最大存储量为600M,可存储文字、图片、图像、声音等。客户端光盘服务器系统软件光盘驱动器客户端客户端数据库光盘检索数据库检索光盘检索数据库检索联机光盘检索系统特点:l数据库数量没有联机检索多。l数据库更新速度慢,一般为月更新或季更新。l数据库和系统集中式管理,负担重,数据库和用户越多,响应时间越长。l检索模式:客户端/服务器,客户方运做在微机上进行、l信息组织模式:普通线性文本。l检索机制:检索功能强,索引多,不同的检索系统使用不同的检索命令,具备命令检索和菜单
5、检索两种方式,后者对非专业人员来说,易学易用。l系统访问通过局域网就可以进行,不需支付通讯费用。l检索环境宽松,检索费用低。用户界面比较友好。 2.4 网络数据库检索网络数据库检索网络数据库(web-database)检索是指用户在自己的客户端上,通过互联网和统一的浏览器界面对数据库进行检索,这一类检索系统都是基于互联网的分布式特点开发和应用的,即数据库分布式存储,不同的数据库分散在不同的服务器上:用户分布式检索,任何地方的终端都可以访问并存储数据:数据分布式处理,任何数据都可以在网上的任何地点进行处理。网络数据库检索系统特点:l数据库数量多,信息量大,同时提供了其它服务项,如有关的动态信息、
6、统计数字、相关站点的链接等。l数据库更新速度快,一般为日更新。l数据库和系统分布式管理,响应快。l检索模式:客户端服务器方式,客户方运做在微机上进行,分析从服务器上返回的数据,给用户显示信息;服务方则给用户提供客户端应用程序,分析处理各类请求,并提供数据服务。l应用程序与数据隔离,数据相对独立、完整、安全性好:但对客户方来说,由于访问是通过互联网进行的,安全性较差。l信息组织模式:超文本。l检索机制:检索功能强,索引多,不同的检索系统使用不同的检索命令,通过WWW浏览器提供检索,对非专业人员来说,易学易用。l系统访问通过互联网进行,需支付少量通讯费用。l检索环境宽松,检索费用较联机检索低,但高
7、于光盘检索。l用户界面基于WWW浏览器开发,方便友好。25 检索语言检索语言检索语言(informationretrievallanguage),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。所谓检索的运算匹配就是通过检索语言的匹配来实现的。检索语言是人与检索系统对话的基础。人工语言(artificiallanguage)是根据信息检索的需要而由人工创制的,采用规范词(controlledterm),由人工控制,包括分类检索语言(分类号)和主题检索语言。自然语言(naturallanguage)检索用词是从文献本身抽取的,是非规范词(uncontrolledterm)
8、,它的标识包括关键词、题名、摘要、全文等。3.电子资源的检索方法与技术3.1 检索方法检索方法对检索课题进行分析:明确课题的主题或主要内容:课题涉及的学科范围:所需信息的数量、语种、年代范围、类型、作者等。制定检索策略:选择相关数据库,特别要注意数据库是否与上述分析相吻合32 检索技术检索技术321布尔逻辑检索布尔逻辑检索:即运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。 逻辑与and:检索时,命中信息同时含有两个概念,专指性强; 逻辑或or:检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围加大了; 逻辑非not:命中
9、信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词; 逻辑异或xor:命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。ABABAandBAorBABAnotBABAxorB322位置算符检索 即运用位置算符(position operators)表示两个检索词间的位置邻近关系,又叫邻接检 索。这种检索技术通常只出现在西文数据库中。 常用的位置算符有:(W)、(nW)、(N)、(nN)、(F)、Same3.2.3截词检索(truncation) 用截词符号“ ?”、“ *”或“ $”加在检索词的前后或中间,以检索一组概念相关的词。中文数据库通常不使用这种技术。
10、后截断,又称右截断:chromatograph*,可检chromatography、chromatographic、chromatographer. 前 截 断 , 又 称 左 截 断 : *magnetic, 可 检electro-magnetic、electromagnetic、thermomagnetic、thermomagnetic中 截 断 : 如 organi?ation, 可 见 organisation、orgamzatlon。也有一种说法,把中截断叫做通配符(wildcard),原理、用法大致同。3.2.4 字段限制检索 AB Abstracts 文摘 AU Author 作者 CS Corporate Source 机构名称 DE Descriptor 叙词 DT Document type 文献类型 FT Full-text 全文 JN Journal name 期刊名称 KW Keyword 关键词 LA Language 语言 PY Publication year出版年 SU Subject 主题 TI Title 题名结束语结束语谢谢大家聆听!谢谢大家聆听!26