计算机检索的原理与步骤

上传人:人*** 文档编号:576067271 上传时间:2024-08-19 格式:PPT 页数:33 大小:354.97KB
返回 下载 相关 举报
计算机检索的原理与步骤_第1页
第1页 / 共33页
计算机检索的原理与步骤_第2页
第2页 / 共33页
计算机检索的原理与步骤_第3页
第3页 / 共33页
计算机检索的原理与步骤_第4页
第4页 / 共33页
计算机检索的原理与步骤_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《计算机检索的原理与步骤》由会员分享,可在线阅读,更多相关《计算机检索的原理与步骤(33页珍藏版)》请在金锄头文库上搜索。

1、计算机检索的原理与步骤主讲人:董宁介绍内容:介绍内容:n计算机检索概念和发展历程n计算机检索的基本概念n计算机检索的基本技术n计算机检索步骤n计算机检索的发展趋势n10计算机检索概念和发展历程计算机检索概念和发展历程n11计算机检索概念计算机检索概念计算机检索:是通过计算机(单机、网络)可以查找、利用各种信息资源。包括图书馆的公共书目(-PublicAccessCatalogue)、各种联机数据库、Internet上的信息资源等。n1.2计算机检索的发展历程计算机检索的发展历程脱机检索联机检索国际联机检索单机光盘检索光盘网络检索Web信息资源检索n1.脱机检索脱机检索(50年代末年代末60年代

2、中期年代中期)n这时是计算机检索的原始时期。n只能进行简单的检索。n为满足专业检索人员定期批量处理用户的情报要求。n用户不能立刻获得检索结果。n2.联机检索联机检索(60年代末年代末70年代初年代初)n1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。n用户可随时浏览检索结果n由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到地区的限制n3.国际联机检索国际联机检索(7

3、0年代中期年代中期)n卫星通讯技术的出现,使得联机检索系统打破了地域限制。而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。n联机检索系统进入发展的黄金时期。实现了人类情报资源的共享。n4.单机光盘检索单机光盘检索(80年代年代-)nCD-ROM技术促使计算机检索成本迅速下降(一张光盘可存贮600MB兆字节机读数据、成本价格便宜,而一张DVD光盘的容量最少可达4.7G)n5.光盘网络检索(光盘网络检索(90年代)年代)n光盘网络是一种计算机网络,如图书馆局域网n实现多用户光盘资源共享n6.Web信息资源检索(90年代末)n进入90年代后,随着网络技术的发展,尤其是互联网的迅猛

4、发展,使计算机检索进入一个崭新的时期。n检索方法更简单,检索结果更全面2.0 计算机检索的基本概念计算机检索的基本概念n2.1信息检索信息检索n广广义义:信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。n狭狭义义:仅是指从信息集合中找出所需信息的过程。相当于人们所说的信息查询。n分类:根据检索手段的不同,信息检索可分为手工检索、光盘检索、联机检索和网络检索。n2.2检索方法检索方法n检索方法(检索策略)是指根据现有的检索工具,能够省时、省力获取最佳检索效果而采用的检索顺序和途径。n包括:直接法、追溯法、综合法n2.2.1直接法(常用法)直接法(常用法)n直接

5、法是指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。n顺查法顺查法顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。例,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。n倒查法倒查法倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。n2.2.2追溯法追溯法(引文法)(引文法)追溯法是指利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。像滚雪球一样,依据文献间的引用

6、关系,获得越来越多的内容相关文献。n2.2.3综合法综合法综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。n综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。n2.3检索数据库检索数据库n2.3.1概念概念数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也

7、是信息检索的重要资料来源。n2.3.2分类分类n根据载体的不同,数据库可分为:联机数据库、光盘数据库、网络数据库n根据数据库的内容与功能不同,数据可划分为:n全文数据库(fulltextdatabase)是存储文献全文或其中的主要部分的数据库。n书目数据库(bibliographicdatabase)是以文档的形式组织起来的、提供书目信息的数据库,包括各种目录、文摘与索引数据库。n(3)图像数据库(imagedatabase)提供人们存储和检索图像及其文字说明资料的一种源数据库。n(4)交易(执行)数据库(transactionaldatabase)是指各种用于交易的数据库,如股票、房地产交易

8、数据库、中国科技成果交易数据库。(5)专利、标准、会议录数据库3.0 计算机检索的基本技术计算机检索的基本技术n3.1布尔逻辑检索布尔逻辑检索(booleanlogic)n是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。n逻辑运算符有三种:与(AND)、或(OR)、非(NOT)逻辑运算符的优先顺序为NOT、AND、OR如果要改变运算顺序需要用“()”AAND(BORC)n3.2邻近检索邻近检索又称位置运算检索。适用于两

9、个检索词以指定间隔距离或者指定的顺序出现的场合。n常用位置运算符有(w)、(n)、(s)、(f)(W)算符中的W含义为“With”。n词序不许颠倒n两词之间不许插词,只允许出现空格或连字符号n例:solar(w)energy检出solarenergyn(N)算符中的N含义为“Near”n词序可以颠倒n两词之间不许插词,只允许出现空格或连字符号n例:cross(N)sectionn可检出crosssection和sectioncrossn(S)算符中的S含义为“Sentence”n词序可以颠倒n两词必须出现在同一句子(子字段)中n(F)算符中的F含义为“Field”n两词必须出现在同一字段中n词

10、序不限n例如:npollution(F)controln可检出controlandmanagementofindustrialpollution等等。n3.3截词检索截词检索截词检索就是使计算机保留检索词中的相同词干部分,允许检索词可有一定范围的变化。截词有前方一致、后方一致和中间截词几种形式。例:n前方一致:cat?,可检索出cat,cats,catalog,categoryn后方一致:?ther,可检索出mother,fathern中间截词,只替代一个字符,允许检索词中间有若干变化。例如wom?n,检索到woman、womenn3.4字段限制检索字段限制检索(fieldlimiting)n

11、字段限定也是调整检索策略的一种重要手段。n字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。n常有的字段:篇(题)名字段TI=Title文摘字段AB=Abstract叙词字段DE=Descriptor自由词字段ID=Identified著者字段AU=Author著者机构字段CS=CorporateSource刊名字段JN=Journal出版年字段PY=publicationYear文献类型字段DT=DocumentType语种字段LA=Language分类号字段CC=Classificationn3.5括号检索括号检索(phrasesearch)

12、n用于改变运算的先后次序,括号内的运算优先进行。例:AAND(BORC)4.0 计算机检索步骤计算机检索步骤n确定检索目标n选择数据库n制定检索策略n上机检索n整理检索结果并对检索效率进行评价n确定检索目标确定检索目标n1.明确检索的目的明确用户是要查新、查参考资料还是查询论文被收录或引用情况等,以便对检索的查准、查全和时间范围的指标要求有一个大致的了解,从而制定出符合情况的检索策略。n2.课题分析对课题内容进行分析,找出核心概念和隐含概念,排除无关的概念,明确概念之间相互的逻辑关系。n选择数据库选择数据库n根据检索目标分析所确定的检索目的、涉及的学科范围和信息类型,选择合适的数据库。n具体选

13、择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标准、会议)、收录的数据学科范围、数据库的更新周期,收录文献的语种等因素。n例如,要看全文就要选用全文数据库或电子期刊;要查标准或专利就要选择标准库或专利库n制定检索策略制定检索策略n考虑运用顺查法,倒查法,追溯法,还是综合法 n上机检索上机检索n(1)输出篇数过多时n此时多数是由误检造成的,原因主要有以下几点:n1)没有对检索词进行限制。包括字段限制,时间限制,分类限制等。n2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,将概念具体化。n如:mathematicsandecono

14、micn再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“WorldTourismOrganization”(世界旅游组织)n3)对所选的检索词截词截得过短。例如,使用math?将有太多的检索结果。n(2)输出篇数过少时n此时多数是由漏检造成的,原因可能有以下几点:n1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。n例如,没有使用学名“马铃薯”而使用了俗名“土豆”n又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。n2)同义词没有充分考虑。n例如,“检索物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。5.0 计算机检索的发展趋势计算机检索的发展趋势n可视化可视化相对于纯文本,图像的表达方式生动、形象,从多角度揭示主题。n简单化简单化n多样化多样化(1)提供多媒体检索功能(2)多语种检索(3)服务多元化n个性化个性化例:Google在”MyPreference”中根据用户个人偏好对检索用语种、网站语种进行设置,还可将检索范围限制在商业网站、教育网站、政府网站等域名中。n商业化商业化网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值服务。网络检索系统已成为新的投资热点。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号