文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2

上传人:E**** 文档编号:89245389 上传时间:2019-05-22 格式:PPT 页数:35 大小:195.51KB
返回 下载 相关 举报
文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2_第1页
第1页 / 共35页
文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2_第2页
第2页 / 共35页
文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2_第3页
第3页 / 共35页
文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2_第4页
第4页 / 共35页
文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2》由会员分享,可在线阅读,更多相关《文献信息检索教程 第2版 教学课件 ppt 作者 刘富霞第4章 4-2(35页珍藏版)》请在金锄头文库上搜索。

1、4.2 网络信息资源检索,4.2.1 网络信息资源检索的一般方法 4.2.2 网络信息检索技术 4.2.3 网络信息资源检索工具及检索途径 小结 作业,4.2 网络信息资源检索,4.2.1 网络信息资源检索的一般方法 用户在网上获取信息,一般有以下几种检索方法: 1)浏览。用户在网络上随意地浏览,将一些意外发现的有 用信息的网站地址,主要是一些网上期刊、数据库以及信息机 构等的网址记录下来,进而获取网络资源,这是一种日常URL、 (网址)进行积累的方法。 2)通过网络资源指南查找信息。是指利用由专业人员开发出来的网络资源主题指南来检索信息的办法。 如hao123 ,建于1999年5月,前名是“

2、精彩实用网址”, 后来改名为“Hao123网址之家”, hao123互联网网址导航的 第一品牌,千万用户上网的第一站。,4.2 网络信息资源检索,4.2.1 网络信息资源检索的一般方法 3)利用网络信息检索工具查找信息。网络信息检索工具, 为网上查询信息提供了诸多途径。查询不同类型的资源要使用不 同类型的检索工具。 网络信息检索工具-搜索引擎。如:如Yahoo!、Google 、 baidu等,专用的图片搜索、音乐搜索等。,无论是网络检索,还是数据库检索,都需要掌握一定的检索技术 -网络信息检索技术,4.2 网络信息资源检索,4.2.2 网络信息检索技术 1. 布尔逻辑检索技术 1) 布尔逻辑

3、检索是建立最早的检索理论,也是检索系统中应用最广泛的检索技术。它通过对布尔逻辑运算符进行组配,形成检索式,以表达用户的检索需求,并通过一定的算法和手段进行检索 2) 布尔逻辑运算符的三种形式: 逻辑与(AND) 逻辑或(OR) 逻辑非(NOT),4.2 网络信息资源检索,4.2.2 网络信息检索技术 1. 布尔逻辑检索技术 逻辑“与”:与、AND、* 用于概念交叉和限定。起缩小检索范围和提高文献查准率的 作用。 例 Solar*Energy 逻辑“非”:或、OR、 用于概念之间并列关系的组配。增加主题的同义词, 以扩大检索范围,避免文献漏检。 例 www + internet + networ

4、k 逻辑“或”:非、NOT、 从原检索范围中剔除一部分不需要的内容。 例 EnergyNuclear 除核能以外的有关能源方面的文献才被命中。,4.2 网络信息资源检索,4.2.2 网络信息检索技术 1. 布尔逻辑检索技术 3) 布尔逻辑关系的图示表示:,4.2 网络信息资源检索,4.2.2 网络信息检索技术 1. 布尔逻辑检索技术 3) 布尔逻辑关系度构建检索式 举例: 例如:查找“细菌对染料破坏”方面的文献. 检索词:细菌、破坏、染料 逻辑“与”组配检索式:细菌AND破坏AND染料. 检索结果:命中同时用这三个词标引的文献. 有“细菌对染料的破坏”方面的文献. 也会有“染料对细菌的破坏”方

5、面的文献. 布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。,& 要排除后一部分的文献,就需用一种符号位置算符,限定词与词之间的位置关系。,4.2 网络信息资源检索,2位置算符 位置算符表示连接的两个检索词之间的位置关系,常用的有(W)、(nW)、(N)、(nN)、(S)、(F)、(P)。 (1)(W)或()算符:是“With”的缩写,表示两个检索词词序不许颠倒,两词之间不许插词,只许空格或连字符号。 例:检索式为CD(W)ROM 时,将命中 CD ROM 或 CD-ROM; (nW)算符:是“n words”的缩写,

6、检索词之间允许插入0n个词,词序不许颠倒。例:anticorrosion (1W) paint 可检出 anticorrosion paint 和 anticorrosion of paint。,4.2 网络信息资源检索,2位置算符 (2)(N)算符:是“Near”的缩写,表示其连接的两个检索词的顺序可以颠倒,但两词之间不许插词, 例cross (N)section 可检出 cross section 和 section cross。 (nN)算符是从(N)算符引伸出来,检索词之间允许插入0n个词,词序可以颠倒。 (3)(F)算符:是“Field”的缩写,表示其连接的两个检索词必须在同一字段内

7、,词序及两词间插入的词数不限。 例: digital(F)computer。 (4)(S)算符:“Sentence”和“ Sub-field”的缩写,算符两侧的检索词必须在同一句子,词序及两词间插入的词数不限。,4.2 网络信息资源检索,2位置算符 (5)(P)算符:“paragraph” 的缩写,检索式为A(P)B,表示两个概念A、B必须同时在同一自然段中出现。例如:environment(P)protection。,上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式的,因此,应将限制最严的算符放在最左边。,4.2 网络信息资源检索,3截词符 截词是指检索者将检索

8、词在他认为合适的地方截断。截词检索是指使用截词的一个局部进行检索的一种方法。即凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。 按截断的位置来分,分前截断、后截断、中截断3种类型 截词符可分别用?、* 等来表示。 截词检索分为有限截词和无限截词,有限截词:一个截词符只代表一个字符,无限截词:一个截词符可代表多个字符。,4.2 网络信息资源检索,3截词符 (1)后截断:后截断有无限截断和有限截断两种。 无限截断是在一个词尾加一个“?”,表示在其后可增加任意多个字符,这些词都被作为检索词进行检索。 如:com?,它将对若干个词进行检索,包括:come、computer、computers

9、、computimv.; 有限截断是在词尾加有限个“?”,n个“?”号表示其后可添加的字符少于等于n个。 如:Smok?,它将对Smoke、Smoked、Smoker等进行检索。,4.2 网络信息资源检索,3截词符 (2)前截断:前截断与后截断相反,将截词符放在一个词的前面,以表示其右边不管截去有限或无限个字符,只要数据库中具有与截词符号后面部分字符串相同的检索词的信息,即为命中信息。 如:?computer ,它将对macrocomputer, minicomputer, microcomputer等进行检索。 (3)中截断:中截断只允许有限截断,是指在一个词中间有若干个“?”号,表示可插入

10、若干个字符。 如:analy?er,它将对analyzer,analyser等进行检索。,4.2 网络信息资源检索,4限制检索 限制检索就是对检索词范围(时间、国别、语种、信息类型等)进行约束或限定的方法,它大多通过检索系统的限制符号或限制命令来实现。,5全文检索技术 全文检索是对文献全文内容进行的字符串的匹配检索,包 括字符串检索、截词检索、位置检索、同义词控制以及后控词 表等技术。全文检索技术使用原文中任何一个有实际意义的词 作为检索入口,而且得到的检索结果是源文献而不是文献的线 索。 典型代表:google搜索引擎,4.2 网络信息资源检索,4.2 网络信息资源检索,6构造检索式 检索式

11、是检索策略的具体表达,是将表达主体内容的检索词之间的逻辑关系、位置关系等用检索系统规定的各种算符连接起来,成为计算机可识别和执行的命令形式。 检索式一般分为简单检索式和复合检索式。 简单检索式是指单独使用一个检索词所进行的检索; 复合检索式是指将两个或两个以上的检索词用各种逻辑运算符、位置运算符及系统认可的其他符号组配起来的表达式。在计算机检索中,广泛使用复合检索式,以提高检索效率。,4.2 网络信息资源检索,构造检索式分两个步骤: (1)选择检索词:是计算机检索成败的关键。因此,在执行检 索前需从课题的名称及其描述出发,认真分析,提取供检索使用 的词或词组,再对这些词或词组进行规范处理,如删

12、除多余的修 饰成分,最终使得检索使用的词成为最能概括主题概念的、最精 炼的检索词。 如课题“CAD在机械制造中的应用”,通过分析“CAD”和 “机械制造”为最能概括主题概念的、最精炼的检索词。 (2)组配检索词:利用各种运算符对所选择的检索词进行组 配,提高其查准率。,注意:在不同的检索系统,提供使用的运算符不同,不是每个检索系统均支持所有运算符的组配。检索者在组配检索式之前,需先通过每个系统所提供的检索帮助了解各系统支持的运算符。,4.2 网络信息资源检索,7加权检索 加权检索是根据用户的检索需求来确定检索词,再由每个词在检索要求中的重要程度不同,分别给予一定的数值(权数)加以区别。但加权检

13、索除了要求检索到的记录含有检索词,还要根据已检出的记录中所包含的检索词对检索要求的重要程度来确定检索到的结果。因此,加权检索不仅含有定性检索的性质,其特点更表现在定量方面。 目前流行的加权方法有词加权、词频加权和法定数检索等。,4.2 网络信息资源检索,7加权检索 (1)词加权检索:是最常见的加权检索方法。在检索式的构造过程中,检索者根据检索需求,选定检索词,同时给定每一个检索词(概念)一个数值(权数)表示其针对本次检索的重要性程度。 (2)词频加权检索:是根据检索词在记录中出现的频次来决定该检索词的权值,而不是由检索者指定检索词的权值。该法消除了人工干预因素,但这种加权检索方式必须建立在全文

14、或文摘型数据库基础之上,否则词频加权将没有意义。,4.2 网络信息资源检索,7加权检索 (3)法定数检索:也称“数值逼近检索”。它是加权检索的一种特例,其过程实际上是自动构造布尔提问式和不断修正提问式的过程。 如有检索词A,B,C,D,E(权重序列为:A B C D E)。构成提问式:A*B*C*D*E。将此提问式用于检索后将得到较小的文献量(或为零)。达不到用户指定文献量,便舍去权重最小的检索词,如A。再用修改后的提问式(如B*C*D*E)检索,命中的文献数将会增加,如仍达不到用户指定文献量则再舍去权重最小的检索词,如B。再用修改后的提问式(如C*D*E)再检索。直到达到或接近用户指定的文献

15、量。,法定数检索:通过放宽布尔逻辑限定条件的方法调整提问式,使检索出的文献量逐步从无到有,或从少到多,使布尔逻辑检索具有灵活性。,4.2 网络信息资源检索,4.2.3 网络信息资源检索工具及检索途径 1网络信息资源检索工具搜索引擎 (1)搜索引擎概述:搜索引擎是以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。 调查显示,现有的网民使用搜索引擎,并把他们当作健康、理财、工作、生活等各方面的“决策顾问”。,4.2 网络信息资源检索,1网络信息资源检索工具搜索引擎 (2)搜索引擎的工作原理:搜索引擎的工作主要由两部分组成:信息搜集

16、处理和信息检索输出。 1)信息的搜集处理。搜索引擎的一个重要工作就是定期搜集信息,并对搜集来的信息进行整理加工,添加至该搜索引擎所指向的数据库。 2)信息的检索输出。对搜集的信息进行分析、标引、加工处理后,形成可供用户检索的数据库,并以Web形式提供用户检索。用户根据个人需求,结合检索系统条件,选择适当的检索方式、语言提出检索需求,检索软件在接受用户检索需求后,由系统对该需求进行分析,并在数据库中检索出与之对应的结果,按相关度排序后返回给用户。,4.2 网络信息资源检索,(3)搜索引擎的分类 1)按信息覆盖范围及用户群分为: 综合搜索引擎,如Yahoo! 专业(专题)搜索引擎,如查找地图信息MapBlast。 2)按搜索范围分为: 独立搜索引擎,如Yahoo!、google 元搜索引擎,如万维搜索引擎和搜星搜索引擎。 3)按其索引方式分为 目录式搜索引擎 全文(机器人)搜索引擎 分类全文搜索引擎 智能搜索引擎,4.2网络信息资源检索,(3)搜索引擎的分类 3)按其索引方式分为 目录式搜索

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号