计算机检索原理自动化.ppt

上传人:新** 文档编号:568514558 上传时间:2024-07-25 格式:PPT 页数:28 大小:1.44MB
返回 下载 相关 举报
计算机检索原理自动化.ppt_第1页
第1页 / 共28页
计算机检索原理自动化.ppt_第2页
第2页 / 共28页
计算机检索原理自动化.ppt_第3页
第3页 / 共28页
计算机检索原理自动化.ppt_第4页
第4页 / 共28页
计算机检索原理自动化.ppt_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《计算机检索原理自动化.ppt》由会员分享,可在线阅读,更多相关《计算机检索原理自动化.ppt(28页珍藏版)》请在金锄头文库上搜索。

1、第三章 计算机检索原理n计算机检索概述计算机检索概述1.计算机检索的发展计算机检索的发展2.计算机检索的原理计算机检索的原理3.文献数据库简介文献数据库简介4.计算机检索中常用的运算符计算机检索中常用的运算符5.计算机检索策略的制定及调整计算机检索策略的制定及调整1.计算机检索的发展历史计算机检索的发展历史n计算机检索从产生到现在经历了计算机检索从产生到现在经历了4个阶段个阶段: (1)20世纪世纪50年代,以批量处理、脱机检索年代,以批量处理、脱机检索为特点的第一阶段(美国海军兵器中心为特点的第一阶段(美国海军兵器中心NOTS,4000条记录,条记录,“与与”,不能人机对话);不能人机对话)

2、;n(2)20世纪世纪60年代末,联机检索阶段(出现年代末,联机检索阶段(出现网络,网络,dialog,人机对话);,人机对话);n(3) 20世纪世纪70-80年代,联机检索与光盘检索年代,联机检索与光盘检索共同发展阶段;共同发展阶段; 前三阶段以文献数据库检索为主;前三阶段以文献数据库检索为主;n(4)20世纪世纪90年代,基于互连网的数据库检年代,基于互连网的数据库检索和索和Internet网上信息检索并重的第四阶段。网上信息检索并重的第四阶段。n 因特网成为重要的电子信息源因特网成为重要的电子信息源2.计算机检索的原理 计算机检索的原理就是利用计计算机检索的原理就是利用计算机将用户所提

3、出的算机将用户所提出的检索标识检索标识与检与检索系统中的索系统中的标引标识标引标识进行比较,将进行比较,将匹配的文献视为命中。匹配的文献视为命中。 n 检索标识(检索式)是检索者检索标识(检索式)是检索者根据对课题的分析,制定出的既能根据对课题的分析,制定出的既能反映课题的要求,又符合计算机检反映课题的要求,又符合计算机检索要求的检索语言,其中包括适当索要求的检索语言,其中包括适当的检索词,以及合适的逻辑算符和的检索词,以及合适的逻辑算符和位置算符。位置算符。3.文献数据库简介3.1 数据库的定义和类型数据库的定义和类型3.1.1 定义:按一定方式存储的相互关联的定义:按一定方式存储的相互关联

4、的数据集合。数据集合。 它是检索工具的一种。它是检索工具的一种。 根据根据ISO/DIS5217号标准,数据库至号标准,数据库至少要由一种文档组成。少要由一种文档组成。3.1.2 数据库类型:数据库类型:n文献目录型数据库(文献目录型数据库(bibliographic database). 也称为书目数据库或者目录也称为书目数据库或者目录数据库,是二次文献数据库,包含文摘数据库,是二次文献数据库,包含文摘数据库、题录数据库、索引数据库、各数据库、题录数据库、索引数据库、各国的国的MARC格式的图书目录。格式的图书目录。如如EI,SCIE等。等。n指南数据库(指南数据库(reference da

5、tabases).也称也称指示性数据库,其内容是关于某些机构、指示性数据库,其内容是关于某些机构、人物、出版物、项目、程序、活动等对人物、出版物、项目、程序、活动等对象的简要描述,是指引用户从其他有关象的简要描述,是指引用户从其他有关的信息源获取更详细的信息的一类数据的信息源获取更详细的信息的一类数据库。库。如中国人物数据库、如中国人物数据库、Dialog系统中系统中的邓白氏国际市场情报库的邓白氏国际市场情报库。n数值数据库(数值数据库(numeric database).又称数又称数据型数据库,此类数据库存储的均为数据型数据库,此类数据库存储的均为数据信息。据信息。如中国统计年鉴如中国统计年

6、鉴 Dialog系统中系统中的公司披露数据库的公司披露数据库。n全文型数据库(全文型数据库(full-text database)。是。是指储存的数据是文献全文或者其主要部指储存的数据是文献全文或者其主要部分是文献全文的一种数据库。分是文献全文的一种数据库。如中国期如中国期刊全文数据库,重庆维普期刊全文库刊全文数据库,重庆维普期刊全文库。3.2 数据库的构成数据库的构成 由文档、记录、字段构成。由文档、记录、字段构成。(1)文档()文档(file),若干个逻辑记录构成的,若干个逻辑记录构成的信息集合成为文挡。信息集合成为文挡。(2)记录()记录(record),记录是若干个字段组,记录是若干个

7、字段组成的文献单元。成的文献单元。(3)字段()字段(field),是文献著录的基本单,是文献著录的基本单元,用来描述文献主题内容相关的某种元,用来描述文献主题内容相关的某种属性。属性。4.4.计算机检索中常用的运算符计算机检索中常用的运算符4.1 逻辑算符逻辑算符4.1.1 逻辑逻辑“与与”。用。用“and”或者或者“ * ”表示表示,是用以组是用以组配不同的概念逻辑符号,表示配不同的概念逻辑符号,表示“and”连接的两个词连接的两个词在一个记录中必须同时出现。在一个记录中必须同时出现。 如:如:Library and ComputerLibraryComputer4.1.2 逻辑逻辑“或或

8、”。用。用“or”或或“+”表示。是用来组配表示。是用来组配相同或相近概念的逻辑算符,表示在记录中出现其一相同或相近概念的逻辑算符,表示在记录中出现其一即可作为命中。如:即可作为命中。如:fiber or fibrefiberfibre4.1.3 逻辑逻辑“非非”。在系统中用。在系统中用“not”或者或者“-”表示,表示,排除某个概念的逻辑算符排除某个概念的逻辑算符, 如:如:Patent not Japan, 表示表示检中的记录中包含检中的记录中包含Patent ,不包含,不包含Japan。 PatentJapan4.2 优先算符优先算符 优先算符用()表示,在含有多个运优先算符用()表示,

9、在含有多个运算的检索式中,可以用()将需要优先算的检索式中,可以用()将需要优先运算的部分括上,系统会优先运算()运算的部分括上,系统会优先运算()中的部分,然后在按照中的部分,然后在按照not, and, or的顺的顺序进行运算。序进行运算。 如:如:S (fiber or fibre) and optical 4.3 截词符和屏蔽符截词符和屏蔽符4.3.1. 截词符:用截词符:用“?”或者或者“*”,不同,不同数据库有不同的规定数据库有不同的规定4.3.2 屏蔽符:屏蔽符:“?”作为屏蔽符,加在单作为屏蔽符,加在单词中间,可以代表词中间,可以代表1个字符的变化。如:个字符的变化。如:wom

10、?n, 表示表示women和和woman。词中使。词中使用几个屏蔽符,则代表有几个字符的变用几个屏蔽符,则代表有几个字符的变化。有的数据库使用化。有的数据库使用“#”n4.4 位置算符位置算符n位置算符是用来规定检索词之间的位置位置算符是用来规定检索词之间的位置关系的算符关系的算符:n4.4.1.(w), (nW), 意思是意思是with, 表示它连表示它连结的两个词前后位置确定,中间插词不结的两个词前后位置确定,中间插词不能超过能超过0-n个。个。 (w)也写作()也写作(),实际上实际上是是 (0W),表示连接的两个词必须紧密相,表示连接的两个词必须紧密相连,中间不能插词,但是中间可以加连

11、连,中间不能插词,但是中间可以加连字符。如:字符。如:S motor (W)lorry, 可以检出可以检出motor-lorry和和motor lorry。n4.4.2. (N), (nN), 意思是意思是near,表示它连结表示它连结的两个词前后次序不限,中间可以插入的两个词前后次序不限,中间可以插入n个词。(个词。(N)实际上是()实际上是(0N),表示连),表示连结的两个词中间不得插入其他词。如:结的两个词中间不得插入其他词。如:S corrosion (N)resist?可以检索出可以检索出 corrosion resistance; corrosion resistant; resi

12、sting corrosion ; S protect?(2N)forest 可以检出可以检出protection of forest, forest protection, protecting the forest 等。等。 4.4.3 (S),意思是),意思是subfield或或sentence, 它表示连结的两个检索词要在同一个子它表示连结的两个检索词要在同一个子字段或同一句话中出现。如:字段或同一句话中出现。如:S computer (s) library是要求是要求computer 和和 library在同一个句子中出现在同一个句子中出现S cs=wuhan (s)universi

13、ty 是要求是要求wuhan和和 university在在cs字段中的字段中的同一个子字段出现。同一个子字段出现。4.4.4(F),意思是),意思是field,表示连结的两个表示连结的两个词要在同一个字段中出现。如:词要在同一个字段中出现。如:S fieldbus (f)multimedia是要求是要求fieldbus 和和 multimedia在同一个字段中出现。在同一个字段中出现。 以上是计算机中常用的位置算符以上是计算机中常用的位置算符,但并非但并非所有的系统都可用所有的系统都可用,不同的检索系统有其自己不同的检索系统有其自己的规定。的规定。5.计算机检索策略的制定及调整计算机检索策略的

14、制定及调整1. 概念的选取概念的选取 (1)核心概念的选取)核心概念的选取: 变温变温条件下煤层煤层损伤与瓦斯瓦斯运移的热流固热流固耦合模型模型 (2)发掘隐含概念)发掘隐含概念: 并购并购剥离、拍卖;石质文物的保护剥离、拍卖;石质文物的保护 (3)考虑同义词:)考虑同义词:保护保护conservation, preservation,protection (4)使用规范的用语)使用规范的用语:行业术语,用词表来规范:行业术语,用词表来规范:单车单车-自行车自行车 (5)排除不必要的概念:使用专业数据库或通用词)排除不必要的概念:使用专业数据库或通用词 (6)使用准确的代码:标准号、专利号、产

15、品代码)使用准确的代码:标准号、专利号、产品代码2. 数据库的选择数据库的选择 (1)合适的主题范畴)合适的主题范畴 (社科、工程技术、化学、医学(社科、工程技术、化学、医学)(2)合适的数据库类型、年度范围(专利、标准、期刊、书)合适的数据库类型、年度范围(专利、标准、期刊、书 )3. 检索策略的制定及调整检索策略的制定及调整 (1 1)拟定检索式:)拟定检索式:变温变温条件下煤层煤层损伤与瓦斯瓦斯运移的热流固耦合模型模型 (非等温(非等温 or 变温)变温)and (煤层(煤层 and (损伤损伤 or 破坏破坏 or 损坏损坏) or 煤岩体煤岩体 and 损伤损伤) and (瓦斯(瓦

16、斯 or 煤层气煤层气 or 煤气)煤气) and (运移(运移 or 漂移漂移 or 运运动)动)and 热流固热流固 (2 2)如果检索结果太少,适当调整策略,以扩大检索范围(增加同义)如果检索结果太少,适当调整策略,以扩大检索范围(增加同义词或隐含概念)词或隐含概念)a.a.热流固有没有同义词热流固有没有同义词 热热- -流流- -固;固;b.b.去掉去掉热流固热流固; c.c.去掉第一个检索词去掉第一个检索词(非等温(非等温 or 变温)变温) (3 3)如果检索结果太多,也要适当调整策略,以缩小)如果检索结果太多,也要适当调整策略,以缩小检索范围(增加检索范围(增加概念或用字段、年代

17、等限制、增加检索词)。概念或用字段、年代等限制、增加检索词)。 (非等温(非等温 or 变温)变温)and 煤层煤层 /主题主题 and (损伤损伤 or 破坏破坏 or 损坏)损坏)and (瓦(瓦斯斯 or 煤层气)煤层气) /主题主题 and (运移(运移 or 漂移漂移 or 运动)运动)and 热流固热流固 and ( 耦合模型耦合模型 or 数学模型数学模型) 第一检索式结果为0去掉热流固还是0再去掉(变温+非等温)条件:47条。可以在这里选择再检索(变温+非等温)*(煤层+煤岩体)*(瓦斯+煤层气+煤气):18条再去掉煤层:(等温+非等温) *(瓦斯 or 煤层气 or 煤气):63条,也可以在老师的委托单中提到:煤基质收缩效应(4条)、滑脱效应,分别检索一下在老师的委托单中提到:煤基质收缩效应、滑脱效应(169条),分别检索一下

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号