布尔检索技术实验

上传人:kms****20 文档编号:40283087 上传时间:2018-05-25 格式:DOC 页数:22 大小:1.86MB
返回 下载 相关 举报
布尔检索技术实验_第1页
第1页 / 共22页
布尔检索技术实验_第2页
第2页 / 共22页
布尔检索技术实验_第3页
第3页 / 共22页
布尔检索技术实验_第4页
第4页 / 共22页
布尔检索技术实验_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《布尔检索技术实验》由会员分享,可在线阅读,更多相关《布尔检索技术实验(22页珍藏版)》请在金锄头文库上搜索。

1、布尔检索技术实验报告布尔检索技术实验报告班级:班级:信息管理与信息系统 姓名:姓名:* 学号学号:*实习时间:实习时间:2011 年 10 月 25 日地点地点:学校机房检索课题:检索课题: ERP Enterprise resource planning检索目标文章:检索目标文章:An IT governance framework of ERP system implementation for Chinese enterprises检索系统及数据库:检索系统及数据库:engineering village 一、一、 实验目的及要求实验目的及要求学习掌握计算机检索的基本步骤,并通过对检索结

2、果的分析,对检索系统分析与评价。二、数据库介绍二、数据库介绍在本次检索实验中,我所使用的数据库是外文数据库 EI Compendex。Ei 创办于 1884 年 10 月,由美国工程信息公司主办。EI 网络版由光盘版和网络扩展版合并为而成,是目前全球最全面的工程类二次文献数据库。该数据库每年新增 500000 条工程类文献,数据来自 5100 种工程类期刊、会议论文和技术报告, (包括 90 年代 以后新增的 2500 种文献来源) 收录的每篇文献都包括书目信息和一个简短的文摘。囊括世界范围内工程的各个分支学科,如:土木工程、能源、环境、地理和生物工程;电气、电子和控制工 程;化学、矿业、金属

3、和燃料工程;机械、自动化、核能和航空工程;计算机、人工智 能和工 业机器人。化工和工艺的期刊文献最多, (约占 15%) ,计算机和数据处理占 12%,应用物理占 11%,电子和通信占 12%,另外还有土木工程(占 6%)和机械工程(占 6%)等。大约 22%的 数据是有主题词和摘要的会议论文,90%的文献是英文文献。数据库每周更新,目前可以检索到 1970 年以来的数据,对检索全世界范围内工程与技术文献,跟踪与评价技术新成果非常有用。三实验内容三实验内容课题的内容分析,检索词的选择,检索式的编制。检索过程的详细描述,检索的具体步骤,各个检索词的检索结果,要求使用各种不同的布尔逻辑算符、位置算

4、符、截词符和字段限制进行比较检索。对检索结果的输出方式、格式及排序方式的比较。四、实验步骤四、实验步骤 布尔检索布尔检索一、一、 AND1、 首先进入检索页面,选择快速检索。在检索框输入 ERP,时间选择 20002011,检索结果如下:有 4108 条记录,要找到我所需的文章犹如大海捞针。2、 返回检索页面,在检索框中输入 ERP, 在第一个 AND 链接后输入Chinese enterprises,为缩小范围,比便更快的检索到所需文章,此处限制为 subject/title/ abstract,时间仍然限制在 2000-2011 年。 (下同)检索结果如下:此时检索出 73 篇文章,大大减

5、少了查找量,而检索结果中第 3 条即我所需文章。3、返回检索页,在第 2 个 AND 后输入 IT,再次进行检索,检索结果入下:检索结果有 46 条,而第 1 条就是我所需文章。二、OR1、进入检索页,在检索框中输入 ERP,在第 1 个 OR 后输入Chinese enterprises 进行检索。检索结果如下:检索结果有 5631 条,但第 2 条即是我所需文章。2、返回检索页面,在第 2 个 OR 后面输入 IT,再次进行检索。检索结果如下:检索结果多大2738073 条,很难再找到我所需要的文章。三、NOT返回检索页面,在第一个 AND 后输入 Chinese enterprise.在

6、NOT 后输入 IT。检索结果如下:有 72 条检索结果。 第 32 条即使我所需文章。 邻近检索邻近检索 (proximity search) 在检索框输入 IT ONEAR/n ERP检索结果如下:有 186 条检索结果。第 5 条即是我所需文章。截词检索截词检索1、有人工检索,有自动检索。检索结果如下:有 294 条检索结果。第 5 条即是我所要文章。2、有人工检索,无自动检索。检索结果如下:有 296 条检索结果。第 5 条即是我所需文章。 限制检索限制检索输入关键字和限制字符,进行检索。检索结果如下:检索结果只有 9 条,而第一条就是我所需文章。五、实验结果与结论五、实验结果与结论通

7、过这次的实验学习,我获得了很大的收获。从对信息检索完全不懂,一头雾水到现在慢慢知道,了解,理解。首先,对首先,对EI数据库有一定的了解,具体如下:数据库有一定的了解,具体如下:、数据库的范围上Ei创办于1884年10月,由美国工程信息公司主办。EI网络版由光盘版和网络扩展版合并为而成,是目前全球最全面的工程类二次文献数据库。数据库涵盖工程和应用科学领域的各学科,涉及核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等。还选择收录一些与工程和应用科学有关的专业,但不收

8、录纯理论方面的文献。可检索1969至今的Ei Compendex数据和1990至今的PageOne 数据。数据库每周更新。该数据库似乎对浏览器有一定的选择,用搜狗浏览器进不去,用IE则可行。二、数据库的检索方法上1简易检索(easy search):是非常简单的关键词检索,将关键词输入检索框,点Search即可,没有其它限制。可以跨库检索。2快速检索(quick search):可以进行复杂检索,使用布尔检索中AND,OR,NOT等,可以限制检索字段、文件类型、处理类型;可以自动截词,也可人工截词。限定时间范围,选择检索范围,选择排序方式等。3. 高级检索:提供更强大而灵活的功能, 用户可以使

9、用更复杂的布尔逻辑算符、位置算符、截词符等,有更多的检索项选择,系统严格按检索式进行检索。3、专业检索(expert search):三、检索技术:1布尔检索:使用算符有: and、or、not 2邻位检索:用NERA算符,ONEAR算符。nN,nW等算符。EI还提供了短语检索:相关短语检索: 输入的短语不加任何括号或引号;精确短语检索: 在输入的短语加上大括号 或引号“ ”。3截词检索:一种是在单词的适当位置加截词符 * 和 ?,另一种是系统默认自动取词根,点击 “Autostemming off”则可关闭此功能 。读者可根据自己的需要自己选择。4限制检索:限制检索是将检索词限制在特定的范围

10、内,有:字段、文献类型、 语种以及年代等第二,在实验过程中,通过不断所练习布尔检索,使第二,在实验过程中,通过不断所练习布尔检索,使用各种不同的布尔逻辑算符、位置算符、截词符和字用各种不同的布尔逻辑算符、位置算符、截词符和字段限制进行比较检索,发现检索结果的输出方式、格段限制进行比较检索,发现检索结果的输出方式、格式及排序方式各不相同式及排序方式各不相同文章的检索页面的排序方式有两种:relevance 和publication year .进入检索结果页面时,则有5种可选择的排列方式,分别是relevance ,data ,author ,source ,publisher.检索结果最初都是

11、默认为相关性(relevance)的方式进行排序。在AND和OR检索时,检索结果是明显不同的,OR检索出来的结果更为丰富,范围更广,而AND检索的结果更准确一些。OR提高了查全率,而AND则提高了查准率,所以,OR适用于目的性不太强的检索,而AND则适用于目的性较强的检索。截词检索也相当于扩大了检索范围,因为词的匹配范围更大了,检索出了更丰富的结果,提高了查全率。限制检索则更加精准,通过一定的限制,提高了查准率。 第三,对传统信息检索技术及系统有了一定的认识。第三,对传统信息检索技术及系统有了一定的认识。信息检索技术主要有4个阶段:初级阶段,手工阶段,计算机检索阶段,网络检索时代。传统信息检索

12、是指手工信息检索,而现代信息检索包括计算信息检索和网络信息检索。传统信息检索是利用各种专门用于检索的印刷出版物,即常说的检索工具来查找所需信息的手段。其检索方法主要有直接检索和间接检索。直接检索这是人们最常用的一种查找信息的方法, 如去图书馆查阅各种图书、期刊及其他资料, 找到需要的信息, 需花大量的时间和精力, 在过去文献较少时,还能达到目的, 而在信息大量产生的年代里犹如大海捞针。间接检索就是利用各种检索工具获取线索, 再根据线索来查找原始文献信息的方法, 也就是手工检索。间接检索还分为追溯法通过已知文献所附的参考文献, “ 由一变十, 由十变百” 地进行追溯查找有关信息。还可以利用各种“

13、 引文索引” 等工具进行追溯检索。工具法利用各种检索工具文摘、题录、目录等进行查找文献, 是文献检索最常用的方法。 传统信息检索与现代倍息检索的比较:检索语言-检索语言就是检索信息时所使用的语言词汇, 在检索语言上, 手工检索与计算机检索基本相同, 不同的是计算机检索可以使用较多的自然语言,网上检索一般使用自然语言。检索概念的组配-手工检索主要是以人脑进行检索概念的组配, 而计算机检索则是用布尔逻辑、位置逻辑等逻辑算符进行概念组配, 网上检索概念组配方式尚不成熟。其中计算机检索的概念组配最为严谨, 手工检索的概念组配最灵活。检索途径-检索途径也就是检索入口是根据信息的某种特征所进行的检索,手工

14、检索与计算机检索的基本检索途径是相同的,如著者、分类、主题等。但计算机检索的检索途径要更加广泛和灵活, 可以从年代、题目、文摘、语种等途径进行检索, 并能进行多途径同时检索。检索结果相比则是, 手工检索的结果准确率最高, 误检率最低, 查全率较低。计算机的查准率要低于手工检索, 误检率要高于手工检索, 查全率较高。网络检索结果误检率最高, 查全率也较高,查准率较低。信息内容范围不同-传统的信息检索主要以检索文献信息为主。如现代信息检索的信息则不再以文献信息为主, 其范围很大,网上的信息是全世界最大的信息阵,信息资源分布在整个网络中, 没有统一的组织和管理, 也没有统一的目录。许多希望和他人进行信息共享的机构和个人将自己的信息以有偿或无偿方式通过网络对外提供。信息质量及可靠性不同-传统的文献信息, 如各种书刊、报纸、广告、专利、标准等。基本上是经过专业编辑人员审核、筛选、加工后才问世的, 检索出的信息比较可靠, 质量也较高。网络上的信息, 质量参差不齐, 可靠性较差。包括各种生活信息, 公用软件、事实和数据信息等, 并对外开放, 任何人都可以查询利用。参考文献:传统信息检索与现代信息检索的比较研究 来源:维普数据库。以下是我所需文章全文的部分截图以下是我所需文章全文的部分截图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号