《信息检索基本技术》ppt课件

上传人:tian****1990 文档编号:75063489 上传时间:2019-01-30 格式:PPT 页数:33 大小:758.81KB
返回 下载 相关 举报
《信息检索基本技术》ppt课件_第1页
第1页 / 共33页
《信息检索基本技术》ppt课件_第2页
第2页 / 共33页
《信息检索基本技术》ppt课件_第3页
第3页 / 共33页
《信息检索基本技术》ppt课件_第4页
第4页 / 共33页
《信息检索基本技术》ppt课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《《信息检索基本技术》ppt课件》由会员分享,可在线阅读,更多相关《《信息检索基本技术》ppt课件(33页珍藏版)》请在金锄头文库上搜索。

1、,第三章 信息检索基本技术,一、概述,从检索手段看,信息检索可分为手工检索和计算机检索。 手工检索使用的检索工具主要是印刷型(书本式)的检索工具; 计算机检索则运用现代通信技术、网络技术,利用光盘检索、联机检索、网络数据库、Internet网络检索等多种形式来获取信息。,检索手段 信息载体 存储方式 检索途径 检索策略实现 检索效率 手检 纸张 印刷型 较 少 人脑 低 机检 磁盘光盘等 电子型 较 多 计算机 高,二、 计算机检索,一)原理 计算机将输入机检系统的检索提问特征标识(检索词)或用布尔逻辑运算符(and、or、not)联结起来的检索提问式与已存储在系统中的文献特征标识(如:主题词

2、、分类号、作者姓名等)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。,二)计算机检索特点,1. 内容广泛信息量大; 2 . 速度快,效率高; 3 . 检索途径多; 4 . 用户界面友好,使用方便; 5 . 资源更新快; 6 . 直接输出检索结果。,三) 计算机信息检索系统分类,按信息访问模式划分: 联机检索系统 光盘检索系统 网络数据库 Internet 网络检索,DIALOG,美国DIALOG系统是世界上最大的联机检索系统,该系统始建于1963年,原隶属于美国洛克希德导弹与宇航公司,于1972年正式向公众提供联机检索服务。 DIALOG系统目前已在全世界100多个国家

3、和地区拥有10余万个联机终端,数据库量已从最初的100多个发展为今天的450多个,数据库的内容涉及自然科学、社会科学、工程技术、人文科学、商业经济等各个领域,是一个综合性检索系统,其数据库数量之多、范围之广、用户之多均堪称世界之最。,三、步骤与方法 1、分析课题确定主题 2、选择数据库 1)收录文献的来源、学科特点 2)收录文献的文献类型和时间范围 3)收费标准及能否索取到原文 3、选择检索词,4、制定检索策略 1)查找文献在类型、文种、时间等方面; 2)进行概念分析、选择检索词; 3)运用逻辑运算符、位置运算符、截词符等构造检索表达式; 逻辑运算符: “OR”:逻辑或(和),用“+”表示,。

4、 “AND”:逻辑与(积),用“*”表示。 “NOT”:逻辑非(差),用“-”表示。 “太阳”“能量”,练习,1、PATENT */+/- CHINA 2、在秦岭隧道中发表的有关掘进机和TBM的文章 3、除发表的有关秦岭隧道中掘进机和TBM的文章 KEYS: 2、(掘进机)秦岭隧道 3、(掘进机)秦岭隧道 思考:还可以有那种形式,COMPUTER NETWORKS (1) Applications (2) 023065 (3) Computer information communication networks and expert systems.(4) Computerized data

5、 communication networks which provide data to users located as a distance from each other are considered. The possibilities of such communication networks for users of different professions are indicated,and the advantages of this new information exchange technology are reviewed .(Author abstract)(5

6、) 8 Refs.(6) In Russian.(7) Pahtavan,K (8)(Worcester polytechnic Inst).(9) Liefer ,Mark E. (11)ACM Trans Off Inf Syst v6 n3 Jul 1988 p277-302 (10),位置运算符: (w)算符With: (w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒 例如: input(w)output input output ;input, outpu

7、t ;input-output wear(1w)materials wear materials、wear of materials 。,(n)算符near: (n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3),且词序任意。 例如:information(n)retrieval information retrieval 、 retrieval- information, economic(2n) recovery economic recovery、recovery from

8、 economic troubles,、 building (w) construction 2、 building (1w) construction 3、 building (n) construction Keys: 、 building construction; building- construction 2、 building and construction; building under construction 3、 construction building; Construction- building,截词符 无限截词符“*”,代表零至无数多个字母; computer

9、* computer;computered ;computering; 有限截词符“?”,只能代表一个字母; teen? teens 例如: *chemi* chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry,1、ne?t 2、查找检索结果为”Zhejiang Univ Technol”的文献 Keys: 1、neat;nest;next 2、Zhejiang and Univ* and Tech*, 限制检索(Range) 1)字段检索: 1、基本索引字段:描述

10、文献内容特征的字段,一般用后缀形式表示。 /AB ABSTRACT 文摘 /DE DESCRIPTOR 叙词 /ID IDENTIFIER 自由标引词 /TI TITLE 篇名 例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中 microcomputer*/de,ti,ab OR(personal computer )/ti,ab,2、辅助索引字段:描述文献外部特征的字段,检索时辅助索引字段代码置于检索词之前,一般不单独使用,常与基本索引字段配合使用。 AA= AUTHOR AFFILIATION 著者单

11、位 AD= APPLICATION DATE 专利申请日 AN= ABSTRACT NUMBER, 文摘号 APPLICATION NUMBER 专利申请号 AU= AUTHOR OR INVENTOR 著者或发明者 PY= PUBLICATION YEAR 出版年 CY= CONFERENCE YEAR 会议年份,例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中 。要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊 ( (microcomputer)/de,ti,ab OR (persona

12、l computer )/ ti,ab)AND PY1999 AND(LAEN OR FR)AND DTSerials,4.进行查找、检出相关文献并分析检索结果; 5.对检索式进行反馈修改 。,四、检索实例 1、“心脏病与吸烟之间的联系” (英文) 2、门式起重机的研究 3、西红柿的病虫害预防与养殖 、搜索计算机行业的营销状况,但不需要查询方正计算机的营销状况 、查找年的文献 、查找杜彦良发表的有关掘进机和的文章 、查找除了石家庄铁道学院发表的有关掘进机和的文章,1、(HEART(5N)DISEASE +HEART(5N)ATTACK)*(SMOK*+TOBACCO) 2、门式起重机 门式*起

13、重机 3、(番茄+西红柿)*(病虫害*预防+养殖) 、(计算机营销) 方正 、:; 、作者杜彦良 (题名掘进机 题名) 、(题名掘进机 题名) 机构石家庄铁道学院,五、 Internet 网络检索,一) Internet基本概念 Internet是国际互联网, 也称因特网,它是一个计算机网络的网络。Internet将世界上不计其数的计算机及计算机网络互联起来,它们共同遵循TCP/IP 通讯协议。Internet是信息高速公路的原形。,(1)中国科技网CSTnet http:/ (2)中国教育科研网CERNET http:/,(3)中国公用计算机互联网CHINANET http:/ (4)中国金

14、桥信息网 http:/,,二)搜索引擎概述,搜索引擎(Search Engines)是指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制。 搜索引擎最根本的任务是向网络访问者提供一个高效的访问机制。搜索引擎本身是个网站,但搜索引擎的数据库中存放的是其他网站的信息,而不是自己的信息。搜索引擎不仅接受用户的访问,还根据用户的搜索要求,在庞大的数据库中搜索出满足用户需要的站点。,搜索引擎常用的检索方法有关键词检索和目录浏览两种形式。 关键词检索:用户直接输入检索词,搜索引擎通过查找索引数据库中包含有检索词的记录来提供用户所需的信息资源。检索方便直接,而且可以使用逻辑算符、位置算符、截词

15、符等来构成检索式,可以限制检索对象的地区、数据类型、时间等,因而可准确检索满足特定条件的网络资源。 目录浏览:用户通过浏览层次型的目录来寻找相关的信息资源。目录按一定的主题分类体系组织,并辅之年代、地区等分类。用户一般采取逐层浏览目录、逐步细化来寻找合适的类别直至具体资源。 检索和浏览在信息查询过程中各有其功用。一般地说,检索便于有的放矢,直接获取检索结果;浏览利于边查边看,发现未曾预料的结果。,(三)几种常用的搜索引擎,1.一种典型的搜索引擎介绍ahoo! (1)分类浏览 (2)关键词检索 在检索输入框中直接输入检索词或词组,Yahoo!将在索引数据库中进行检索。 中文yahoo(http:/) 中文yahoo则是yahoo为中文用户开发的中文网站查询系统,它收集了数以万计的中文网站,不论你要找的网站是用国标码简体字、繁体字还是图形中文,只要是好的中文网站,你都可以在这里到,2Google (http:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号