信息检索与word文字处理

上传人:宝路 文档编号:47591359 上传时间:2018-07-03 格式:PPT 页数:31 大小:818.32KB
返回 下载 相关 举报
信息检索与word文字处理_第1页
第1页 / 共31页
信息检索与word文字处理_第2页
第2页 / 共31页
信息检索与word文字处理_第3页
第3页 / 共31页
信息检索与word文字处理_第4页
第4页 / 共31页
信息检索与word文字处理_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《信息检索与word文字处理》由会员分享,可在线阅读,更多相关《信息检索与word文字处理(31页珍藏版)》请在金锄头文库上搜索。

1、信息检索与网络应用SENTAIDAITBADE信息检索与网络应用感受检索的魅力网站内容的获取常用网站主题词的设定计算机信息的检索计算机信息检索基础计算机 检索系统基本程序概述结构计算机检索系统概述计算机信息检索:利用计算机及相关软件和通信设备,对本地计算机、 远程服务器上存贮的信息进行检索。 1计算机信息检索的发展大体经历了三个阶段:联机检索阶段(60年代中期到70年 代中期);光盘数据库检索阶段(70年代中期到80年代末); 网络化检索阶段(90年代初至今)。 2计算机信息检索的服务方式(1)回溯检索指追溯查找过去的信息,帮助用户查找过去几年甚至几十 年的文献信息,使用户一次检索就可以全面了

2、解某一课题 在某一段时间中的发展情况。计算机检索系统概述(2)定题检索 定题检索服务是根据用户检索课题的内容,一次性输人 事先确定好的检索提问式保存在检索系统中。(3)人机对话检索 用户一旦输入检索提问,计算机检索系统就可立即执行 ,并在用户终端显示屏上输出检索结果。(4)联机订购用户通过联机检索得到的结果一般都是二次文献,如果 需要一次文献,可以通过终端联机订购原始文献的复印件 或原文。SENTAIDA计算机检索系统的结构1计算机信息检索原理计算机信息检索是指人们在计算机检索网络或终端上 ,使用特定的检索指令、检索词和检索策略,从计算机检 索系统的数据库中检索出所需要的信息,然后再由终端设

3、备显示、下载和打印的过程。广义的计算机信息检索包含两个过程:(1)对原始信息加工处理并存贮在各种信息载体上一是对待加工的信息进行著录,即按一定的规则进行 描述。二是对待加工的信息进行标引。形成从内容角度查找 信息的检索点。SENTAIDA计算机检索系统的结构(2)信息查询过程用户对检索需求加以分析,明确检索范围,弄清主题概念 ,然后用系统语言或自然语言表示主题概念,形成检索标 识及检索策略,输入计算机进行查找。2计算机检索系统的构成由计算机硬件,检索软件、数据库、通信网络等组成。计算机检索的基本程序1分析检索课题 就是明确检索目的、要求和检索的范围。 2选择检索系统和数据库根据主题范围、信息类

4、型、时间范围等因素选择检索系统 和数据库。 3确定检索途径和检索词 常用的检索途径有著者、分类、主题、文献题名、文献号 、代码、引文、文献类型,出版时间、语种等。检索词是 表达文献信息需求的基本元素,是用户输入的检索语词。计算机检索的基本程序4构建检索式是用来表达用户检索提问的逻辑表达式,由检索词和各种 布尔逻辑算符、位置算符、截词符以及系统规定的其他组 配连接符号组成,是检索策略具体体现。 5检索并调整检索策略在检索过程中应及时分析检索结果是否与检索要求一致, 并根据检索结果对检索词、检索提问式作相应的修改和调 整,直至得到比较满意的结果。 6输出检索结果根据检索系统提供的检索结果输出方式,

5、选择需要的记录 以及相应的字段,选择文摘或全文等,将检索结果显示在 屏幕上、或存储到磁盘上、或打印输出。信息检索的基本技术布尔逻辑截词检索位置检索加权检索限制检索基本技术信息检索计算机检索的基本技术信息的检索模型有布尔检索模型、向量空间模型、概率 模型、模糊集合模型、扩展布尔检索模型等几种。具体检 索技术有布尔检索、截词检索、限制检索、加权检索、聚 类检索等。 1布尔逻辑检索技术指利用布尔运算符连接各个检索词,由计算机进行相应 逻辑运算,以找出所需信息的方法。AND(或)、OR(或+) 、NOT(或一) 。 2截词检索技术 分为后截词检索(前方一致),前截词检索(后方一致),中 截词检索(前后

6、方一致),以及前后截词检索(中间一致) 基 本类型。“*”代表多个字符, “#”代表单个字符,“?”或者“n?”代表O 个到9个额外的字符。计算机检索的基本技术3位置检索技术 可要求检索词以用户所规定的相对位置出现。常用的位 置算符有以下8种:(w)算符(WITH) 、(nw)算符(nWORD) 、(N)算符(NEAR) 、(nN)算符(nNEAR)、(F)算符(FIELD) 、(S)算符(SUBFIELD) 、(C)算符(CITATION) 、(L)算符 (LINK) 4加权检索技术 方法是:在检索提问式中,根据每个提问词重要程度, 分别给予一定的加权数值加以区别,称为权数;同时再给 出检索

7、命中的阈值。 5限制检索技术是通过限制检索范围,达到优化检索结果的方法。限制 检索的方式有多种,例如进行字段检索、使用限制符、采 用限制检索命令等。互联网信息资源概述1互联网信息资源的内涵即指以数字化形式记录的,以多种媒体形式表达的, 分布式存储在互联网不同主机上并通过计算机网络通 讯方式进行传递的信息资源的集合。 2互联网信息资源的特点数字化存储和传递;数量巨大,增长迅速;内容丰富 ,形式多样;稳定性差,变化频繁;结构复杂,分布 广泛;信息组织的局部有序性与整体无序性;信息新 颖,定期更新; 3互联网信息资源的类型和内容类型主要包括:非正式出版信息 、半正式出版信息 、正式出版信息、万维网(

8、WWW)信息资源 、电子邮件 (E-mail)信息资源、FTP信息资源(文件传送协议)、 Telnet信息资源(远程登录协议) 、Usenet/Newsgroup 信息资源 (专题讨论组)互联网信息资源概述4互联网信息资源的组织 互联网信息组织方法可归纳为语法信息组织方法、语 义信息组织方法和语用信息组织方法。互联网信息资 源的组织形式主要表现为:网页网站、搜索引擎、专 业导航系统、虚拟图书馆等。 5互联网信息资源的评价 评价标准包括9项:信息的准确性;信息发布者的权 威性;提供信息的广度和深度;主页中的链接是否可 靠、有效;版面设计质量;信息的时效性;读者对象 ;信息的独特性;主页的可操作性

9、,并特别强调可存 取性、权威性、交互性和愉悦性这四项标准。互联网搜索引擎搜索引擎(search engine)是对互联网上的信息资源进行搜集整理,然后提供查 询的系统它包括信息搜集、信息整理和用户查询三部分 。包括目录服务和关键字检索两种服务方式。搜索引擎可以是一个专门的网站,也可以是某个网站 上的一个系统。 1搜索引擎的类型 按照索引方式分为分类搜索引擎和机 器人搜索引擎。分类搜索引擎采用人工或机器搜索WWW信息,依靠专业 人员对信息进行甄别和分类而建立的以分类导航或分类摘 要查询为主的一类引擎,又称“主题指南”。机器人搜索引擎指由网上搜索软件自动收集网页建库,以 全文检索为主的引擎。按照检

10、索方式可将搜索引擎划分独立搜索引擎、元搜索引 擎、网络搜索软件。互联网搜索引擎2搜索引擎的工作原理搜索引擎实际上是一个专用的WWW服务器,它收集 Internet上成千上万甚至上亿个网页信息,组成庞大的索 引数据库。自动运行并对大量页面进行索引。 3搜索引擎的检索功能大多数搜索引擎提供以下检索功能:布尔逻辑检索、截词 检索、限制检索、区分大小写检索、加减检索、概念检索 、结果过滤、语句检索、智能化检索等。常用搜索引擎搜索引擎搜索引擎LiveLiveGoogleGoogle百度百度著名搜索引擎的使用1Google中文 http:/wwwgooglecomGoogle收录20亿多网页。 Googl

11、e提供的关键词查询,查 询范围有四种:所有网站、图像、网上论坛和网页目录。 Google所提供的几项特殊检索功能有: (1)按链接搜索 (2)按指定网域搜索 (3)网页快照 (4)查找PDF文件 2百度 http:/百度也提供了搜索帮助、高级搜索、搜索工具、百度大全 等,也是基于关键词的搜索引擎。百度提供网页快照、在 指定网站内搜索、在标题中搜索、在URI。中搜索、并行 搜索、相关搜索等功能。百度搜霸。著名搜索引擎的使用3metacrawler http:/WWWmetaerawler是一个并行式的元搜索引擎,主要提供三种 类型服务:Web搜索服务、黄页服务、白页服务。具有同 时调用Googl

12、e、Yahoo、Ask JeevesAbout、LookSmart 、Teoma Overture等搜索引擎的功能,然后按相关度给 出详细结果。 4Excite搜索引擎 http:/Excite是一个智能性的搜索引擎,主要提供频道 (channel)和搜索(search)两种Web信息服务,可以对网 站 、目录,新闻、照片等进行搜索。Excite搜索服务的个性 化服务特色非常突出。检索效果评价检索效果评价的指标 在检索评价实践中,评价检索效果的常用指标具体有以下几 种:查全率(Recall ratio)用R表示;查准率(Precision ratio)用P表示;漏检率()mission rat

13、io)一一用U表示;误检率(FallOutratio)用F表示。其中,最常用的检索效果评价指标为查全率和查准率。检索效果评价1查全率和漏检率 是评价检索效果最常用的两项关键指 标。 2查准率和误检率查准率是指检出的相关文献量与检出文献总量的比率,是 衡量信息检索系统精确度的尺度。误检率是指误检(检出不相关)文献总量的比率,是衡量信 息检索系统误检文献和程度的尺度。 3检索速度(T)、新颖率(N)与有效率(A)检索效果的优化影响检索效果的因素是多方面的,检索效果的优化就需 要针对影响查全率、查准率、检索速度等因素从多方面进 行改进。 1提高检索系统的功能包括提高检索系统的运行速度,提供检索手段的

14、完备性, 检索功能的智能化,检索界面的友好性和易用性等。这里 既包括硬件设备也包括检索程序的设计 2提高数据库的质量数据库的质量是提高检索效率的基本因素。从数据库整体 来说,要做到相关文献信息收录完整,具有完备的索引系 统、完备的帮助系统,数据库结构科学,信息记录使用标 准规范的格式等。检索效果的优化3提高检索人员的素质检索人员不仅指专门从事检索的图书情报工作人员,也包 括普通用户。 4优化检索策略检索者利用检索工具对查找到所需内容的科学安排。一般 可采取三方面的举措来优化检索策略,从而提高检索效果 。(1)科学选择数据库 (2)提高查全率 (3)提高查准率综合检索实例及分析用百度进行检索:(

15、1)在百度检索框中输入检索词“城市青少年”,检索到10,400,000条记录; 再用“价值结构”在结果中检索共检索到1,370,000条记录,其中两条为相 关记录。从检索情况来看,用“城市青少年”进行检索,检索词过于专指, 造成很大的漏检。(2)在百度检索框中输入检索词“青少年价值观”扩检,检索到1,620,000条 记录,很大程度上提高了检全率。相关记录有:青少年人生价值观状况 分析、我国青少年价值观发展特点与教育对策研究、新时期青少年价值 观的现状与变化的追踪研究、我国五城市青少年学生价值观的调查等等 。(3)在百度检索框中输入检索式:“青年价值观”+“社会教育”再次扩检,从检 索命中记录

16、来看,用“青年价值观”+“社会教育”检索,弥补了用“青少年价 值观”+“社会教育”检索时造成的对青年价值观的部分漏检。用户可以尝试 着用其它检索词进行组配检索,不断地扩检、缩检以提高检准率和检全 率。另外,百度会提供相关的检索词供用户参考。在检索的过程当中,我们可以利用检索到的文献以及其参考文献为线索进 行相关文献的检索。除了百度外,Google也是最常用、检索功能强大的搜索引擎,用户可以配 合一起使用。示例网站内容的获取上机作业上机内容: 题目:搜索引擎的界面和原理的进一步理解 具体内容: 对比以下四个搜索引擎界面、主要检索方法及功能 1.Google中文 http:/ 2.百度 http:/

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号