数字信息检索与利用复习资料

上传人:第*** 文档编号:33169274 上传时间:2018-02-14 格式:DOC 页数:4 大小:63.50KB
返回 下载 相关 举报
数字信息检索与利用复习资料_第1页
第1页 / 共4页
数字信息检索与利用复习资料_第2页
第2页 / 共4页
数字信息检索与利用复习资料_第3页
第3页 / 共4页
数字信息检索与利用复习资料_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《数字信息检索与利用复习资料》由会员分享,可在线阅读,更多相关《数字信息检索与利用复习资料(4页珍藏版)》请在金锄头文库上搜索。

1、11、 信息检索的概念、类型?广义的信息检索是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。狭义的信息检索是指从存储的信息集合中快速获取各种需要的信息。信息检索全称:信息存储与检索 。 存储是基础,检索是目的类型:1、按照检索对象的不同,早期信息检索分为:1文献检索:以文献为检索对象的一种相关性检索。2事实检索:检索结果是事实结论的信息检索(确定性检索) 。3数据检索:检索结果是数据的信息检索(确定性检索) 。2、新的三分方法:文本检索、数值检索、声频与视频检索。2、 阐述信息检索的基本原理?是对信息集合与需求集合的匹配与选择。通过对大量的、分散无序的文献

2、信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。3、 检索语言的含义及作用?含义:检索语言是应文献信息的加工,存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言,又叫信息检索标识。作用:(1)标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性;(2)对内容相同及相关的文献信息加以集中或揭示其相关性;(3)使文献信息的存储集中化,系统化,组织化,便于检索者按

3、一定的排列次序进行有序化检索; (4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性 ;(5)保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。4、 信息检索的方法有哪几种?(具体例子)1、工具法又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、 倒查法和抽查法。 (1)顺查法 这是一种依照时间顺序,按照检索课题所涉及的起始年代由远及近、由过去到现在查找信息的方法。这类方式适用于检索理论或学术性的课题,也是一种掌握某课题全面发展情况的大规模的文献查检方法。例如,已知某课题的起

4、始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 是由近及远,从新到旧,由现在到过去地逆着时间的顺序检索信息的方法。此方法多用于检索新课题或有新内容的老课题。 (3)抽查法 这是一种依据信息提问的特定需求,根据某学科发展的实际情况,针对发展较快的、文献较多的一段时间进行检索,以达到采用较少时间获得较多文献的检索方法。 2、追溯法 又称引文法。利用文献后所附参考文献,逐一追查被引用文献,然后,再从被引用文献后所附参考文献目录逐一扩大检索范围,依据文献引用与被引用之间的关系获得内容相关的诸多文献,这是一种扩大信息来源最简捷的2方法。 3、综合法亦称

5、循环法或分段法。它是指分期分段交替使用上述各种检索法以达到优势互补、获得理想结果的一种检索法。5、 信息检索的途径有哪几种?(具体例子)(1)以文献的外部特征为检索途径分为:题名途径、著者途径、号码途径(2)以文献内容特征为检索途径分为:分类途径、主题途径6、 简述信息检索步骤?(具体例子)(1)分析研究信息检索课题(2)选择信息检索工具(3)确定信息检索方法(4)掌握获取原文的线索(5)获取原文(6)用户相关反馈7、 查全率、查准率、漏检率和误检率的含义?(公式在书上自己抄)查全率(R):系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率查准率(P):系统在进行某一检索时

6、,检出的相关文献量与检出文献总量的比率漏检率、误检率联机检索1. 联机检索信息系统的组成(1) 检索终端(2) 通信网络(3) 联机信息检索中心:中央计算机及外围设备联机数据库数据库检索与管理软件相应的检索服务体制2. 联机信息检索的功能(1) 追溯检索(RS)(2) 定题服务(SDI):现刊检索,最新文献检索(3) 联机订购原始文献(4) 光盘检索服务(可单独使用,也可与远程联机信息检索系统)(5) 电子邮件服务3. 联机系统有 DIALOG,STN,ORBIT:指用户在计算机检索网络的终端上通过使用特定的检索指令、检索词、检索策略,从联机检索系统的数据库中检索出所需信息并在终端设备上显示并

7、打印出来的过程4. 联机信息检索的特点:(1) 内容丰富,可连多个联机系统,数据库多(2) 实时性强,检索内容新3(3) 检索迅速,检索结果输出方式灵活(4) 检索界面友好(5) 检索途径多,可靠性强(6) 安全性强(7) 可共享性号(8) 查全率与查准率高5. 主要国际联机检索系统及各自特征(1) 美国的 DIALOG:目前世界上规模最大的,检索功能最完善,用户终端最多的联机检索系统。收录内容多,数据更新快,专业范围涉及面广,涵盖年限长(2) 美国的 OCLC(FirstSearch):是世界上使用量最大的交互式联机信息检索服务系统(3) 美国的 ORBIT:世界上第二大联机检索系统(4)

8、ESAIRS:欧洲最大的联机检索系统6. 什么是联机信息检索所谓联机信息检索就是指用户在计算机检索网络的终端上,通过使用特定的检索指令、检索词、检索策略,从联机检索系统的数据库中检索出所需信息并在终端设备上显示并打印出来的过程。光盘检索1. 什么是光盘检索及光盘数据库主要类型光盘检索系统就是利用光盘驱动器与光盘数据库及检索软件,结合计算机建立起来的信息检索系统。(1) 全文本数据库(2) 字段数据库(3) 软件库光盘2. 光盘检索的特点(1) 优点:1. 检索系统配置简单2. 检索成本低3. 操作简单易学,检索效果好4. 运行速度快5. 安全性能高6. 数据转录灵活方便7. 是用户在联机检索前

9、进行预检和培训的有用工具(2) 局限性1. 更新周期长2. 检索系统不兼容3. 检索时需要不断换盘4. 检索灵活性差5. 信息量有限3. 光盘检索系统由哪几部分构成(1) 单机版:光盘,光盘驱动器,相应软件组成4(2) 网络版4. 光盘检索基本方法(基本流程)(1) 分析研究课题,明确用户信息需求(2) 选择光盘数据库(3) 确定检索关键词(4) 编写检索逻辑表达式(5) 检索结果的显示及分析5. 光盘检索和联机检索有何异同(1) 所用设备及检索费用光盘信息检索设备简单费用低,只有微机光盘数据库光盘驱动器及打印机组成,而联机信息检索和网络信息检索设备复杂成本高。(2) 检索方式光盘信息检索有四

10、种检索方式导航目录检索、专项检索、组合检索和表达检索;联机信息检索运用布尔逻辑符和位置符使用字段检索法和截词检索法检索(3 ) 检索空间光盘信息检索和联机信息检索均只能检索某一台某几台和某一局域网内的若干数据库。(4) 检索操作光盘信息检索采用人机对话方式引导用户操作,且没有联机帮助,操作界面友好,易学易用。联机信息检索操作复杂,要学习和记忆一系列复杂的检索指令和检索规则,一般用户只能借助专业人员的帮助才能使用。(5) 检索结果在检索结果方面,光盘信息检索和联机信息检索,检索准确率高,误检率低,查全率低。(6) 检索内容光盘信息检索信息更新速度慢,一般在个月左右,联机信息检索一般在一周或一个月左右,个别的数据库如新闻类每天更新6. 讨论联机信息检索未来的发展趋势三大经典检索模型1. 布尔检索模型:一种简单的检索模型,它建立在经典的集合论和布尔代数的基础上。遵循两条基本规则: 每个索引词在一篇文档中只有两种状态:出现或不出现,对应权值为 0 或 1。查询是由三种布尔逻辑运算符 and, or, not 连接索引词组成的布尔表达式。优点:简单、易理解、简洁的形式化。缺点:准确匹配,信息需求的能力表达不足。2. 向量空间模型:特点:基于多值相关性判断、基于统计学方法的词加权处理模式、采用检索结果的排序输出策略。53.概率模型基于相关反馈的原理,需要进行一个逐步求精的过程

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号