信息检索基础知识

上传人:平*** 文档编号:47541177 上传时间:2018-07-02 格式:PPT 页数:46 大小:214.15KB
返回 下载 相关 举报
信息检索基础知识_第1页
第1页 / 共46页
信息检索基础知识_第2页
第2页 / 共46页
信息检索基础知识_第3页
第3页 / 共46页
信息检索基础知识_第4页
第4页 / 共46页
信息检索基础知识_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《信息检索基础知识》由会员分享,可在线阅读,更多相关《信息检索基础知识(46页珍藏版)》请在金锄头文库上搜索。

1、第1章 信息检索基础知识主要内容1.1 信息素养概述 1.2 信息与信息源 1.3 信息检索语言及技术 1.4 信息检索原理及步骤1.1 信息素养概述1.1.1 历史发展信息检索课是一门重要的方法和技能课, 时代性强,特点突出。20世纪90年代 信息检索1984年-1992年 文献检索与利用2002年以后 信息素质教育1.1.2 信息检索的意义和目的信息检索是一切科研的前提和前奏,它贯穿于 课题研究的始终。(查新-跟踪) 继承和借鉴前人的研究成果,避免重复研究或 少走弯路。 对前人的研究进行发展和创新。 研究思路和方法的学习与借鉴,有利于边缘学 科的研究。获取信息的能力对21世纪的大学生来讲,

2、和 外语交际能力、计算机应用能力一样成为衡量 其基本素质的重要因素。对于一名科研人员来 讲,如何从浩瀚的信息中找到自己所需的信息 ,尤其是网络时代,如何利用计算机对网上资 源进行检索及利用,已经成为现代科研人员不 可或缺的一种技能。1.1.3 信息素养 Information iteracy 美国图书馆协会(美国图书馆协会(ALAALA)1989年提出定义:信息素养是人们能够充分认识到何时需要信息,并有能力去获取、评价和有效利用所需要的信息的能力。信息素养是一种基本能力,是一种对信息社会的适应能力。 1.1.4 1.1.4 高校信息素养能力的评估标准高校信息素养能力的评估标准l l美国美国 A

3、CRLACRL(Association of College & Research Association of College & Research LibrariesLibraries)大学和研究图书馆协会标准大学和研究图书馆协会标准l 英国 SCONUL(Society of College,National and University Libraries)国家和大学图书馆协会标准l 澳大利亚大学图书馆员协会 CAUL (Council of Australian University Librarian)的标准 美国美国 ACRLACRL(Association of College

4、 & Research Association of College & Research LibrariesLibraries)大学和研究图书馆协会大学和研究图书馆协会高等教育中的信息素养能力评估标准(Information Literacy Competency Standards for Higher Education)2000年 1月提出 包含:5项标准、22项具体的评价指标、86个可测定的细目 确定所需信息的种类和范围的能力; 有效地获取所需信息的能力; 批评地评估信息资源,将选择的信息融合入自己的知识基础 和价值系统; 有效地使用信息实现特定的目标; 了解信息使用所涉及的经济、法

5、律和社会问题,合理、合法 地获取和使用信息。1.2 信息与信息源信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。 1.2.1 信息的基本概念1.2.1.1情报与文献工作词汇基本术语的定义: 1.2.1.2 信息的特点: 普遍性:信息是普遍存在的 载体的依附性:信息要依附一定的载体 时效性:反映的是特定时刻事物的运动状态和方式 传递性 共享性:在传递共享过程中无损失 可转换性:信息的物质载体形态可以相互转移变换 可伪性:人们主观想象、孤立认识理解认识能力有限、动机不纯时间传递空间传递1.2.1.3 信息的分类:

6、按照信息内容的性质划分:自然信息生物信息机器信息社会信息指自然界随时发生的现象 生物为繁衍、生存而表现出来的各 种形态和行为系统中用于传输、控制、以及交换 的信息人与人交流的一切信息。包括科技 信息、经济信息、政治信息、军事 信息、文化信息按照信息的加工程度分:一次信息:指处在原始形式中的信息。包括阅读性图书、期刊性论文、科技报告、会议论文、专利说明书、学位论文二次信息:指通过对一次信息的加工、提炼、和浓缩而 形成的、报道和查找一次文献的检索书刊。包括条目、索引、目录、题录、文摘三次信息:指对一次信息和二次信息进行汇集、综合、 分析、评述等深度加工而形成的产物。包括词典、百科全书、年鉴、名录教

7、材属于?教材属于?按照信息载体的物理类型划分印刷型:通过铅印、油印和胶印、复印、手写等为记录手段形成的,将知识附着在纸张上的一类文献。缩微型:以印刷型文献为母本,以感光材料为载体,利用光学技术将文字、图形、影象等信息符号按比例缩小的文献形式。声像、视听型:通过特定设备,使用声、光、磁、电等技术将信息表现为声音、图象、影视和动画等形式,给人以直观、形象的感受。电子型:通过计算机对电子格式的信息进行存储和处理。1.2.2 信息源信息源即信息的来源,是产生、载有和传递信 息的一切物体、人员和机构。 信息源的分类: 文献信息源 电子信息源 实物信息源 口头信息源1.2.2.1 文献信息源理解文献的四要

8、素: 文献信息:属于信息,具有信息的一切性质和功能 符号系统:指图画、文字、公式、图表、编码,声像 和电磁信息等 记录方式:指将表达信息的符号系统通过特定的人工记录 方式使其附着于一定的文献载体上 文献载体:不断演变,如纸质、音像、磁盘、电子。 1. 图书 (Book) 2. 期刊 (Periodicals) 3. 专利文献 (Patent Documents ) 4. 标准文献(Standard Literature) 5. 会议文献(Conference literature) 主要的文献信息源:6. “灰色文献”(Gray literature) 7. 技术档案(Technical Re

9、cords) 8. 科技报告(Scientific and Technical Report) 9. 政府出版物(Government Publication) 10. 学位论文(Dissertation) 1.2.2.2 电子文献信息源电子文献信息源是在电子媒介中产生,通过电子媒介得到的文献信息资源,它借助先进的通讯技术、计算机技术、多 媒体技术,把信息资源收集、整理并加工成为电子化、数字 化的一种新型文献信息载体。目前的电子文献信息源大致分为:1.电子出版物:以磁、光、电材料作为信息的存储介质 2.网络信息源:通过网络传播的信息,包括公共信息、商务数据库等1.2.2.3 实物及口头信息源

10、实物信息源实物,包括自然实物和人工实物(人类文化的创造物如文 物、产品等),内含着大量科技文化信息口头信息口头信息指通过交谈、讨论、报告等方式交流传播的信息 。 1.3 信息检索语言及技术信息检索语言定义:是信息汇集、存储和检索时共同使用的一种约定性语言,是一种人为创造的人工语言,用来保证 信息存储和检索的一致性,提高检索效率。类型: 分类语言 主题语言 代码语言 引文法1.3.1 分类语言与分类表以科学分类为依据,加上一些必要的规定来区分世界上所有的事物。分类能够将事物区分开来,揭示事物之间的本质的、内在的联系。常用的分类法 中国图书馆分类法(中图法) 中国科学院图书馆图书分类法(科图法)

11、美国国会图书馆图书分类法(LCC) 杜威十进制分类法(DDC) 国际十进分类法(UDC)1.3.2 主题法和主题检索语言 标题词型主题检索语言 叙词型主题检索语言 关键词型主题语言主题法系统构成主题语言能够用于描述、存贮、检索信息主题而作为建立检索工具或检索系统的一种规范化的词汇,它能 够与所要表达的事物概念达到一一对应。主题语言是直接用代表信息主题概念的主题词作为信息的标识的一种检索语言。1.3.3 代码语言根据事物的某些方面的特征,用某种代码系 统来表达和排列事物概念,从而提供检索的检索 语言。1.3.4 引文索引语言指以某一引文为检索词,标引和检索所有引用 过该引文所代表的文献的一切文献

12、的索引词的全体 。1.3.5 计算机检索技术1.3.5.1 布尔检索用布尔逻辑算符来表达检索词间的逻辑组配关系与 或 非 “与”逐步减少检出文献的数量,提高检出文献与检索 要求的相关性,提高查准率。(A and B) (A * B) “或”扩大检索的范围,提高文献的检出数量,防止漏 检,提高查全率。(A or B) (A + B) “非”使用较少,减少文献输出量,提高检索 词的准 确性。(A not B) (A - B)布尔检索式的优先执行顺序 布尔检索式优先执行顺序通常是NOT、AND、OR。 在有括号的情况下,先执行括号内的逻辑运算,在 多层括号时,先执行最内层括号中的运算。 查南京铁道职

13、业技术学院(A)硕士生陈雷(B) 的关于地铁安全性(c)的文章但不包含人为事故 (D)1.3.5.2 位置算符:位置检索也叫全文检索、邻近检索。所谓全文检索就 是利用记录中的自然语言进行检索,词和词之间的逻辑关 系用位置算符组配,对检索词之间的位置进行限制。如:美国DIALOG检索系统算符用法意义:(W)-With (nW)-nWords(N)-Near(nN)-nNear(S)-Subfield(F)-Field1.3.5.3 截词检索 概念:又称词干检索、模糊检索。词干加截词符号,凡是有与该词干相同的文献均能被检出。很好解决中西文单词的派生形式,避免漏检现象的出现。检索系统不同 ,截词符也

14、不同,常用有: * ? # 类型:右截断(前方一致)、左截断(后方一致)、左右同时截断(中间一致) 作用:减少检索词的输入量、简化检索步骤、扩大检索范围、提高检全率。前方一致: 将截词符放在词根后面,词根*,右截断。是最常用的截词方式。 Smith, A* = Smith, A. OR Smith, A. J. OR Smith, Alan J. Social* = social, socialist, socialistic, sociality Computer* = computer, computers后方一致: 即将检索词的词头部分截断,*词根,左截断,是较常用的截词方式。 如:*c

15、omputer = minicomputer, microcomputer中间一致: 将字根左右词头、词尾部分同时截断,*词根* 如:*computer* = minicomputer, microcomputer, computers, mincomputers1.4 信息检索原理及步骤1.4.1 信息检索的原理主题的分析各类信息资 源信息检索语言数据库文档、超文本文档等等匹配过 程信息需求分析信息检索语言用户查询表示信息资源线索检索出的信息1.4.2 检索步骤信息检索的基本步骤否检 索 工 具 的 选 择检 索 课 题 的 分 析确 定 检 索 词编 制 检 索 式显 示 及 判 断 检 索 结 果获 取 原 始 文 献文 献 阅 读 和 分 析输 出 检 索 结 果不满意是满 意检索课题分析检索课题分析检索课题的分析,即主题分析,以明确课题所包含的概念检索课题的分析,即主题分析,以明确课题所包含的概念成份及其相互关系。这是检索策略制定的根本出发点,也是检成份及其相互关系。这是检索策略制定的根本出发点,也是检索效率高低或成败的关键索效率高低或成败的关键。要明确以下问题:要明确以下问题:1 1、分析课题的主要内容其所涉及的学科范围;分析课题的主要内容其所涉及的学科范围;2 2、所需文献的类型、语种、年代及文献量的范围;、所需文献的类型、语种、年代及文献量的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号