信息检索概述(2012)(自下)

上传人:ldj****22 文档编号:51597639 上传时间:2018-08-15 格式:PPT 页数:42 大小:185KB
返回 下载 相关 举报
信息检索概述(2012)(自下)_第1页
第1页 / 共42页
信息检索概述(2012)(自下)_第2页
第2页 / 共42页
信息检索概述(2012)(自下)_第3页
第3页 / 共42页
信息检索概述(2012)(自下)_第4页
第4页 / 共42页
信息检索概述(2012)(自下)_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《信息检索概述(2012)(自下)》由会员分享,可在线阅读,更多相关《信息检索概述(2012)(自下)(42页珍藏版)》请在金锄头文库上搜索。

1、文献检索授课人:周晓梅 授课时间:2012年8-12月一、为什么要上文献检索课?l1.培养信息意识l2.培养自学能力l3.培养初步科研能力(即主动发现问 题和解决问题的能力)二、如何学习文献检索?l1.要和专业课的学习紧密结合起来l2.要把理论与实践紧密结合起来l3.要多思考多练习l4.多交流内容提纲l信息检索概述l文献检索(如何查找文献)l检索工具的应用:以CA为例l特种文献检索l现有资源的应用信息检索概述l基本概念l信息资源的组织管理l信息检索技术基本概念1.信息l信息是物质存在的一种方式、形态或运动状态,也 是事物的一种普遍属性,一般指数据、消息中所包 含的意义,可以使消息中所描述事件的

2、不确定性减 少。 2.情报l“情报”属于“信息”范畴,但“情报”不是一般 的、普遍意义上的“信息”。情报是知识或信息经 传递并起作用的部分,即运用一定的形式,传递给 特定用户,并产生效用的知识或信息。l情报具有三个要素:知识性、传递性、效用性。3.知识l从信息的观念看,知识来源于信息,是信息的 一部分。人类在认识世界和改造世界的过程中 ,不断接受客观事物发出的信息,经过大脑的 思维加工,获得了对事物本质及其运动规律的 认识,这就是将信息转化为知识的过程。简而 言之,知识是理性化、优化和系统化了的信息 。 4.文献l概括地说,文献是指用文字、图像、符号、声 频、视频等技术手段记录在一切载体材料上

3、的 人类知识。文献是一种重要的信息传递工具。 存储信息、传递信息是文献的主要功能。l知识是文献的实质内容,载体是文献的外在形 式,而记录是联系知识与载体的手段。信息、知识、文献之间的关系l事物发生发出信息;l信息经人脑加工变为知识;l知识被记录在载体上形成文献;l文献经过传递、应用于理论与实践产生新的信 息。5.信息检索l信息检索是指将信息按一定的方式组织和储存 起来并根据信息用户的需要找出相关信息的 过程。这是广义的信息检索。狭义的信息检索 则仅指该过程的后半部分,即从信息集合中找 出所需信息的过程,相当于信息查寻。l根据检索对象的不同信息检索可分为三种: 数据检索、事实检索、文献检索。数据

4、检索:l是将观察或实验得到的数据经过筛选、分析、整理 和鉴定,以一定的顺序存贮在某种载体上,然后采 用适当的方法或手段从中找出符合用户所需的数据 的过程。l检索结果:数据。l例如某种金属的熔点,某种材料的电阻。另外,有 关计算公式、数据图表、化学分子式等都属于数据检索范畴。 事实检索:l是将基本事实预先纪录于某种载体,当需要这种信 息时再提取出来的过程。凡查询某一事物(事件)的 性质、定义、原理以及发生的时间、地点、过程等 ,都属于事实检索的范畴。l检索工具:主要是字典、辞典、百科全书、年鉴手 册、类书、政书、名录等参考工具书。l检索结果:事实结论。l例如某类产品由哪些厂家生产,哪个牌子最好等

5、都 属于事实检索。文献检索:l是指从各种载体的文献群中查找出与特定的检索课 题匹配或相关的文献线索或文献全文的过程。凡是 查找某一课题、某一著者、某一地域、某一机构、 某一事物的有关文献的出处和收藏单位等,均属于 文献检索的范畴。l检索工具:书目、索引、文摘等。l检索结果:题录、文摘或全文及出处等文献资料。l例如要系统地收集有关“纺织印染厂对废水处理的 计算机控制系统”的文献,即属于文献检索。在三种信息检索类型中,文献检索是最主要、 最基本的形式,是信息检索中最重要的部分。文献分类根据不同的标准,可以分成多种类型:l1)按载体形式划分:主要有纸张型、缩微型、电子型 、音像型等四种。 l2)按加

6、工层次划分:主要有一次文献、二次文献、三 次文献。l3)按出版形式划分:图书、期刊、科技报告、会议文 献、专利文献、标准文献、学位论文、政府出版物、 产品资料、科技档案。 除上述文献类型外,还有报纸、新闻稿、工作札记等。*14信息资源的组织管理 l“信息资源”的含义l信息资源分类l传统信息资源组织l网络信息资源组织l信息资源组织的主要方法*151.“信息资源”的含义l所谓信息资源,就是指人类经济社会活动中积累 起来的以信息为核心的各类信息活动要素(信息 生产者、信息技术等)的集合。l信息是信息资源构成的核心部分。l信息资源同物质资源、能源资源、一起构成现代 社会经济与技术发展的三大支柱性资源。

7、物质资 源向人类提供材料,能源资源向人类提供动力, 信息资源则向人类提供知识和智慧。*162.信息资源分类按其自身的性质可划分为四个层次的信息资源:l第一层次信息资源,即原始信息资源。其特征是未 经加工的直接的信息资源。属于0次信息。包括宇宙 、自然界、人类社会、个人在自身运动和从事社会 活动中所发出的所有信息。l第二层次信息资源,是对处于自然状态的信息进行 整理加工、控制转化、使其固化、量化、社会化, 然后再进行传递的信息资源,如政府文件、商务资 料、图书期刊、音像产品等。这些信息多以文献形 式出现。包括一次信息和二次信息。*17l第三层次信息资源,包括报社、电视台、广 播电台、邮局、书店、

8、互联网等传播信息的 机构和设施,这些机构和设施使信息的交流 成为可能,也是一类重要的信息资源。l第四层次信息资源,是存贮信息的信息库和 资料库。如档案馆、博物馆等。这些机构的 特点是集聚着大量的经过人工加工的信息和 以数字化形式存贮的数据库,可供人按需索 取、利用。*183.信息资源组织方式l形式整理l内容整理*19形式整理:l首先,将收集的信息按题名、编著者、信息 来源出处、内容提要顺序进行著录;l其次,按各条信息涉及的学科或主题进行归 类,并著录分类号和主题词;l第三,将著录和归类后的信息,按分类或主 题进行编号、排序,使之系统化、有序化。*20内容整理:l通读经过形式整理后的信息,从信息

9、来源、发 表时间、理论技术水平及适用价值等方面进行 评价鉴别,剔除实际意义不高和参考价值不大 的部分。对选择出的各条信息中涉及到与研究 课题有关的观点(论点、论据、结论等)和图 表数据提取出来,对相同的观点进行合并,相 近的观点进行归纳,各种图表数据进行汇总,编号,排序供下一步分析、利用。 *214.网络信息资源组织l网络信息资源的组织是一个复杂的过程,既不能 依靠人工的方式完成,又难以舍弃人脑的判断和 分析,需要借助计算机处理,借助人工智能的强 大支撑。l依照信息组织的性质可将网络信息的组织过程分 为三个方面:1)数字化文件的收集。包括原生数字信息和衍 生数字信息两大类。这个过程属于信息资源

10、的选 择。 2)数字化文件的处理。可以采用传统的元数据 方式和现代元数据方式来组织。(元数据是关于 数据的数据,用于描述数据的属性。)3)网络信息资源的服务构建。 *225.信息资源组织的主要方法l分类法l主题法*23分类法:l分类法是一种从主题内容角度组织和揭示信息 资源的方法,信息资源的分类是分类方法在信 息资源组织中的应用。l信息资源分类具有多方面的作用其中最主要 用于信息资源组织和揭示,包括文献分类排架 和编制分类检索工具两个方面。*24l信息资源分类一般具有以下特征; l 其一,按照信息资源内容特征的相互关系加以 组织。l 其二,一般是从一定的角度出发组织信息资源 的。主题内容之间的

11、联系是多方面的、多维的。 分类法作为一种从内容角度揭示信息资源的方法 ,一般只能有选择地揭示其主要联系。l 其三,以一定标记符号作为排序工具l 其四,一般通过类目索引提供从字顺角度查找 类目的途径。 *25主题法:主题法:是分类法以外另一种从内容角度标 引和检索信息资源的方法。用主题法标引和检索信息资源时一般以直接 表达主题内容的语词作为检索标识、以字顺 作为主要检索途径、并通过参照系统等方法 揭示词间关系。主题法在信息资源组织中的作用,主要是用 来处理信息资源、编制各种检索工具及检索 系统。*26l目前国内外采用的主题法的类型很多,一般都具有 下述特征:l 其一,直接以语词作为检索标识,主题

12、法不像分 类法那样、以一种抽象的号码系统作检索标识,而 是直接选用自然语言中的语词进行标引和检索。l 其二,以字顺作为主要检索途径。我国的主题检 索系统通常是根据汉字特点,按照拼音或笔画笔顺 进行排检的;因此在使用主题法检索时,只要知道 检索对象的名称。就可以按相应的排检方式进行查 找。在采用机检系统的情况中,一般可以直接输入 语词,由计算机进行查找,不必如使用分类法那样 ,必须预先了解主题词之间关系,通用性好。 *27l其三,主题法昌以特定的事物、问题、现象,即主题 为中心集中信息资源。分类法由于受学科体系的限制 ,从不同学科角度研究同一对象的信息资源是分散在 各知识门类中的。主题法则没有这

13、一限制,而是直接 从主题对象的角度揭示图书资料。l例: 茶茶的种植茶的炮制茶的贸易农业科学工业技术经济主题法分类法*28l其四,主题法往往是通过详尽的参照系统等方式 揭示主题词之间关系。按照字顺排列不能必然揭 示主题概念之间的联系,为了克服这一局限,主 题法发展了完备的参照系统,通过在主题词下设 置用、代、属、分、参等多种参照项,建立起“ 隐蔽的分类体系”。同时,一些系统还备有词族 索引、范畴索引、轮排索引等多种辅助索引,通 过各种形式的结合,在主题词之间建立起充分的 语义联系。当然各种主题系统中对词间关系的揭 示状况是不平衡的。就整体而言,主题法对主题 之间关系的揭示不如分类法。*29主题法

14、的类型按照主题法的选词方式,可以分为标题法、元词法 、叙词法、关键词法;按照其使用时组配的先后,可以分为先组式主题法 和后组式主题法;按照其使用时是否进行控制,可以分为受控主题法 与非控主题法。*叙词法l叙词法,是以从自然语言中精选出来的、经过严格处 理的语词(叙词)作为文献主题标识,通过概念组配 方式表达文献主题的主题法类型。l叙词,国内亦称主题词,是经过规范化处理的,以基 本概念为基础的表达文献主题的词和词组。l叙词语言是受控主题语言的主流。到目前为止,国外 的叙词表数量不少于千种,我国的叙词表也已超过 130种。我国目前使用最广泛的叙词表为汉语主题 词表。关键词法关键词法关键词法是直接以

15、自然语言中未经控制或只作少量控 制的语词为文献主题标识,通过对关键词的轮排的方 式揭示文献主题的主题法。关键词法从属于自然语言 范畴。这种方法是随着计算机的出现为适应索引编 制自动化的需要而产生的主题法类型。*31信息检索技术l这里主要介绍几种在光盘检索、联机检索和网 络检索等各类机检系统中常用的检索技术。但由于 不同的机检系统使用不同的检索软件,所支持的检 索技术不同,采用的检索算符也不同,因此实际检 索时,应注意查看所用检索系统的说明。l布尔逻辑检索l截词检索l位置检索l限制检索l加权检索*32布尔逻辑检索l布尔逻辑检索(Boolean Logical)是用布尔逻辑运算符 将检索词、短语或

16、代码进行逻辑组配,指定文献的 命中条件和组配次序,凡符合逻辑组配所规定条件 的为命中文献,否则为非命中文献。它是机检系统 中最常用的一种检索方法。逻辑算符主要有:And/ 与、Or/或、Not/非,分述如下:l逻辑“与”:运算符为 And 或 * 。检索词A和检索词 B用“与”组配,检索式为:A And B或者 A * B 它 表示检出同时含有A、B两个检索词的记录。逻辑 与检索能增强检索的专指性,使检索范围缩小。l此算符适于连接有限定关系或交叉关系的词。*33l逻辑“或”: 运算符为 Or 或 + 。检索词A和检索词 B用“或”组配,检索式为:A Or B或者 AB 它表 示检出所有含有A词或者B词的记录。逻辑或检索扩 大了检索范围。l此算符适于连接有同义关系或相关关系的词。l逻辑“非”: 运算符为 Not 或 - 。检索词A和检索词 B用“非”组配,检索式为:A Not B或者 A - B 它表 示检出含有A词,但同时不含B词的记录。逻辑非和逻 辑与运算的作用类似,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号