第2章-文献检索基础知识

上传人:m**** 文档编号:578267889 上传时间:2024-08-23 格式:PPT 页数:48 大小:1.14MB
返回 下载 相关 举报
第2章-文献检索基础知识_第1页
第1页 / 共48页
第2章-文献检索基础知识_第2页
第2页 / 共48页
第2章-文献检索基础知识_第3页
第3页 / 共48页
第2章-文献检索基础知识_第4页
第4页 / 共48页
第2章-文献检索基础知识_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《第2章-文献检索基础知识》由会员分享,可在线阅读,更多相关《第2章-文献检索基础知识(48页珍藏版)》请在金锄头文库上搜索。

1、专题二专题二 文献检索基础知识文献检索基础知识1 文献检索的基本原理一、信息检索的含义广义上:文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需文献的过程。狭义上:信息检索指用户利用检索工具和检索系统从有序的信息源中,查询所需信息的检索过程。即文献检索就是文献的查找过程。二、信息检索原理概述二、信息检索原理概述 广义的信息检索包括信息的存储和检索两个过广义的信息检索包括信息的存储和检索两个过程。程。信息的存储就是将搜集到的一次信息,经过著信息的存储就是将搜集到的一次信息,经过著录其特征(如题名、著者、主题词、分类号录其特征(如题名、著者、主题词、分类号等)而形成款目,并将这些

2、款目组织起来成等)而形成款目,并将这些款目组织起来成为二次信息的过程。为二次信息的过程。信息的检索是针对已存储好的二次信息库进信息的检索是针对已存储好的二次信息库进行的,是存储的逆过程。行的,是存储的逆过程。存储是为了检索,而为了快速而有效地检索,存储是为了检索,而为了快速而有效地检索,就必须存储。就必须存储。没有存储检索就无从谈起。没有存储检索就无从谈起。存储与检索是相辅相成、相互依存的辩证关存储与检索是相辅相成、相互依存的辩证关系。系。图图1 信息检索原理图信息检索原理图2信息检索分类信息检索分类一、按检索内容划分一、按检索内容划分1文献检索文献检索文献检索文献检索(Document Re

3、trieval)即从一个文即从一个文献集合中查找出专门包含所需信息内容的献集合中查找出专门包含所需信息内容的文献文献,是以是以文献文献为检索对象的信息检索类为检索对象的信息检索类型。型。文献检索根据所检索内容的不同分为文献检索根据所检索内容的不同分为书目检书目检索索和和全文检索全文检索。2. 数据检索数据检索 数据检索数据检索(Data Retrieval)以特定以特定数据数据为检为检索对象和检索目的的信息检索类型称为数索对象和检索目的的信息检索类型称为数据检索。据检索。包括数据图表包括数据图表,某物质材料成某物质材料成分分、性能、图、性能、图谱、市场行情谱、市场行情,物质的物理与化学特性物质

4、的物理与化学特性,设备的型号与规格等设备的型号与规格等,是一种确定性检索。是一种确定性检索。3事实检索事实检索 事实检索事实检索(Fact Retrieval)是获取以事物的是获取以事物的实际情况为基础而集合生成新的分析结果实际情况为基础而集合生成新的分析结果的一类信息检索的一类信息检索,以从文献中抽取的事项以从文献中抽取的事项为检索内容为检索内容,包括事物的基本概念、基本包括事物的基本概念、基本情况情况,事物发生的时间、地点、相关事实事物发生的时间、地点、相关事实与过程等。与过程等。二、二、按信息检索的方式划分按信息检索的方式划分u根据信息检索的基本原理,实现信息检索的基本方式可分为传统信息

5、检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。按照检索的操作方式,信息检索分为手工检索和计算机机器检索。1.传统信息检索u传统信息检索,即手检。手工检索是检索人员利用手工检索工具手翻、眼看、大脑思维判别、索取原始文献的一种方式。u优点是:检索条件简单,成本低;在检索过程中可以随时获取反馈信息,及时调整检索策略;可对不同的检索工具同时进行对比,从而提高检索质量;可以参阅检索工具中的附图。u缺点是:速度慢、效率低,检出的文献款目必须抄录;手工检索工具提供的检索点有限,很难进行多元检索;难以找到涉及几个概念组合的多主题文献。2. 现代信息检索u现代信息检索即机检,是检索

6、人员利用计算机检索系统查找文献的一种检索方式。所谓计算机检索系统包括数据库技术、计算机技术和通信技术等。计算机检索已从单机检索、联机检索发展到今天的网络检索,并正向着智能化的方向发展。3 检索语言检索语言(一)检(一)检 索索 语语 言言 分分 类类外表特征语言外表特征语言内容特征语言内容特征语言题名题名(书名、刊名、篇名)(书名、刊名、篇名)著者著者号码号码(如专利号、报告号等)(如专利号、报告号等)引文引文分类语言分类语言主题词语言主题词语言代码语言代码语言分子式、结构式分子式、结构式检索语言检索语言文献类型文献类型文献出版事项文献出版事项二、二、 两种常用检索语言两种常用检索语言v两种常

7、用的检索语言两种常用的检索语言 (按检索语言结构原理(按检索语言结构原理划分)划分)v(1)分类语言)分类语言v(2)主题词语言)主题词语言体系分类语言体系分类语言组配分类语言组配分类语言混合分类语言混合分类语言标题词语言标题词语言单元词语言单元词语言关键词语言关键词语言叙叙 词语言词语言(一)分类语言(一)分类语言v分分类类语语言言是是根根据据一一定定的的观观点点,以以科科学学分分类类为为基基础础,文文献献内内容容的的科科学学性性质质为为对对象象,按按照照知知识识门门类类的的逻逻辑顺序来组织和检索文献的一种语言工具。辑顺序来组织和检索文献的一种语言工具。按学科体系的层次,从上到下,从总到分,

8、逐级按学科体系的层次,从上到下,从总到分,逐级展开,各级类目一一列举。展开,各级类目一一列举。 中 国 图 书 馆 分 类 法 简 表基本部类将图书分为社会科学、自然科学、综合三大类。将图书分为社会科学、自然科学、综合三大类。社科社科自然科自然科学学自然科自然科学学O 数理科学和化学数理科学和化学 O1 数学数学 O11 古典数学古典数学 O119 中国数学中国数学 O12 初等数学初等数学 O13 高等数学高等数学 O14 数理逻辑、数学基础数理逻辑、数学基础 O15 代数、数论、组合理论代数、数论、组合理论 O17 数学分析数学分析 O171 分析基础分析基础 O172 微积分微积分 O1

9、72.1 微分学微分学 O172.2 积分学积分学 O173 无穷级数论(级数论)无穷级数论(级数论) O174 函数论函数论 O175 微分方程、积分方程微分方程、积分方程 O176 变分法变分法 O177 泛函泛函 O178 不等式及其他不等式及其他 O3力学力学 O4 物理学物理学 O6 化学化学 O7 晶体学晶体学分类标识即分类号由字母分类标识即分类号由字母和数字组成和数字组成采用等级列举表达采用等级列举表达从属关系从属关系上位类目一定能包含其各个下位类目,上位类目一定能包含其各个下位类目,下位类目一定带有上位类目的属性。下位类目一定带有上位类目的属性。F2 经济计划与管理经济计划与管

10、理 TQ03 化学反应过程化学反应过程 F27 企业经济企业经济 TQ031 一般化学反应过程一般化学反应过程 TQ031.2 合成合成F276 各种企业经济各种企业经济 TQ031.3 分解、裂化分解、裂化F276. 4 联合企业经济联合企业经济 F276. 41 部门间经济综合体部门间经济综合体 TQ032 催化反应过程催化反应过程F276. 42 科研生产联合企业科研生产联合企业 TQ033 生物化学过程生物化学过程F276. 43 合资经营企业合资经营企业分类号越长,表示的学科范围越窄。分类号越长,表示的学科范围越窄。类、类目共同属性的集合一类事物的概念TG44焊接工艺441一般方法4

11、42熔焊443电焊444电弧焊445埋弧焊(焊剂层下焊)446气焊447电铆焊 下位类同位类上位类 (二二)主题语言)主题语言1. 主题法主题法主题法是一种从主题法是一种从文献内容角度文献内容角度标引和检索标引和检索信息资源的方法。信息资源的方法。以主题语言来描述和表以主题语言来描述和表达信息内容的信息处理方法称为主题法。达信息内容的信息处理方法称为主题法。主题语言又可分为主题语言又可分为标题标题语言语言、元词、元词语言语言、叙词叙词语言和语言和关键词关键词语言语言。2.主题检索语言 标题语言标题法是一种以标题词作为主题标识来反映文献信息内容的一种主题法。标题词必须统一和规范。美国国会标题表单

12、元词语言单元词法,也叫元词法,是以元词为主题标识,通过字面组配的方式字面组配的方式表达信息资源主题的主题法。所谓元词是用来标引信息资源主题的、最基本的、字面上不可再分的语词。 叙词语言叙词,国内亦称主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言。 关键词语言关键词语言是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。4 信息检索的方法和途径信息检索的方法和途径(一一)信息检索方法的类型信息检索方法的类型1常用法(工具法)常用法(工具法)(1)

13、顺查法)顺查法(2)倒查法)倒查法(3)抽查法)抽查法2回溯法(引文法)回溯法(引文法) 回溯法,也称为引文法,是利用文献末尾所回溯法,也称为引文法,是利用文献末尾所附的参考文献或引用文献,由近及远(由附的参考文献或引用文献,由近及远(由现在到过去)地进行追踪检索。现在到过去)地进行追踪检索。3循环法(分段法)循环法(分段法) 循环法,是综合常用法和回溯法的检索方法,循环法,是综合常用法和回溯法的检索方法,即在检索文献信息时,既利用成套的检索即在检索文献信息时,既利用成套的检索工具检索,又利用原始文献后所附的参考工具检索,又利用原始文献后所附的参考引用文献进行回溯,分阶段按周期地交替引用文献进

14、行回溯,分阶段按周期地交替使用,也称为分段法。使用,也称为分段法。循环法的具体操作可以采用两种方式。循环法的具体操作可以采用两种方式。 (1)首先使用常用法,然后使用回溯法,不)首先使用常用法,然后使用回溯法,不断循环交替。断循环交替。 (2)首先使用回溯法,然后使用常用法,不)首先使用回溯法,然后使用常用法,不断循环交替。断循环交替。(二)文献检索途径(二)文献检索途径u文献的检索途径是根据文献的描述内容来确定的。u检索路径主要包括以文献的外部特征进行检索的基本途径(如文献的名称、作者、出版信息等)和以文献的内容特征进行检索的主流检索途径(即分类法和主题法)。(1)外部特征途径u文献的外部特

15、征,是从文献检索载体的外表上标记的可见的特征,如题名(书名、刊名、篇名)、责任者(作者、编者、译者、专利权人、出版机构等)、号码(文献原有序号、标准号、专利号、报告号、索书号等)。(1)外部特征途径 文献名称途径:书、刊、杂志、文章名 著者途径: 代码检索途径u代码检索途径是以某些文献所具有的特指或特定的代码为线索开展检索的途径。(2)内容特征途径u文献的内容特征,是从文献所载的知识信息中隐含的、潜在的特征,如分类、主题等。u以文献的内容特征作为检索途径适用于检索未知线索的文献。(2)内容特征途径 分类途径u分类途径是以文献所反映的内容所属学科的分类体系为线索开展检索的途径。(2)内容特征途径

16、 主题途径u主题途径是以文献所反映的主题内容为线索开展检索的途径。u是把每一个文献(一本书、一篇论文、一件专利等)中的能够体现文献主题概念、事物特征、具有实际意义的词语抽取出来,作为检索标识供大家检索,从而使得用户可以从不同学科背景、不同检索需求出发,检索到同一主题的所有文献。(3)其他检索途径u还有一种根据引证关系建立起来的检索途径,即引文途径(见下面引文法)。u在进行文献检索时,检索途径的最终选择既受课题已知条件和课题检索深度的影响,同时更取决于检索系统已经为我们提供的各种检索入口。要取得既完善又准确的检索结果,正确地选择检索途径是很关键的;同时,用户所具有的数据库知识、检索技能以及对检索

17、目标的把握情况也是非常重要的。1.分析待查项目,明确主题概念2.选择检索工具3.确定检索途径和检索标识4.查找文献线索,索取原文5 信息检索的步骤信息检索的步骤6 检索结果的评价u检索效果指利用检索系统或工具检索信息资源的有效程度,直接反映了检索系统的检索性能及能力,是评价一个检索系统性能和用户检索策略的质量标准。(一) 信息检索的基本要求信息检索的基本要求就是要用最少的时间和精力,快速获取所需的文献信息,同时检出的文献要全面、准确。u全面:是根据课题需要,将有关文献尽可能地全面检索出来,尽量做到系统、完整、无重大遗漏,也就是要提高查全率。u准确:要对检出的文献进行严格筛选,信息内容要准确可靠

18、,使其符合课题需要,力求避免查出与课题无关的文献,也就是要提高查准率。(二) 检索结果的评价u信息获取后,要认真分析、比较、概括和综合,以保证信息的真实性、准确性。u当检索结果显现太多和研究课题不相关的记录、显现太少和研究课题相关的记录或没有和课题相关记录时,必须重新思考并建立检索命题,对检索策略进行优化、缩检或扩检。u然后对检索结果进行组织整理:检出的资料是否与研究主题相关?是学术性文章,还是通俗性文章?是否新颖?资料是否具有权威性?是否可信?(二) 检索结果的评价u衡量检索效果有两个主要指标,即查全率和查准率分别用字母R和P表示。1查全率查全率指系统实施检索时检出的与某一检索提问相关的信息

19、资源数与检索系统中与该提问相关的实有信息资源总数之比。表示为:查全率(R)=(检出有关信息资源量/系统中有关信息资源总量)100%2查准率查准率也称检准率、相关率、检索精度,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。表示为:查准率(P)=(检出有关信息资源量/检出信息总量)100%2查准率u查准率是反映检索系统排除与检索提问无关信息资源的能力。u研究表明:世界上最好的搜索引擎其查全率也只有45%,查准率更低。对于一个检索系统来讲,查全率和查准率往往不可能两全其美:查全率高时,查准率低;查准率高时,查全率低。3查全率和查准率的局限性u查全率的局限性主要表现在:

20、它是检索出的相关信息量与检索系统中的全部相关信息量之比,但系统中相关信息量究竟有多少一般是不确知的,只能估计;另外,查全率或多或少具有“假设”的局限性,这种“假设”是指检索出的相关信息对用户具有同等价值,但实际并非如此,信息的相关程度在某种意义上比它的数量重要得多3查全率和查准率的局限性u查准率的局限性主要表现在:如果检索结果是题录式而非全文式,由于题录的内容简单,用户很难判断出检索到的信息是否与课题密切相关,必须找到该题录的全文才能正确判断出该信息是否符合检索课题的需要;同时,查准率中所讲的相关信息也具有“假设”的局限性。4. 提高检索效果的措施(1)选择质量较高的检索工具评价检索工具的优劣主要看它的存储功能和检索功能,即“全”“便”“新”。(2)提高检索者的检索水平u检索者的检索水平是提高检索效率的核心因素u检索者应具备一定的检索语言知识,能正确理解检索课题的实质要求,选取正确的检索词,并能合理使用逻辑组配符完整地表达信息需求的主题;u还要能灵活运用各种检索方法和检索途径,制定最优的检索策略;同时在检索过程中采用严谨的科学态度,耐心细致地检查检索步骤的各环节,以减少人为的错检和漏检。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号