科技文献检索第二章检索基础知识.ppt

上传人:工**** 文档编号:568336391 上传时间:2024-07-24 格式:PPT 页数:45 大小:2.37MB
返回 下载 相关 举报
科技文献检索第二章检索基础知识.ppt_第1页
第1页 / 共45页
科技文献检索第二章检索基础知识.ppt_第2页
第2页 / 共45页
科技文献检索第二章检索基础知识.ppt_第3页
第3页 / 共45页
科技文献检索第二章检索基础知识.ppt_第4页
第4页 / 共45页
科技文献检索第二章检索基础知识.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《科技文献检索第二章检索基础知识.ppt》由会员分享,可在线阅读,更多相关《科技文献检索第二章检索基础知识.ppt(45页珍藏版)》请在金锄头文库上搜索。

1、n2.12.1 检索定义检索定义n2.22.2 检索语言检索语言n2.32.3 检索系统检索系统n2.4 2.4 检索方法检索方法n2.52.5 检索步骤检索步骤n2.6 2.6 检索效率检索效率2.1.1 2.1.1 文献检索概念文献检索概念文献检索文献检索 广广义义上上讲讲包包括括文文献献信信息息的的存存储储和和检检索索两两个个过过程程。狭狭义义是是指指有有目目的的地地开开展展对对于于经经过过有有序序化化后后的的文文献献信信息息的的集集合合体体所所开开展展的的查查找找活活动动及及过程。过程。文献检索文献检索存储存储检索检索存储:是对信息进行著录、标存储:是对信息进行著录、标引、整序,编制检

2、索工引、整序,编制检索工具和建立检索系统的过程。具和建立检索系统的过程。检索:是指面向信息需求检索:是指面向信息需求而进行高度选择性的查找而进行高度选择性的查找过程。过程。信息存储与检索过程图信息存储与检索过程图文献文献信息信息分析分析检索检索课题课题文献文献信息信息特征特征检索检索提问提问信息信息分析分析著录著录标引标引选用选用检索检索语言语言和和名称名称规范规范文献信息文献信息标识标识(检索项)(检索项)检索提问检索提问标识标识(检索词)(检索词)形成形成形成形成检检索索系系统统输入输入检索检索检检索索结结果果输出输出存储过程存储过程检索过程检索过程2.1.2 信息检索的原理 文献检索的过

3、文献检索的过程就是程就是检索提问检索提问标识标识与存储在检与存储在检索工具中的索工具中的著录著录标引标识标引标识相相匹配匹配的过程的过程. .2.1.3 检索的类型2.2 检索语言 信息检索语言(信息检索语言(Retrieval languageRetrieval language)是用来)是用来描述文献的内容特征、外表特征和表达用户信描述文献的内容特征、外表特征和表达用户信息提问的一种专门语言。息提问的一种专门语言。n当存储信息时,当存储信息时,检索系统对文献内容进行分析,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的词语,并赋概括分析出若干能代表文献内容的词语,并赋予一定的标识

4、,如题名、著者、主题词等,作予一定的标识,如题名、著者、主题词等,作为存储与检索的依据,然后被纳入到数据库中。为存储与检索的依据,然后被纳入到数据库中。 当检索信息时当检索信息时,检索人员首先要对检索课题进检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的词语,行分析,同样形成若干能代表信息需求的词语,然后通过检索系统在数据库中匹配具有同样词然后通过检索系统在数据库中匹配具有同样词语和标识的文献,找到自己所需要的信息。语和标识的文献,找到自己所需要的信息。信息检索语言信息检索语言2.2.1 分类语言n分类语言分类语言又称分类法,是将文献主又称分类法,是将文献主题概念按知识学科性质进

5、行分类和系统排题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的列,并用号码(分类号)表达各种概念的检索语言,包括检索语言,包括体系分类法体系分类法和组配分类法。和组配分类法。n 中国图书馆图书分类法中国图书馆图书分类法n 中国科学院图书馆图书分类法中国科学院图书馆图书分类法n 中国人民大学图书馆图书分类法中国人民大学图书馆图书分类法n 美国国会图书馆分类法美国国会图书馆分类法n 杜威十进位分类法杜威十进位分类法 中国图书馆分类法中国图书馆分类法T 工业技术工业技术TP 自动化技术、计算机技术自动化技术、计算机技术 TP1自动化基础理论自动化基础理论 TP2 自动化技术及

6、设备自动化技术及设备 TP3计算技术、计算机技术计算技术、计算机技术 TP30一般性问题一般性问题 TP31计算机软件计算机软件 TP311程序设计、软件工程程序设计、软件工程 TP311.1程序设计程序设计 TP311.11程序设计方法程序设计方法 TP311.12数据结构数据结构 TP311.13数据库理论与系统数据库理论与系统 TP311.131数据库理论数据库理论 TP311.132数据库系统:按类型分数据库系统:按类型分 TP311.132.1层次数据库层次数据库 TP311.132.2网络数据库网络数据库 TP311.132.3关系数据库关系数据库 TP311.132.4面向对象的

7、数据库面向对象的数据库 . TP6射流技术射流技术 TP7遥感技术遥感技术 TP8远动技术远动技术杜威十进分类法杜威十进分类法 ( DDC DDC ) 1873年美国图书馆学家杜威所创,目年美国图书馆学家杜威所创,目前该分类法已经被翻译成前该分类法已经被翻译成30多种语言,多种语言,在全球超过在全球超过135个国家的个国家的 20多万个图多万个图书馆使用,在美国,书馆使用,在美国,95%的公共图书的公共图书馆,馆,25%的学院图书馆大学图书馆以的学院图书馆大学图书馆以及及20%的专门图书馆使用该分类法。的专门图书馆使用该分类法。杜威十进分类法 ( DDC ) 310 普通统计学普通统计学000

8、 总类总类 320 政治学政治学 371 学校管理、学校管理、100 哲学类哲学类 330 经济学经济学 特殊教育特殊教育200 宗教类宗教类 340 法律法律 372 初等教育初等教育300 社会科学类社会科学类 350 公共行政管理公共行政管理 373 中等教育中等教育400 语言类语言类 360 社会机构社会团体社会机构社会团体 374 成人教育成人教育500 纯科学类纯科学类 370 教育教育 375 课程课程600 应用科学类应用科学类 380 商务、通讯、运输商务、通讯、运输376 妇女教育妇女教育700 艺术类艺术类 390 习俗、礼仪、民俗习俗、礼仪、民俗 377 学校与宗教学

9、校与宗教800 文学类文学类 378 高等教育高等教育900 地理历史类地理历史类 379 政府法规政府法规 管理与资助管理与资助分类语言的特点分类语言的特点n(1 1)分类法符合人们认识事物的规律和处理事物)分类法符合人们认识事物的规律和处理事物的习惯。的习惯。n(2 2)由于分类法是按学科、专业集中文献,能系)由于分类法是按学科、专业集中文献,能系统地揭示文献内容特征,因此能够实现族性检索,统地揭示文献内容特征,因此能够实现族性检索,获得较高的查全率。获得较高的查全率。n(3 3)便于组织图书资料的排架。)便于组织图书资料的排架。n(4 4)分类检索语言是一种先组式语言,不能随时)分类检索

10、语言是一种先组式语言,不能随时修改补充。修改补充。2.2.2 2.2.2 主题语言主题语言n主题语言主题语言主题语言主题语言,也称主题法,是一种用,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、索系统的检索语言。主题语言又分为标题词语言、单元词语言、单元词语言、关键词语言关键词语言和和叙词语言叙词语言。n主题词就是指以规定概念为基准,经过规范化和主题词就是指以规定概念为基准,经过规范化和优先处理后,具有组配功能、能够显示词间语义优先处理后,具有组配功能、能够显示词间语义关系动态性的词或词组。关

11、系动态性的词或词组。n主题检索适合特性检索,系统性不强主题检索适合特性检索,系统性不强。n关键词语言关键词语言 关键词语言关键词语言是直接选用文献信息中是直接选用文献信息中的自然语言作基本词汇,并将那些能够的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检自然语词作为关键词进行标引的一种检索语言。索语言。n叙词语言叙词语言 叙词语言是以自然语言词汇为基础,以概念组配叙词语言是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型

12、。信息检索语言类型。叙词又称描述词、叙述词,是以概念为基础,经叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。系显示功能,用以表达文献主题和检索需要的语词。 叙词语言的特点:直观,专指性强,组配性高,叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。结构严谨,标引能力强。叙词语言示例:叙词语言示例:汉语主题词表汉语主题词表、英国、英国科学科学文摘文摘使用的使用的INSPEC Thesaurus、美国、美国工工程索引程索引93年后使用的年后使用的Ei Th

13、esaurus等。等。2.3.1 2.3.1 文献检索系统定义文献检索系统定义 是指按某种方式、方法建立起来的供文是指按某种方式、方法建立起来的供文献信息用户查检文献信息及原始文献的一献信息用户查检文献信息及原始文献的一种有层次的体系,是表征有序的信息特征种有层次的体系,是表征有序的信息特征的集合体。的集合体。( (包括各种手工检索工具和各类包括各种手工检索工具和各类计算机检索系统计算机检索系统) ) 2.3 检索系统2.3.2 2.3.2 检索系统的类型检索系统的类型 1.1.目录目录 ( catalog )( catalog )它主要用于反映文献的出版它主要用于反映文献的出版情况或收藏情况

14、。情况或收藏情况。 目录是对目录是对一批相关文献外部特征一批相关文献外部特征的揭示和报道的揭示和报道。通常以一个完整的出版或通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。机构是否拥有所需图书、期刊等出版物。 目录类型:目录类型: 馆藏目录:馆藏目录:反映一个图书馆文献收藏情况的目录。反映一个图书馆文献收藏情

15、况的目录。 联合目录:联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。信息服务机构文献收藏情况的一种统一目录。 按出版类型按出版类型划分:图书目录、期刊目录、会议论文目录。划分:图书目录、期刊目录、会议论文目录。按物质形式划分按物质形式划分:卡片目录、书本目录、机读目录:卡片目录、书本目录、机读目录(MARC)、联机联机公公共检索目录共检索目录(OPAC ,Online Public Access Catalog )等。等。 OPAC :是指以计算机编码形式存贮在计算机是指以计算机编码形式存贮

16、在计算机系统内,供读者通过终端设备进行联机检索的系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。图书馆目录,即书目数据库的一种形式。 2. 2. 题录题录 ( bibliography )( bibliography )题录在揭示文献内容题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。的深度方面,比目录深入,但又比文摘简单。 题录是题录是单篇文献外表特征单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。由一组著录项目构成一条文献记录。 题录的题录的著录项目著录项目一般有著者,

17、篇名及出处等,常以一个内容上独立的文献单一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。 示例示例1 1: 3. 3. 文摘文摘 ( abstract )( abstract )更有利于用户判断检索结果更有利于用户判断检索结果的准确性。的准确性。 文摘是指对一份文献(或称一个文献单元)的内容所做的简略、文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的准确的描述,文摘的著录项目著录项目除了著者,篇名及出处等外,还有表除了著者

18、,篇名及出处等外,还有表示文献内容特征的示文献内容特征的摘要。摘要。 4.4. 索引索引 ( index )( index ) 索引是对一组信息集合的有系统的指引索引是对一组信息集合的有系统的指引。索引是一种附索引是一种附属性的检索工具,通常称为辅助索引。属性的检索工具,通常称为辅助索引。索引具有便于检索,索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点揭示事物比较深入、全面、明细等方面的优点。 索引的用途在文献检索中体现得极为突出,科技文献数量索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大庞大、内容复杂多样,使用面广且频繁。虽

19、然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。的检索工具。 最常用的索引是主题索引、分类索引和著者索引等。最常用的索引是主题索引、分类索引和著者索引等。n目录:单位出版物目录:单位出版物n题录:单位出版物中的单篇文献题录:单位出版物中的单篇文献n文摘:单位出版物中的单篇文献文摘:单位出版物中的单篇文献n索引:单位出版物或单篇文献中的知识单索引:单位出版物或单篇文献中的知识单元元n检索工具的著录对象检索工具的著

20、录对象n手工信息检索工具的著录项目手工信息检索工具的著录项目n目录目录: : 出版物名称出版物名称-编著者编著者-出版项出版项附注附注项项n题录题录: : 题目题目/ /著者著者/出处出处n文摘文摘: : 题目题目/ /著者著者/出处、文摘出处、文摘n索引索引: : 知识单元知识单元-顺序号顺序号( (或页码或页码) )n期刊论文的文献出处:刊名、年、卷、期、期刊论文的文献出处:刊名、年、卷、期、页码页码( (三三) )文献检索系统的功能文献检索系统的功能 报道报道文献信息文献信息 存储存储文献信息文献信息 检索检索文献信息文献信息2.4 2.4 检索的方法检索的方法信息检索信息检索方方 法法

21、工具法工具法引文法引文法循环法循环法n2.4.1 2.4.1 工具法工具法n概念:利用文献检索系统(工具),根据概念:利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),名、作者姓名、主题词、分类号等等),进行系统而全面的文献检索的方法。进行系统而全面的文献检索的方法。n类型:顺查法、倒查法、抽查法类型:顺查法、倒查法、抽查法l2.4.2 2.4.2 引文法引文法l概念:利用文献后面的概念:利用文献后面的参考文献参考文献查查找信息的方法找信息的方法l特点:所检文献专指度较高、信息特点:所检文献专指度较高、信息

22、越来越旧、容易误导;在检索工具越来越旧、容易误导;在检索工具短缺时采用此法短缺时采用此法 . .n2.4.3 2.4.3 循环法循环法n概念:工具法和引文法交替使用的检索方概念:工具法和引文法交替使用的检索方法法 n特点:优势互补特点:优势互补n 了解课题发展动态了解课题发展动态 选择信息检索方法的原则选择信息检索方法的原则 :n1 1、有检索工具时用工具法或循环法、有检索工具时用工具法或循环法n2 2、无检索工具时用引文法、无检索工具时用引文法n3 3、新兴学科或知识更新快的学科课题用倒、新兴学科或知识更新快的学科课题用倒查法查法n4 4、查全率要求高用顺查法、查全率要求高用顺查法n5 5、

23、已经掌握课题发展的规律特点用抽查法、已经掌握课题发展的规律特点用抽查法2.5 2.5 检索步骤检索步骤n分析检索课题,明确检索要求分析检索课题,明确检索要求n选择检索工具,确定检索途径选择检索工具,确定检索途径n确定检索标识,确定检索运算确定检索标识,确定检索运算n构筑检索提问,获取初步结果构筑检索提问,获取初步结果n调整检索策略,获取所需信息调整检索策略,获取所需信息2.6 2.6 检索效果的评价及其优化检索效果的评价及其优化 检索效果评价的意义检索效果评价的意义 (1) (1) 提高检索效率提高检索效率 (2) (2) 改善系统性能改善系统性能 检索效果评价的指标检索效果评价的指标 评价检

24、索效果的常用指标有:评价检索效果的常用指标有:查全率(查全率(Recall ratioRecall ratio)-用用R R表示表示查准率(查准率(Precision ratioPrecision ratio)用用P P表示表示漏检率(漏检率(Omission ratioOmission ratio)-用用O O表示表示误检率(误检率(Fall-out ratioFall-out ratio)-用用F F表示表示 高查全率和查准率是人们在检索活动中高查全率和查准率是人们在检索活动中通常所追求的目标。通常所追求的目标。n查全率查全率 查查全全率率是是指指被被检检出出的的相相关关文文献献量量与与系

25、系统统文文档档中中实实有有的的相相关关文文献献量量之之间间的的比比率率。它它是是衡衡量量信信息息检检索索系系统统收收录录内内容容及及其其用用户户检检索索结结果果的的完完整整程程度度的的指指标标。可可用下式表示:用下式表示: 被检出相关文献量被检出相关文献量查查 全全 率率 ( R R) = = 100% 100% 系统中相关文献总量系统中相关文献总量n 查准率查准率 查查准准率率是是指指检检出出的的相相关关文文献献量量与与检检出出文文献献总总量量之之间间的的比比率率。它它是是衡衡量量信信息息检检索索系系统统收收录录内内容容及及用用户户检检索索结结果果精精确确度度的的尺尺度。可用下式表示:度。可

26、用下式表示: 检出相关文献量检出相关文献量 检准率(检准率(P P)= 100%= 100% 检出文献总量检出文献总量影响用户查全率与查准率的不良因素影响用户查全率与查准率的不良因素 (1 1) 对检索目标把握不准确对检索目标把握不准确 (2 2) 对检索系统选择不洽当对检索系统选择不洽当 (3 3) 检索词和逻辑组配不当检索词和逻辑组配不当 (4 4) 检索途径和方法选择不当检索途径和方法选择不当 (5 5) 系统功能不熟悉、检索技能不熟练系统功能不熟悉、检索技能不熟练检索效果的优化手段检索效果的优化手段 n 提高检索系统的功能提高检索系统的功能 n 提高数据库的质量提高数据库的质量 n 提

27、高检索人员的素质提高检索人员的素质 n 优化检索策略优化检索策略 提高查全率的主要方法提高查全率的主要方法(1) (1) 准确把握检索对象及目的准确把握检索对象及目的, ,选择合适的数据库。选择合适的数据库。(2) (2) 降低检索词或分类号的专指度。降低检索词或分类号的专指度。(3) (3) 更多地采用学科分类途径来扩大检索范围。更多地采用学科分类途径来扩大检索范围。(4) (4) 减少逻辑减少逻辑“与与”及逻辑及逻辑“非非”的使用。的使用。(5) (5) 增加逻辑增加逻辑“或或”及截词检索技术的使用。及截词检索技术的使用。(6) (6) 采用采用“全文检索全文检索”。(7) (7) 不限定

28、检索对象的文献类型、时间段、文种等。不限定检索对象的文献类型、时间段、文种等。 提高查准率的主要方法提高查准率的主要方法(1) (1) 准确把握检索对象及目的准确把握检索对象及目的, ,选择合适的数据库。选择合适的数据库。(2) (2) 提高检索词或分类号的专指度。提高检索词或分类号的专指度。(3) (3) 更多地采用专用名词及特性检索的途径。更多地采用专用名词及特性检索的途径。(4) (4) 选择逻辑选择逻辑“与与”及逻辑及逻辑“非非”的使用。的使用。(5) (5) 减减少少或或不不采采用用逻逻辑辑“或或”及及截截词词检检索索技技术术的的使使用。用。(6) (6) 限限定定检检索索词词出出现现的的字字段段及及在在段段落落、文文句句中中的的位位置。置。(7) (7) 不选不选“全文检索全文检索”. .(8) (8) 限定检索对象的文献类型、时间段、文种及其限定检索对象的文献类型、时间段、文种及其它特征。它特征。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号