文献检索策略构建

上传人:xiao****1972 文档编号:73906091 上传时间:2019-01-26 格式:PPT 页数:43 大小:444.81KB
返回 下载 相关 举报
文献检索策略构建_第1页
第1页 / 共43页
文献检索策略构建_第2页
第2页 / 共43页
文献检索策略构建_第3页
第3页 / 共43页
文献检索策略构建_第4页
第4页 / 共43页
文献检索策略构建_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《文献检索策略构建》由会员分享,可在线阅读,更多相关《文献检索策略构建(43页珍藏版)》请在金锄头文库上搜索。

1、文献检索策略的构建,一、检索策略的构建,检索策略是根据检索课题的具体要求而制定的一套具体、合理的检索方案。 正确制定检索策略,优化检索过程,有助于取得最佳的检索效果。 检索策略的制定是否合理,以及在检索过程中能否根据实际情况随时修改原有的策略,使之 更加完善,都会直接影响检索结果。,分析检索课题,明确检索目的 选择检索方式和数据库 确定检索途径与检索标识 编制检索提问式 执行检索式 浏览检出文献,评价检索结果 调整检索策略 输出检索结果 转录、复印等,Yes,No,(一)分析研究课题,明确检索目的 分析研究课题的目的在于明确检索内容和 具体要求。为此,应对课题的背景、以知条件、 以及要解决的问

2、题及要求等进行认真分析,明 确所需文献的范围、类型、文种、时间、空间、 输出方式等。,(二)选择检索方式与数据库,1、检索方式(机检)的选择 1)脱机检索 2) 联机检索 3) 光盘检索 4) 网络检索,2 、数据库的选择 数据库是指在计算机存储设备上按一定 方式存储的相互关联的数据集合。 选择数据库时要充分考虑到: 学科专业范围是否适用; 收录的文献资料是否齐全; 揭示的文献特征是否准确和深入; 报道时间是否迅速; 使用的语种是否熟悉。等等。,1)数据库的类型 文献型数据库 书目型数据库(题录、文摘) 全文型数据库 事实型数据库 (PDQ等) 数值型数据库 (GenBANK,PTECS等)

3、图像型数据库 混合型数据库,2)数据库的结构 数据库的基本结构主要由文档、记录、字段三个层次构成。 文档(File) 数据库可以由一至多个文档构成。 文档按其编排结构和功能的不同,可分为顺排文档(Sequential file)和倒排文档(Inverted file)。,顺排文档是若干个记录构成的信息集 合。在书目型数据库中,它以文献记录作 为信息存储单元,按记录入藏的顺序号从 小到大排列。 它相当于印刷型检索工具的正文部分。,倒排文档是从顺排文档记录中抽取出 的、以每一个文献特征标识作为信息存储 单元,按一定顺序排列,并在每一个标识 后注明相应的文献记录顺序号。不同的文 献特征标识的组合就构

4、成了不同类型的倒 排文档。如著者倒排文档等。 它相当于印刷型检索工具的辅助索引 部分。, 记录(Record) 记录是构成数据库的一个完整的信息单元,由若干个字段构成。 每条记录都描述了与原始信息有关的各种特征,这些特征(字段)为判定检索结果是否符合检索需要提供了依据。 书目型数据库中的一条记录相当于一篇完整的文献;其他类型数据库中的记录则是某种信息单元,如一组理化指数、一种治疗方案等。,下面是MEDLARS系统中的MEDLINE数据库的 一条文献记录: AUGINGRASS DJ; MESSER RJ TI- A SIMPLIFIED THCHNIQUE OF INFEIOR BORDER

5、ABTHE INFERIOR BORDER WIRE, AS ORIGINALLY LA-ENG MH-*BONE WIRES; HUMAN; MANDIBLE/*SURGERY ADDEPARTMENT OF ORAL MAXILLOFACIAL SURGERY, MEDICAL COLLEGE OF WISCONSIN, MILWAUKEE. SO- ORAL SURG ORAL MED ORAL PATHOL 2002;81(4):264 , 字段(Field) 字段是构成记录的基本信息单元(数据项),是对原 始信息的具体属性进行描述的结果。书目型数据库中的字 段是描述文献内外特征的各项

6、标识内容,如标题字段、著 者字段、文摘字段等。 每个字段都有各自的字段标识符(field tag),以供 识别其所表达的文献特征,例如:标题字段的标识符为 TI、著者字段的标识符为AU等等。字段标识符也参与构建检索策略。 检索系统数据库文档记录字段,(三)确定检索标识与检索途径 确定检索途径取决于两方面的条件:一是待查课题的已知条件和检索内容的要求;二是使用的检索工具(数据库)所揭示的文献各种特征是否准确和深入。 不同学科、不同类型的检索工具采用不同的文献特征来标引文献,形成不同的检索标识而提供不同的检索途径。,1、文献检索语言(检索标识),文献检索语言(Document language是来

7、描述 文献特征和表达检索提问的专门语言,即根据检 索需要而创建的统一文献标引用语和检索用语的 一种人工语言。 检索语言既是汇集、组织、存储文献标准, 也是检索提问时所利用的手段及工具。,1)文献检索语言主要类型: 描述文献外表特征语言 书刊题名 著者姓名 文献序号 描述文献内容特征语言 分类语言 主题语言(主题词、关键词等) 代码语言,2)检索词典(Retrieval thesaurus) 检索词典是文献标引用语和检索用语的语源 和依据性文本。 它是对各学科中的名词术语、概念、代码、 分类号等进行规范化的记录,起着对检索语言规 范控制作用。 常见的检索词典是各种分类表和主题词表。 例如:中国图

8、书馆分类法和医学主题词表 (MeSH)/Thesaurus。,2、检索途径 (1)著者途径 这是利用已知著者姓名(团体机构名称)作 为检索标识进行查检文献的一种途径。 它适用于了解国内外某著者或团体机构所发 表的文献内容及其所研究课题的最新进展情况。 使用著者途径检索文献的关键在于熟悉著者 姓名在索引中的编排规则。(如姓名顺序、音译、排序),(2)分类途径 这是利用检索工具所采用的特定分类体系中 的分类号或分类类目作为检索标识进行查检文献 的一种途径。 它能较好地满足按类检索文献的要求,适用 于按学科概念检索文献。 使用分类途径检索文献的关键在于熟悉检索 工具所采用的特定分类法。,(3)主题途

9、径 这是根据能反映文献主要内容的主题(包括 主题词和关键词等)作为检索标识进行查检文献 的一种途径。 它具有较强的专指性和直接性的特点,适用 于查找内容比较具体、专一的文献。 使用主题途径检索文献的关键在于能够选准 代表所需文献主题内容的检索词。,*选用主题词时应注意的问题: 1. 选用主题词,应从事物的“专有名词”来考虑,不要从“过 程词”来考虑。如“肾结石的诊断” “肾结石/诊断” 2. 选用主题词的概念要恰如其分,不能太广或太狭。 3. 利用MeSH表或Thesaurus将非主题词转换成可供检索使 用的正式主题词。包括同义词、近义词、简称与繁称和 俗名与学名等。例如:cancer neo

10、plasms 怀孕 妊娠、子宫纤维瘤 子宫平滑肌瘤 4、要注意主题词的倒置形式。 过敏性休克 休克,过敏性,5. 主题概念的分析与转换 隐性主题分析 “为乳腺癌服务的工作组织” “癌监护组织” “办公室吸烟对他人有害” “吸烟污染” 主题概念分解转换 “胃十二指肠溃疡” 应转换成“胃溃疡”和“十二指肠溃疡”两个主题词 注意英文同义词(解剖名词)的主题词 胃 gastric ,stomach 、 心 heart, cardio- 眼 eye ,ocul-,ophathalm-、 肝 liver,hepat-,6. 没有相应主题词时,可采用靠词或上位词检索 靠词检索: “上消化道出血” “胃肠出血

11、”; “红细胞存活” “红细胞衰老” 上位词检索:“污水处理” “废弃物处理,液体” 7. 可使用副主题词与主题词进行组配 “肝疾病的早期治疗” “肝疾病/治疗” 8. 要注意主题词与副主题词组配范围的限定 肺/诊断 肺炎/诊断 9. 已有先组的主题词,不用组配 “维生素A缺乏症” “维生素A缺乏症”,“维生素A/缺乏症”,10. 不能越级组配 “胆囊炎的B超诊断” “胆囊炎/超声检查” “胆囊炎/诊断” 举例:“加压素治疗休克引起冠心病” 显性主题: 休克/药物治疗、 加压素/临床应用、 冠心病/化学诱导 隐性主题: 加压素/副作用,(四)编辑检索提问式 * 检索提问式是用户向检索系统表达文

12、献需求 的句式。检索提问式有简单提问式和复合提问式。 后者含有两个或两个以上的检索词,表达多维概念 的检索,要用检索运算符号相连接。 检索系统中常用的检索运算符号有以下几种: 1布尔逻辑运算符 用来表达检索词之间或检索词与检索式之间 的逻辑运算关系。这种概念组配是检索系统使用 最为广泛的检索技术。,常见的布尔逻辑运算符有“逻辑与”、“逻辑或”和“逻 辑非”3种,其符号分别为“and”、“or”和“not”(有的数据 库则分别用“*”、“+”和“-”或“and not”来表示)。它们的逻 辑运算关系如下图所示:,A,A,A,B,B,A,B,A and B 逻辑与,A or B 逻辑或,A not

13、 B 逻辑非,1)“逻辑与”运算 这是具有概念交叉关系或限定关系的一种组 配。它要求检索出的文献记录必须同时含有检索 词A和检索词B。 例如:“吸烟与肺癌的关系” 检索式为: 吸烟 and 肺癌 smoking and lung-neoplasms “逻辑与”的作用是缩小了检索范围,提高查准 率。,2)“逻辑或“运算 这是具有概念并列关系的一种组配。它要求 检索出的文献记录中含有检索词A,或者含有检索 词B,或者同时含有二者均为命中文献。 例如:“食欲亢进与过度饮食” 检索式为:食欲亢进 or 过度饮食 hyperphagia or overeating “逻辑或“的作用是扩大了检索范围,提高

14、查全率。,3)“逻辑非“运算 这是具有概念排除关系的一种组配。它要求检索出的 文献记录是在检索词A的记录中去掉含有检索词B的记录, 即排除了不希望出现的文献记录。 例如:“非儿童性白血病”,检索式为:白血病not儿童 “逻辑非“的作用是缩小了检索范围,提高查准率。 使用逻辑非运算符号须慎重,容易造成漏检。因为它 会把那些同时出现在检索词A和检索词B的记录排除在外。,在一个复合检索提问式中,各种布尔逻辑运算符是 按照notandor的次序运算。也可用()来改变运算 次序,以符合检索课题的逻辑关系。 例如: “用青霉素或红霉素治疗非儿童性肺炎” 检索提问式,应为: #1 青霉素 or 红霉素 #2

15、 肺炎 not 儿童 #3 #1 and #2 或者:#1(青霉素 or 红霉素)and(肺炎 not 儿童),2位置算符 位置算符是要求原始记录中检索词之间要满足某些 条件而使用的符号。 例如:检索式为A with B,则表示检索词A和检索词B 必须同时出现在同一记录中的同一字段内; 检索式为A near B,则表示检索词A和检索词B必须同 时出现在同一记录中的同一句子内。等等。 位置算符提高检索结果的准确性。它比“逻辑与”更专 指,是调整检索策略的一种重要手段。,3字段限制符 字段限定符是限制检索词在数据库记录中的特定字段范围内检索的一种符号。常见的字段 限定符有“in”或“”。 字段限定

16、检索的表达形式是:“检索词in字段 标记符”或者是“字段标识符检索词”。例如:hepatitis in ti 、张志 in au、la=English等 字段限定检索也是缩小检索范围、提高查准率的一种方式。,4.截词符 截词(Truncation)检索是利用截词符附加 在所截取检索词的局部进行检索的一种技术。它 具有将同一词干的词全部查出的功能,扩大检索 范围,提高查全率。 按截词的位置,截词检索有前截断、中截断、 后截断、前后截断四种方式,最常用的是后截断 检索。 不同的检索系统有不同的截词符,常用的截 词符有“?” 和 “”。,“ ?”是有限截词符(即“?”的数量就是替代被屏蔽字 符的数量),如输入“leukemi?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号