研究生-信息检索概论讲义资料

上传人:yulij****0329 文档编号:141772000 上传时间:2020-08-12 格式:PPT 页数:77 大小:2.63MB
返回 下载 相关 举报
研究生-信息检索概论讲义资料_第1页
第1页 / 共77页
研究生-信息检索概论讲义资料_第2页
第2页 / 共77页
研究生-信息检索概论讲义资料_第3页
第3页 / 共77页
研究生-信息检索概论讲义资料_第4页
第4页 / 共77页
研究生-信息检索概论讲义资料_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《研究生-信息检索概论讲义资料》由会员分享,可在线阅读,更多相关《研究生-信息检索概论讲义资料(77页珍藏版)》请在金锄头文库上搜索。

1、医学 文献检索与利用 范晓磊 ,教学进度:课程安排 教学大纲:课程性质和特点、要求与目标、教 学法等,信息检索基础 学习目标 1.掌握信息、情报、文献、知识的基本概念 2.了解文献的类型、特点 3.知道数据库的类型与结构 4.掌握信息检索的途径、步骤 5.理解检索式的编写与检索策略的调整 6.熟悉信息网络技术与网络信息检索,1.1 信息的概念 信息information 定义1:信息是物质运动规律总和,即不是物质,也不是能量。 定义2:信息论的创始人申农(Shannon )认为:“信息是能 用来消除不确定性的东西”或“信息是确定性的增加” 。 定义3:信息是客观事物状态和运动特征的一种普遍形式

2、。 信息的定义和分类都不确定,不同的定义从不同的角度帮助,理解信息。,1.2 信息的特性 信息区别于物质与能量,并具有与物质及能量同等的重 要作用,是因为其特性。物质与能量在使用过程中会被消 耗,但又遵守守恒定律;而信息在传递和使用过程是,可反 复使用,并可通过信息的加工处理而产生信息增值。 普遍性:信息是事物运动的状态和状态变化的方式。只要有 事物的地方,就必然的存在信息。信息在自然界和人类社会 活动中广泛、普遍存在。 传递性:信息在事物之间的相互联系必定在信息流动中发生。 信息的传递性表现在人与人之间的信息交换,人与机器、机 器与机器之间的信息交换,动物与植物间的信号交换。 信息的传递和流

3、通过程是一个重复使用的流通过程,信 息的占有者不会因传递信息而失掉信息,也不会因多次使用 改变信息的自身价值。这一点与信息的共享性相关。 同时,信息的传递,在广义上来讲,包含反馈。(例),依存性:信息总是依附于一定的物质载体而存在,需要某种 物质承担者。信息必须依附于一定的物质形式上(如声波、 电磁波、纸张、化学材料、磁性材料等),不可能脱离物质 而单独存在。 相对性:客观上信息是无限的,但对于信息用户来说,人们 实际获得的信息问题有限的。同一信息对不同认知水平的用 户所产生的作用和有效性也不同。 可加工性:信息可以加工处理,可以压缩、扩充和叠加,也 可以变换形态。在流通和使用过程中,经过综合

4、、分析、再 加工,大量的原始医药信息可以变成医学文摘数据库和,时效性:由于信息的动态性,那么一个固定的信息 的使用价值必然会随着时间的流逝而衰减。在现代 社会中,信息的使用周期迅速缩短,信息的价值实 现也很大程度上取决于及时把握和运用信息(天气 预报、经济信息、股票大盘等)。不能及时地使用 最新信息,信息的价值就会随其滞后使用的时差而 差值或贬值。 可共享性:信息与物质,能量显著不同的是。信息 在传递过程中并不是“此消彼长”,同一信息可以在 同一时间被多个主体共有,而且还能够无限的复制、 传递,它可以共享。,1.3 信息的作用 信息在人类社会和科技发展中具有重要作用。 信息是人类认识客观世界及

5、其发展规律的基 础。信息的基本功能,主要表现为信息的认 识功能。 信息是科学研究的必要备件。 信息是管理和决策的主要参考依据。 信息是社会发展的资源。,2. 知识、情报和文献 知识:来源于信息,存储于人类的大脑中。现代 汉语词典:知识是人们在改造世界实践中所获得 的认识与经验的总结。 知识包括:技术知识、科学知识、经验知识,关于 知识的知识,及对面临的问题做出判断并提出解决 方案的知识。 OECD的四类知识:what, why, how, who 显性知识(科学理论、数据公式、自然规律等)与 隐性知识(外科医生的经验、领导的决策能力、“我 爸是李刚”),情报:是指传递着的在特定效用的知识。 辞

6、源:“定敌情如何,而报于上官者”为情报。 辞海:“战时关于敌情之报告,曰情报。 知识性:根据知识的定义和特性,知识去除了糟粕 的信息,并且具有可实践性。 传递性:没有被激活的知识只能发挥知识的价值, 而不能体现情报的价值。 效用性:情报最大的特点是可以发挥比其作为知识,更为巨大的作用。,文献:记录有知识的一切载体。 文献本身并不是知识,其包含的内容才是知 识。 文献要素:知识内容、信息符号、载体材料。 信息符号、载体材料和记录方式都影响知识 内容的获取和利用。,概念间的关系:知识来源于信息,情报是特 定的知识。,情报,知识 信息,信息、知识、情报、文献四者的关系,认识,激活,信息,知识,情报,

7、检索 记录 文献,3. 信息源,个人为满足其信息需要而获得信息的来源,3.1 信息类型 保存性:正式与非正式 时间:先导(天气预报)、实时(现场直播)、滞后(报纸) 表现形式:文字、图像、数值、语音 出版类型:图书、期刊论文、科技报告、专利文献、会议文献 政府出版物、学位论文、标准文献、产品样本、科技档案 产生次序和加工程度(重要):零次、一次、二次、三次信息 理解各层次信息的含义,根据各层次信息的特点能够判 断不同出版类型的信息、文献分别属于什么层次的信息和文 献。,4. 信息交流和信息素养 4.1 信息交流 噪音 去除噪音 信源信道处理与控制信宿 反馈,4.2 信息需要 指人们在从事各项实

8、践活动的过程中,为解决所遇到的问,题而产生的对信息的需求。是信息行为发生的基础。,信息需要的特征,信息需要的层次(重要):未知的信息需要、潜在的信息需要,和现实的信息需要。 通过对信息需要层次的理解,能够判断自己或他人的信息需 要的层次。,4.3 信息行为:信息的检索、选择和利用。 4.4 信息动机:是信息行为发生的根本动力。 在信息交流中,信息需要和信息动机促使信 息行为的发生,并完成信息的交流。,5 信息素养 5.1 信息素养(information literacy)概念 是指判断何时、何地需要信息,并有效的定位、 获取、评价和利用信息的一系列能力的总和。 包括:计算机素养、因特网素养、

9、媒体素养、 图书馆素养、研究素养、批判性思考的能力。,信息素养主要体现在: 信息意识:是人们对信息需求的自觉反映,即对信 息的捕捉、分析、判断和吸收的敏感性。 信息能力:是人们有效快速的获取加工存储利用和 传递信息的能力。 信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的社会 法律法规和行为准则。,5.2 美国大学与研究图书馆协会(ACRL)制定的高等教 育信息素养五大标准 1)能够独立决定所需要的信息种类和程度 独立意味着在获取信息资源的过程中个人可以 决定所需要的信息种类和程度,表现为主动学习、 自主吸纳知识的过程。 书、刊、学位论文、会议论文、专利、

10、标准 背景信息概念、事实、数据 摘要信息题目、标题、文摘、参考文献,全文信息观点、方法、结论、理论(电子、印刷的),2)能够高效地获取所需信息 高效意味着能选用最适当的查找方法或检 索系统来建构完善的检索策略,获取所需信 息。 分类法、主题法、题名法、关键词法、作者法、 机构法、组配法 综合性、专业性、单一性 熟悉所在学科领域的 主要信息源,3)能够根据现有的知识背景和评价标准对信 息及其来源进行评价及遴选 在分析信息的基础上熟练地、批判性地评价信 息,有效吸收、存储和快速提取信息,能从所收 集的信息中概括出信息的中心思想,并能依据研 究问题的要求来评价信息及其来源,提取出权威 性的、经典的和

11、具有创新理念的观点及其它发 现,同时能在构建新的假设中查找补充所需信,息,对新旧信息进行整合和综述。,4)能有效地利用信息达到某一特定的目的 有效地利用信息意味着为达到某一特定的 目的,在信息查找、获取、评价、补充的知 识积累基础上,将文献中的主要观点、思想 及相应事实数据等应用于自己有利于目的实 现的表现形式,如学位论文、调查报告等, 以此来与他人进行有效的交流。,5)能够在信息利用过程中遵守相关的法律法 规 具备信息素养能力的人应了解与信息利用有关 的道德、法律和社会经济问题,并能遵守法律、规 章制度和有关获取与使用信息资源的行为规范。 知识产权与版权、信息法 、电子资源恶意下载 与非法使

12、用 、正确引用 、信息的无偿服务与有偿 服务。,6 信息检索 6.1 信息检索概念 是从任何信息集合中识别和获取所需信息的 过程及其所采取的一系列方法和策略。,广义的信息检索包含信息存储与检索,6.2 信息检索类型 存储及内容:文献信息检索、数据信息检索、事实信息检索。 组织方式:全文检索、超文本检索和超媒体检索。,7 信息检索系统 7.1 信息检索系统 信息检索系统是信息检索的本质。信息检索系统 根据文献特征信息(题名、著者、出版者、出版 年、文献来源信息、文献原始编号、主题内容) 按照一定的逻辑组织文献。 检索系统对包含的信息进行描述,形成记录,通 过这些描述提供检索途径,并使记录有序化。

13、 检索途径的两个因素:检索标识和可检序列,检索标识:自然语言与情报语言 自然语言:情报检索中指文献作者或文摘提要的 作者原来使用的语言。 不足之处:由于是日常口头、书写所用的各种语 言。所以 (1)不能简洁与专指地表达概念(2) 语词与概念不能一一对应(3)不能反映概念之间 的关系(4)无法进行系统排列(5)标引用语与 自然语言的相符性差。,7.2 情报检索语言 是一种人工语言,根据规则编制而成,规则预先 明确规定。由词汇和语法组成。 分类检索语言:中国图书馆学分类法,科图法 主题检索语言:MeSH,EMTree 代码检索语言,情报检索语言的特点(对比自然语言) 对文献内容加以标引,主题概念表

14、达规范。 对相同及相关内容加以集中或揭示其相关性。 对大量情报加以系统化或组织化。 便于将标识用语和检索用语进行相符性比较。,7.2.1 医学主题词表 常用 美国医学主题词表MeSH 荷兰医学文摘的主题情EMTree 中国中医药学主题词表 情报检索语言的特点(对比自然语言),组成 字顺轮排表(索引) 是将主题词表中主题词和入口词按一定顺序(字顺等)排列而成。 入口词:款目词,包括主题词的同义词、近义词、缩略语、不同拼写 方式,倒装或顺装以及已经取消而意义相近的主题词。 树状结构表(范畴表) 将全部主题词按内容分为15个类目,各类主题词按各主题词内涵范围 的大小逐级排列,形成树状结构。 上下位概

15、念:上位词的范围大,下位词的范围小,扩展检索是指某主 题词所有下位主题词标引的全部文献都检出。,副主题词(关联词):使用时有明确规定,必须 遵循其定义与使用范围。 副主题词也有上下位关系,使用时应选择恰当, 以提高检全与检准率。,7.2.2 检索结果评价 检索效率,是概括表示情报检索系统质量的概 念,可以说明对情报检索系统各项性能的满意程 度。包含检准率(查准率)与检全率(查全 率),它们之间的关系是互逆相关的。 检全率检准文献/(检准的献漏检文献) 漏检率漏检文献/(检准的献漏检文献) 检准率检准文献/(检准的献误检文献) 误检率误检文献/(检准的献误检文献) 其他:检索速度、检索方便性与检

16、索成本也是需要,考虑的因素。,8 文献数据库与计算机检索技术 手工检索基本上用于对纸质文献的检索。而随着技 术的发展,文献被组织成各类型的数据库,计算机 检索技术也随之成为主流。 文献数据库:是指记录各种文献信息的数据库,计 算机可读、有组织的相关文献信息的集合。在文献 数据库中,文献信息以数字化方式,按一定的数据 结构,有组织地存储在计算机中,使计算机能够识 别和处理。,8.1 文献数据库类型 根据收录性质可分为:文献型、全文型、事实型。 文献数据库按内容分: 书目数据库(Bibliographic Databases) :存储文 摘、题录、目录等书目数据的一类数据库,又称为 二次文献数据库。 全文数据库(Full Text Databases) :以一次文献 形式直接提供文献全文。 混合数据库:即包含书目记录又包含有全文记录的 文献数据库。,其他类型参见教材P31,几种主要的文献数据库P3236 题录数据库 文摘数据库 图书馆馆藏目录数据库 全文数据库 光盘数据库 多媒体数据库 网络数据库(重要),文献数据库结构,文档(File) 顺排文档:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号