医药信息检索与利用:第一章 信息检索与利用概论

上传人:汽*** 文档编号:569714534 上传时间:2024-07-30 格式:PPT 页数:59 大小:1.20MB
返回 下载 相关 举报
医药信息检索与利用:第一章 信息检索与利用概论_第1页
第1页 / 共59页
医药信息检索与利用:第一章 信息检索与利用概论_第2页
第2页 / 共59页
医药信息检索与利用:第一章 信息检索与利用概论_第3页
第3页 / 共59页
医药信息检索与利用:第一章 信息检索与利用概论_第4页
第4页 / 共59页
医药信息检索与利用:第一章 信息检索与利用概论_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《医药信息检索与利用:第一章 信息检索与利用概论》由会员分享,可在线阅读,更多相关《医药信息检索与利用:第一章 信息检索与利用概论(59页珍藏版)》请在金锄头文库上搜索。

1、医药信息检索与利用医药信息检索与利用第一章第一章 信息检索与利用概论信息检索与利用概论第一节 信息学n一、信息(information)n 信息学是研究信息的获取、处理、传递和利用规律性的一门学科。n 20世纪中叶以后,信息的本质才被揭示,并被引入哲学、信息论、系统论、控制论、传播学、情报学、管理学、通信、计算机科学等域。n 站在不同的角度、不同的学科,对信息的定义是不同的。n行成成岭侧成峰,远近高低各不同第一节 信息学n据不完全统计,信息的定义有100多种,它们从不同的侧面、不同的层次揭示了信息的某些特征和性质。n1988年,我国信息论专家钟义信教授在其信息科学原理一书中把信息定义为:“事物

2、的运动状态和状态变化的方式”,被国内大多数教材采用。信息的解释n信息是通信的内容,是“两次不确定性的差异”,信息的多少反映了消除了的不确定性的大小。(申农)n信息:消除不确定性的因素信息论n信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行相互交换的内容的名称。(维纳) 第一节 信息学n(二)信息的特征n1. 普遍性:普遍存在n2. 传递性:消息交换,信息流动n信息传递四要素:信源:信息发出方n信宿:信息的接收方n信道:媒介n信息n信息的特征:n3 依存性 依附于一定的物质形式(声波,电磁波,纸张,化学,磁性材料)n4 相对性 对不同认知水平的用户产生的作用和有效性

3、不相同n5 可加工性 加工处理,压缩,分析,处理n6 时效性 及时有效的获取使用信息n7 可共享性发挥最大的效用第一节 信息学n(三)信息的作用n信息是人类认识客观世界及其发展规律的基础n信息是科学研究的必要条件n信息是管理和决策的主要参考依据n信息是社会发展的资源第一节 信息学n一、信息概述n(四)知识、情报和文献n1. 知识n定义 知识(knowledge)是人类社会实践的总结,是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人脑通过思维重新组合的系统化的信息集合。分为日常知识和科学知识。n信息通过人脑的接收、选择、整理和提炼等过程,形成各种各样的知识。知识的产生离不

4、开信息和信息传递,它是信息的一个重要组成部分。n三个特征:被证实的(justified),真的(true)被相信的(believed)第一节 信息学n一、信息概述n(四)知识、情报和文献n1. 知识n国际经济合作发展组织(OECD)对知识的分类被广泛接受。1996年OECD在一份报告中,把知识分为四类并分别作出说明。nKnow what (知道是什么)关于事实方面的知识。nKnow why(知道为什么)关于自然原理和规律方面的知识。nKnow how(知道怎么做)关于做事的技能或能力方面的知识。nKnow who(知道谁有知识)关于到哪里寻求知识的知识。第一节 信息学n一、信息概述n(四)知识

5、、情报和文献n2. 情报n定义: 情报(intelligence information)是传递着的有特定效用的知识。情报的基本属性是知识性、传递性和效用性。情报的本质是知识,但知识并不等于情报,知识只有传递给用户,能满足用户的特定需要才能成为情报。n属性:n情报的知识性n情报的传递性n情报的效用性信息是属概念,知识,情报是信息之下具有交叉关系的种概念第一节 信息学n一、信息概述n(四)知识、情报和文献n3. 文献n定义:文献(document)是一个发展的概念。n它最早出现与论语,南宋朱熹将其解释为:“文典籍也;献,贤也”。n今天文献的定义为:“记录有知识的一切载体”,可见,文献具有四个要素

6、,即知识内容、载体、记录符号和记录手段。古代的甲骨文、竹简等是文献,今天的机读资料、电子出版物、网络信息资源等等都是文献。第一节 信息学n一、信息概述n(五)信息源n(1)按加工整理程度n(1)零次信息 书信 底稿 笔记 记录n(2)一次信息 期刊论文 专利文献科级报告会议录,学位论文,专著,教材 具有创造性原始性 多样性n(3)二次信息 书目,题录,索引,文摘 集中性工具性特征n(4)三次信息 年鉴 百科全书等第一节第一节 信息学信息学n n一、信息概述n(五)信息源n(2)按出版类型1. 图书2. 期刊论文3. 科技报告4. 专利文献5. 会议文献6. 政府出版物7. 学位论文8. 标准文

7、献9. 产品样本10. 科技档案n信息概述n(五)信息源n(3)按出版机构:n学术团体期刊 n商业出版机构的期刊n政府部门及所属机构所出的期刊n公司企业的期刊n学术期刊按主管单位的不同分为省级、国家级、科级核心期刊(统计源期刊)中文核心期刊(北大中文核心)中文社会科学引文索引来源期刊(CSSCI)中文科学引文数据库来源期刊(CSCD)双核心期刊n核心期刊:学术界通过一整套科学的方法,对于期刊质量进行跟踪评价,期刊分类定级,最重要的一级为核心期刊。中文核心期刊要目总览 中国科级论文统计源期刊期刊引用报告(JCR)第一节 信息学n二、信息需要与行为n(一)信息需要n1. 信息需要的特征 广泛性 社

8、会性 发展性n2. 信息需要的层次n(1)未知的信息需要n(2)潜在的信息需要n(3)现实的信息需要n3. 信息需要的内容准确 可靠 完整 全面n4. 各类信息用户的需要特点第一节 信息学n二、信息需要与行为n(二)信息行为n1. 信息检索行为 自己查找,采集寻求所需要信息的活动n2. 信息选择行为 符合自己需要的部分信息n3. 信息利用行为 利用信息解决问题第一节 信息学n二、信息需要与行为n(三)信息检索n1. 定义为达到某一特定目的,将信息源与用户需求连接起来,查询,鉴别 选择 确定相关信息。n2. 信息检索的层次 (1)按某一主题或者某一特征 OPAC查询 (2)为解决某一问题查询 全

9、文检索 (3)将查询的信息及其知识进行分析加工,提供给用户使用 科技查新n3 信息检索的发展时期n手工检索 机械检索 计算机检索 n信息检索的意义: n信息控制的手段n获取知识的门径n科学研究的工具和指南n决策与管理的支持与参考第二节 信息素养n信息素养的定义n美国高等教育信息素养能力标准n标准一 有信息素养的学生有能力决定所需信息的性质和范围。n标准二 有信息素养的学生可以有效地获得需要的信息。n标准三 有信息素养的学生评估信息和它的出处,然后把挑选的信息融合到他(她)们的知识库和价值体系。n标准四 不管个人还是作为一个团体的成员, 有信息素养的学生能够有效的利用信息来实现特定的目的。n标准

10、五 有信息素养的学生熟悉许多与信息使用有关的经济、法律和社会问题,并能合理合法的获取信息。第三节 信息技术n一、计算机信息检索概述n(一)数据库技术 满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。n(二)数据通信技术n信源 信息的发出者n信宿 信息的接收者n信道 信息传输的通道n噪声 信号在传输过程中受到的干扰n(三)多媒体技术 信息媒体的多样性,集成性和交互性第三节 信息技术n二、信息检索关键技术-数据库技术n(三)数据库的构成n文档:顺排文档和倒排文档n字段:记录的基本单元 题名 主题词 文摘等n记录:基本单元 一条记录相当于一条文摘或者题录n

11、数据项 依据字段内容所做的描述,组成记录的最小单位第三节 信息技术n二、信息检索关键技术-数据库技术(DB)n(一)数据库技术n计算机中存放数据的仓库,实际是一个记录保存系统,SQL语言为标准语言n(二)数据库特点n1. 数据共享n2. 面向全组织的数据结构化n3. 数据独立性n4. 可控数据冗余度n5. 统一数据控制功能信息数据库中常见字段信息数据库中常见字段题目 TI文摘 AB叙词DE标示词 ID记录号 DN作者 AU作者单位 CS期刊名称JN出版年份 PY出版国 CO文献性质 TR语种 LA 叙词表 将文献作者、标引者和检索者使用的自然语言转换成规范化的叙词型主题检索语言的术语控制工具,

12、亦称主题词表、检索词典。第四节 计算机信息检索概述n手工检索 纸质型或书本式检索n优缺点n检索过程灵活n检索结果准确n检索不易查全n检索速度不快第四节 计算机信息检索概述n一、计算机检索的原理n使用计算机存储和检索信息n存储信息n对原始信息进行加工、分析、存储n检索信息n对检索课题进行分析,明确检索范围,弄清主题概念,输入到计算机进行检索第四节 计算机信息检索概述n二、计算机信息检索系统n按某种方式、方法建立起来的供用户检索信息的一种有层次的信息体系,是有序的信息的集合体。n1. 检索系统的功能n报道职能n存储职能n检索职能第四节 计算机信息检索概述n二、计算机信息检索系统n2. 检索系统的评

13、估标准n信息的收录范围n信息特征标识的详略 SINOMED 收录的学术论文的外表和内容特征的描述非常详细n信息摘录及标识的质量n信息报道的时差n检索功能的完善n n3.3. 检索系统的类型n参考数据库 书目数据库和指南数据库n源数据库数值型数据库 全文数据库 超文本数据库n混合型数据库 第四节 计算机信息检索概述n二、计算机信息检索系统n4. 检索系统的构成模式n(1)信息数据的选择、处理、录入、维护子系统n(2)词表和标引子系统n(3)检索子系统n(4)用户接口子系统n5. 检索系统的组织n(1)组织的要求n 信息内容有序化n 信息流向明确化n 信息流速适度化n 信息质量最优化第四节 计算机

14、信息检索概述n二、计算机信息检索系统n5. 检索系统的组织n(2)组织的方法n1)传统组织方法n 分类组织法n 主题组织法n 字顺组织法n 号码组织法n 自然组织法第四节 计算机信息检索概述n二、计算机信息检索系统n5. 检索系统的组织n(2)组织的方法n2)现代组织方法n 字段组织法n 网络组织法:文件组织法、主题树组织方式、超文本组织方式、超媒体组织方式、元数据组织方式。第四节 计算机信息检索概述n三、计算机信息检索语言n定义:检索信息所使用的人工语言n 词汇:是指登录在类表、词表中的所有的标识(分类号、检索号、代码等),是可识别的语言。n 语法:是指如何运用标识来准确表达信息内容和特征,

15、是有效实现信息检索的规则。第四节计算机信息检索概述n n三三、计算机信息检索语言n1. 检索语言逻辑概念关系n(1)等同关系n1)同义关系n2)准同义关系n(2)从属关系n(3)相关关系n1)交叉关系n2)矛盾关系n3)对立关系n4)并列关系第四节第四节 计算机信息检索概述计算机信息检索概述n n三、三、计算机信息检索语言n1. 检索语言逻辑概念关系P28n(3)相关关系n1)交叉关系n2)矛盾关系n3)对立关系n4)并列关系第四节 计算机信息检索概述n三、计算机信息检索语言n2. 检索语言的类型:n(1)分类语言n内容不同级别的类目n优势体现学科的系统性n缺点 不够准确n步骤 分析研究判断主

16、题检索具体类目n(2)主题语言使用词语标示的一类信息检索语,借助自然语言,依据主题字顺体系为基本机构的检索语言n n三、计算机信息检索语言三、计算机信息检索语言n n2. 2. 检索语言的检索语言的类型类型:n n(2 2)主题语言)主题语言使用词语标示的一类信息检索语,借助自然语言,依据主题字使用词语标示的一类信息检索语,借助自然语言,依据主题字顺体系为基本机构的检索语言。顺体系为基本机构的检索语言。包含两个内容:一表达信息内容特征的,经过规范化的名词术语(包括词组和短语)二把这些名词术语按字顺排列成主题词表,以此作为规范语词标引和检索信息的工具用标准化的语言符号代表概念单元就是主题词。第四

17、节第四节 计算机信息检索概述计算机信息检索概述第四节 计算机信息检索概述n三、计算机信息检索语言n2. 检索语言的类型:内容、优势与缺点n(3)关键词 代表主题概念n1)关键词的选择n选择最核心词汇 不要加修饰词n选择概念表达最确切的词语n选择通用性的术语n从相应的规范词表中选定所需的关键词n注意关键词的单复数、拼写差异、单词结尾的不同第四节 计算机信息检索概论n三、计算机信息检索语言n2. 检索语言的类型:内容、优势与缺点n(3)关键词n2)关键词的扩展处理n同义词的判断与选择n近义词的判断与选择n以概念为单位,构成组面检索词。第四节 计算机信息检索概述n三、计算机信息检索语言n2. 检索语

18、言的类型:内容、优势与缺点n(4)关键词的四种变化n1)同义词 不同的词语表述同一个概念艾滋 爱滋 aidsn2)上位词 外延更广的检索词 大而广的范畴n3)下位词 内涵窄的检索词n4)同类词 相同属性的检索词n(5)关键词的多重排列组合n1)关键词:带宽n2)关键词:软件解决方案第四节 计算机信息检索概论n三、计算机信息检索语言n2. 检索语言的类型:n(5)关键词的多重排列组合n1)关键词:带宽n2)关键词:软件解决方案n(6)关键词的专指和泛指来提高查准率和查全n(7)使用地理位置第四节 计算机信息检索概论n三、计算机信息检索语言n3. 信息检索语言的作用n(1)对文献的情报内容加以标引

19、的功能。n(2)对内容相同及相关的情报n(3)对大量情报加以系统化或组织化的功能n(4)便于将标识用于和检索用语进行相符性比较的功能第四节 计算机信息检索概论n三、计算机信息检索语言n4. 常用主题词表n(1)美国医学主题词表主题词表第四节 计算机信息检索概论n三、计算机信息检索语言n4. 常用主题词表n(2)国际系统医学术语表n(3)国际疾病分类法n(4)观测指标标识逻辑命名与编码系统n(5)美国统一医学语言系统第五节 计算机检索方法n一、布尔逻辑检索n(一)逻辑“与” AND或“*”表示n(二)逻辑“或” OR 或“+”表示n(三)逻辑“非” NOR 或“”表示“与”“或”“非”第五节 计

20、算机检索方法n二、位置逻辑检索n(一)位置逻辑检索的原理n(二)几种主要的位置逻辑算符n1. (W) withn2. (nW) nwordn3. (N) near n4. (nN) nnearn5. (F) Fieldn6. (S) n7. (L)第五节 计算机检索方法n三、截词检索 保留相同的部分,用截词符号代替可变化的部分,相当于逻辑“或”扩展检索范围。n截词符号 “?”或“*”n四、字段限定检索 检索词后加“in”和一个字段符表示。n五、括号检索 括号内的优先算。n六、短语检索 用“”表示限定,精确检索n七、模糊检索n八、加权检索 设置权限,提出阈值。总权值大于等于阈值文献命中n九、自然

21、语言检索n十、多语种检索n十一、区分大小写的检索第六节 计算机检索策略与检索步骤n一、检索策略和步骤n1. 检索课题分析n2. 检索系统和数据库的选择n3. 检索点和检索词的选择n4. 检索式的编制n5. 检索方案的调整n6. 检索结果输出的选择n7. 拓宽检索n8. 充分利用各种资源第六节 计算机检索策略与检索步骤n一、检索策略和步骤n9. 全文获取n利用可以提供全文的数据库 中国国家知识产权局的专利数据库 美国专利数据库 欧洲专利数据库 ,pmc n利用馆藏目录或者联合目录查找全文 年鉴 手册之类n一站式文献检索查找全文 n搜索网上免费资源 n图书馆全文传递服务第六节 计算机检索方法n二、检索效果评价n1. 查全率和查准率 查全率一般在60%到70%,查准率40%到50%检索的最佳状态n2. 查全率和查准率的局限性n3. 影响查全率和查准率的主要因素 课题不明确,系统不恰当,检索途径和方法少n4. 提高检索效果的措施和方法n1)提高检索系统的质量n2)提高用户利用检索系统的能力n3)制定优化的检索策略The EndnSee you next time!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号