《信息存储与检索》复习资料

上传人:206****923 文档编号:41200478 上传时间:2018-05-28 格式:DOC 页数:5 大小:32KB
返回 下载 相关 举报
《信息存储与检索》复习资料_第1页
第1页 / 共5页
《信息存储与检索》复习资料_第2页
第2页 / 共5页
《信息存储与检索》复习资料_第3页
第3页 / 共5页
《信息存储与检索》复习资料_第4页
第4页 / 共5页
《信息存储与检索》复习资料_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《《信息存储与检索》复习资料》由会员分享,可在线阅读,更多相关《《信息存储与检索》复习资料(5页珍藏版)》请在金锄头文库上搜索。

1、第一章 绪 论 信息是认识主体所感知或所表述的事物运动的状态与方式。 知识,是人类对于客观世界的认识。信息是知识的重要组成部分。 在大学期间,信息技能具体表现为以下 6 种技能:、明确任务、信息查询策略、查找 和检索、信息利用、信息综合、信息评价。 信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、 选择能力和消化吸收能力。 信息意识含有信息认知、信息情感和信息行为倾向三个层面。 文献是“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。 文献的构成:文献信息、文献载体、符号系统和记录方式。 按文献生产加工层次划分的文献形式:一次文献、二次文献和三次文献 口头

2、信息指通过交谈、讨论、报告等方式交流传播的信息。 咨询业是以知识和技术为手段,以协助客户解决复杂的决策问题为目的向社会提供智 力服务的行业。 信息素质是从各种信息源检索、评价和使用信息的能力,是信息社会劳动者必须掌握 的终身技能。 信息素质的内涵包括:认识到准确和完整的信息是 明智决策的基础;认识到信息需求 及问题所在;制订信息检索策略;掌握信息检索(计算机检索)技术;能评价信息; 根据实际用途组织信息;将新信息融会到现有知识结构中,在批判性思考、解决问题 和交流的过程中使用信息。 无偿信息资源网的问题:专业知识检索的结果不准确、不可靠、不能直接作为研究的 论据,信息质量无法保证。信息的揭示不

3、充分、不深入。信息的组织科学性差、绝大 多数用的分类粗糙。关键词索引质量较差。信息管理差,不容易查到真正需求的专业 知识信息。信息内可能包含不安全因素。 信息传播的四个基本要素:信息源、传播者、传播媒介和载体、受传者。 信息传播是指通过信息的发送、传递、接收跨越空间和时间,把信息从一方传到另一 方的过程。 信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表和内容特征, 经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建 成一个具有检索功能的工具或检索系统,供人们检索和利用。 信息检索是指运用编制好的检索工具或检索系统,依据一定的方法查找满足用户要求 的特定信

4、息。第二章 信息存储与检索的基本知识 信息存储与检索是将特征化表示的信息集合与特征化表示的用户需求集合进行匹配与 选择过程。 整个检索过程通常要考虑以下四个主要步骤:如何分析问题如何选择检索工具如 何从检索工具中查找所需信息如何获取原文 分析问题的步骤是:问题的分类分析“已知”和“欲知”信息分析需求的主题内容 确定文献类型和时间范围 网上检索与手工检索不同的是,提供查询条件限制和检索逻辑条件限制。 检索语言是根据文献检索需要创造的一种人工语言,又称检索标识。 体系分类法是一种直接体现知识分类的等级制概念标识系统,是通过对概括文献信息内 容及某些外表特征的概念进行逻辑分类(划分与概括)和系统排列

5、而构成的。主题检索语言是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式 (字顺)组织起来的一种检索语言。 主题法最常用的有叙词法和标题法。 评判工具书的质量可以用以下几条途径可作辅助评价:(1)检查收录范围(2)权威 性(3)客观性(4)可靠性(4)可读性(5)易用性(6)适时性(7)利用书评资料 (8)专家推荐。 目录是指著录一批相关的图书或其他文献,按照某种次序编排而成的揭示和报道文献 及其收藏情况的工具。 评价网站中的信息质量可以归纳为以下五条标准:第一,权威性;第二,准确性;第三, 客观性;第四,适时性;第五,内容范围。第三章 计算机联机检索和光盘检索 布尔检索式优先执行

6、顺序通常是 NOT、AND、OR,在有括号的情况下,先执行括号 内的逻辑运算,在多层括号时,先执行最内层括号中的运算。 截词方式有多种,按截断的字符数量分,有有限截断和无限截断;按截断的位置分, 有后截断、前截断、中间截断。 传统联机检索的优点: 传统联机检索基本上是集中式管理,有专人负责维护整个系统,定期更新信 息。 联机检索系统是个成熟的系统,信息质量较高,信息的附加值高,可靠性好, 来源可靠。 集中管理使得安全性有了一定保障。 传统联机检索的准确率较网络检索高。 传统联机检索的缺陷: 集中式管理主要缺点是主机负担重,联机网络的扩展性较差,相关技术缺乏 发展的动力,灵活性较差。 在信息组织

7、方式上,传统联机系统的普通文本数据库多以线性方式组织,其 基本组成单位是记录;而在 Internet 上,基于 WWW 的信息组织采用超文本 组织方式,其数据库由节点和链路组成。可以按单元、片段、关系将知识存 贮,用链路网将同一文献或不同文献的相关部分结构化地连接起来,这是传 统检索系统没有做到的。 Internet 网不是一种网络,而是一个由许多类型、结构不同的分组交换网通过 路由器连接而成的一个庞大的、能整体运作的网络。这种分布式的系统将分 散的资源调集在一起解决同一个问题,分散的用户可以共享网络中各点的数 据而不必知道某种资源的具体地址,这一特点是传统联机系统远远不及的。 Interne

8、t 网是面向最终用户的,操作较联机方便。第四章 网络信息检索的基本技术 IP 地址 Gopher 是一个客户机/服务器系统(Client/Server)。 Gopher 是深受用户欢迎的基于菜单驱动的 Internet 信息查询工具。 WWW 以 Client/Server 模式进行数据通信。 WWW 的特性: WWW 是一种超文本信息系统WWW 是多媒体的和易于导航的(navigate) WWW 与平台无关 WWW 是分布式的 WWW 是动态的 WWW 是交互的 第五章 书刊资料的查找 书目著录一批相关的图书或报刊,按一定的次序编排而成,是一种登记、报道和宣传 书刊文献的检索工具。 书目的作

9、用 :推荐作用。检索工具。文献工作。提供出处。 索引是将报刊书籍中某些重要的或有意义的信息分别择录出来,按一定方式编排,并 注明出处,以供检索的工具。它包括四个基本要素:索引源、索引款目、编排方法和 出处指引系统。 索引的主要作用:了解已有的学术成果。从多种途径提供更深层次的信息。 文摘是以提供文献内容梗概为目的、简明、确切地记述文献主要内容的短文。 文摘作用:通报最新科学文献、节省阅读时间、引导检索原文、能获得因语言障碍无 法得到的科学文献。 CALIS 是中国高等教育文献保障体系(英文名称 China Academic Library 找出系统存在的缺陷及其原因,以便改进; 比较各种检索技

10、术的优劣; 有助于新系统的设计; 丰富信息检索理论。 网络搜索引擎的检索性能评价指标主要涉及以下 8 个方面: 数据库规模与内容 索引方法 检索功能 检索结果处理 分类功能(主要考察分类类目体系的深度、数量、合理性等) 用户界面(包括界面布局、联机帮助、界面定制、界面广告量等) 汉字处理(包括词语切分、多内码处理及中英文混合检索等) 其他(例如:响应时间、系统稳定性等)传统信息检索系统的性能评价指标体系主要包括以下 7 个: 收录范围(Coverage):主要指检索系统数据库覆盖的学科范围、信息类型、数量 及时间跨度; 查全率(Recall Ratio):R=检出的相关文献量系统数据库中的相关

11、文献总量 查准率(Precision Ratio):P=检出的相关文献量/检出文献总量 响应时间(Response Time) 用户负担(User Effort) 输出方式(Output /Display Format) 新颖率(Novelty Ratio) TREC 的目标: 总目标:支持在信息检索领域的基础研究,提供对大规模文本检索方法的评估办法 通过提供大型的语料库,统一的测试程序及系统整理评测的结果数据,以促进信息检 索技术的发展; 强调检索技术的先进性与实用性的有机结合; 强调以大规模数据为基础的信息检索研究; 为学术界、工业界、政府部门提供交流研究思想的公开论坛; 便利从研究实验室到商品化产品的技术转换。第十一章 论文写作与检索工具的利用 信息素养构成体系:包含文化素养、信息意识、信息技能。 大学生信息素养特点:知识性、普及性、操作性。 论文选题的基本原则:创造性、科学性、现实性、新颖性、具体性、选题不宜大、稳 定性、可能性。 在论文的写作中,要做到以下几点: 在论文的具体写作过程中,要求做到语言准确、精练,行文流畅,这是学术 论文的基本要求。 在行文准确的基础上要适当注意学术论文的文采。 在写作时还要注意标点符号、计量单位、数字的用法。 此外,在论文写作中还要注意提炼中心句。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号