信息检索复习纲要(精)

上传人:tia****nde 文档编号:36976019 上传时间:2018-04-05 格式:DOC 页数:15 大小:1.73MB
返回 下载 相关 举报
信息检索复习纲要(精)_第1页
第1页 / 共15页
信息检索复习纲要(精)_第2页
第2页 / 共15页
信息检索复习纲要(精)_第3页
第3页 / 共15页
信息检索复习纲要(精)_第4页
第4页 / 共15页
信息检索复习纲要(精)_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《信息检索复习纲要(精)》由会员分享,可在线阅读,更多相关《信息检索复习纲要(精)(15页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章信息检索基础知识信息检索基础知识 1. 信息、文献、资料的概念及其包含关系 1) 信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解, 信号就成为信息 。 (信号被理解吸收即为信息) 2) 文献: a)定义:记录下来的知识,必须有知识和载体两部分。 b)载体:文献的形态,如甲骨、纸介型 、胶片,磁带,磁盘,光盘等 c)记录手段:文字、图像、公式、声频、视频和代码等 d)物质形态:图书、期刊、专利说明书、录音带、缩微品、光盘等 3) 资料: a)定义:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文 献。也可以称为

2、固化在一定载体上的知识。 b)灵魂:知识 文献的内容 c)载体:文献的形态,如甲骨、青铜器、纸介型 、胶片,磁带,磁盘,光盘等 d)记录手段:文字、图像、公式、声频、视频和代码等 e)物质形态:图书、期刊、专利说明书、录音带、缩微品、光盘等 4) 包含关系:文献资料信息2. 信息的分类及特点 1)按载体的出版编辑特点:分有十二大文献类型(及各 自特点)图书:是对科研成果、生产技术和经验的总结性的概 况论述A)内容特点:系统性好、完整性好B)出版周期较长,报道速度相对较慢C)著录特征:著者、出版项(出版地、出版社名和出版 年份) 、国际标准图书号(ISBN)期刊A)期刊一般是指名称固定、定期或不

3、定期连续出版物。B)特点:内容新颖 报道速度快 系统性差C)著录特征:ISSN、 CN、 年、卷、期(邮发代号内部准印证)会议文献 :研究人员在各种学术会议上交流科研新成果、新进展、及发展趋势的讨论记录或论文(通 称会议论文)A)特点:传递信息及时、针对性强、内容新颖B) 一部分科研成果就是通过学术会议首次发表的C)会议文献特征:有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。 专利文献:是一种用法律形式来保护的文献,专利文献主要由专利说明书构成。它反映了当前最新的 技术成果。专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种重要情报源。发明专利:具有较高水平

4、的发明,是在某个领域内具有独创性的发明科技报告:是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进 展报告。A)与期刊相比:在内容方面,报告比期刊论文专深、详尽、可靠。是一种不可多得的情报源。科技报告能 代表一个国家和专业的发展水平及动向。B)目前国际上较著名的科技报告是美国政府的四大报告,即民用工程报告军用工程报告 航空航天报告能源报告。学位论文:是著者为获得某种学位而撰写的科学论文。A)一般偏重于理论B)附有大量的参考文献C)借此可以看出有关专题的发展过程和方向政府出版物:是各国政府部门及其所属机构颁布和出版的文件资料。A)内容主要分为行政性文件(如政府法令、

5、方针政策等)科技文件(如科学技术白皮书 ) 。B)对了解一个国家的科技和经济政策及其演变情况有一定的参考价值。标准文献:是对工农业产品和工程建设的质量、规格及其检验方法所做的技术规定。标准文献具有一定 的法律约束力。 A)反映当时的技术工艺水平及技术政策B)国际标准化组织(ISO)和国际电工委员会(IEC) 。 C)标准文献的特点是:有标准号。D)标准号由三部分组成:标准颁布机构代码+顺序号+颁布年份 例如: GB 2683-98产品资料:指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品技术资料一般向 厂商直接索取。技术档案:是指生产建设和科学技术部门在技术活动中形成的。报纸

6、、新闻稿:是指那些阐述问题面广,具有群众性与通俗性,对科技成果报道的不系统,可获得一 些重要消息的资料。工作文稿:准备在期刊上发表或向学术会议提出的论文或研究报告的初稿,是一种短时效的文献,是 一种很难全面收集的文献。 总结总结 1 1: A 理论探讨性质期刊、会议文献、学位论文 B 了解某一个课题的历史现状及末来图书 C 工艺革新、发明创造专利文献 D 了解尖端技术科技报告 E 毕业设计、撰写毕业论文学位论文 F 国家政策政府出版物 G 产品设计、生产造型标准文献、产品资料 总结总结 2 2: A 国际标准图书号(ISBN) a)由 10 位数组成 7-5335-1519-6/TP64 b)

7、第一段:组号代表国家、地区、语种 c)第二段:出版者号,由国家或地区 ISBN 中心分配; d)第三段:书名号,由出版者按出版顺序所给 e)第四段:校验位 B 国际标准期刊号 ISSN a)由 8 位数组成 b)例如 的国际标准期刊号为:ISSN10050043,最后一位为检验码。 C 国内统一刊号 CNCN 11 3248 / TP地区号 顺序号 分类号 D 标准文献的特点是:有标准号(标准颁布机构代码+顺序号+颁布年份)GB 2683 - 98标准颁布机构代码 顺序号 颁布年份 E 专利号(见本资料第五章)2)信息按照信息载体的编辑特点分类图书、期刊、特种文献 3)按信息的加工层次分类:

8、a)一次信息:原始文献原始文献 b)二次信息:将分散的、无组织的一次信 息,按一定的原则加工、整理、简化、 组织成为系统的、便于查找利用的信息。 即(检索工具)(检索工具)目录、题录、索引、目录、题录、索引、 文摘文摘 c)三次信息:在合理利用二次信息的基础 上,选用一次信息的内容,根据一定的 需要、目的进行分析、综合或浓缩重组 而得到的信息。即( (参考性文献参考性文献) )论论 文丛集、综述、年鉴文丛集、综述、年鉴 3) 信息与三次信息的区别: A 对象不同 a)二次信息以“ 篇” 或“ 本” 为 单位进行加工 b)三次信息则归纳了较多的一次信息内容 B 用途不同 a)二次信息为检索一次信

9、息的工具 b)三次信息能直接提供检索答案. 3. 信息检索包括三个方面: 数据检索 、事实检索 、文献检索 (三者中以文献检索为主) 4. 文献检索 1)定义: a)检索系统的建立及检索工具的组织和积累 b)文献查询 2)类型: a)直接检索是从通过阅读原始文献直接获取所需信息,快捷、方便、漏查率高 b)间接检索是通过二次文献(检索工具)的指导再查找原始文献而获取所需信息,系统、全面 滞后 5. 文献检索工具 1)定义:检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具 有报道、存贮、检索的功能。 2)类型:目录型检索工具、题录型检索工具、文摘型检索工具、索引

10、型检索工具 a. 目录型检索工具 目录型检索工具是记录具体出版单位、收藏单位及其他外表特征的工具。目录著录的对象是单位出版 物,一般著录文献的名称、著者、文献出处等。目录的种类很多,对于文献检索来说,国家书目、联合 目录、馆藏目录等尤为重要。 b. 题录型检索工具 题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出 处等) ,题录的著录对象是单篇文献,是快速报道文献信息的一类检索工具。它与目录的主要区别是著 录的对象不同。目录著录的对象是单位出版物,题录的著录对象是单篇文献。 c. 文摘型检索工具 文摘型检索工具是将大量分散的文献,选择重要的部分,以简炼的

11、形式做成摘要,并按一定的方法组织排列起来的检索工具。 d. 索引型检索工具 索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、 刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工 具。 第二章第二章网络资源网络资源 1. www 资源的基本知识 1)TCPIP 协议:TCP/IP 是一个网络协议族,其中 TCP 协议、IP 协议是最基本的协议,简称 TCP/IP 协 议。INTERNET 是基于 TCPIP 协议协议进行数据传输的。 2)IP 地址:Internet 上的每一台计算机主机都必须有唯一的“地址” ,以保

12、证 Internet 上所有的计算 机和网络能够被互相传送信息而不被混淆,以数字表示,称为 IP 地址。IP 地址由 32 位二进制数组 成, 分四组(每组 8 位) ,用十进制表示,每位 IP 的范围从 0 到 255。3)域名:具有实际含义的网址,比 IP 地址好记。域名的层次结构从右到左,子域名分别表示:国家或 地区的名称、组织类型、组织名称、分组织名称、计算机名称等,如:http:/ 国内域名 www.whitehouse.gov国际域名 国际域名 国内域名 www.第一财经.com中文域名,国际域名 http:/清华大学.cn 中文域名,国内域名4)DNS:从事域名和 IP 地址之间

13、的翻译工作 5)HTML:超文本标记语言,所有 WWW 的页面都是用 HTML 编写的超文本文件。 6)HTTP 协议:超文本传输协议,HTTP 是 Web 服务器和 Web 客户机进行通讯的语言。所有的 Web 服务器 及浏览器必须遵循这一协议,才能发送或接收超文本(超媒体)文件。Web 服务器又称 HTTP 服务器。2.2. 搜索引擎:搜索引擎: 1)搜索引擎是 Internet 网络上查找信息最常用的方法。 2)工作原理: a)派出“ 网页搜索程序” 在网上搜寻所有信息,并将它们带回搜索引擎 ; b)将信息进行分类整理,建立搜索引擎数据库 ; c)通过 Web 服务器端软件,为用户提供浏

14、览器 界面下的信息查询 3)类型:分类目录式搜索引擎、全文搜索引擎、元搜索搜索引擎 a)分类目录式搜索引擎按目录分类的网站链接列表,提供相关类目的网站信息。如网址大全。b)全文搜索引擎通过从互联网上提取的各个 网站的信息(以网页文字为主)而建立的数据 库中,检索与用户查询条件匹配的相关记录, 然后按一定的排列顺序将结果返回给用户,因 此他们是真正的搜索引擎。如 Google、baidu 等。c)元搜索搜索引擎将多个搜索引擎集成在一起,并提供一个统一的检索界面,当用户查询时, 它查询的问题同时发给多个搜索引擎,同时检索多个数据库,再经聚合,去重之后输出检索结果。3. 使用搜索引擎的技巧 4. 信

15、息检索技术: 1)布尔逻辑符(或、与、非) a)逻辑与:符号为“*”或“AND” ,A*B:表示数据库中既含有 A 概念又含有 B 概念的文献才被命中。 可以用来缩小范围。 如:计算机在机械工业中的应用 计算机应用*机械工业 b)逻辑或:符号为“”或“OR” ,AB:表示在数据库中只要含有 A 概念或 B 概念的文献都可命中。 可以用来扩大范围。 如:机器人的结构及构件研究 机器人结构+机器人构件 c)逻辑非:符号为“”或“NOT”,AB:表示在数据库中,在命中含有 A 概念的文献集合里,去除 同时含有 B 概念的文献。 如:电视台中央电视台 2)查全率、查准率 a)查全率(检索出的相关信息量/系统中的相关信息总量)*100%,衡量检索系统和检索者检出相 关信息的能力; b)查准率(检索出的相关信息量/检索出的信息总量)*100%,衡量检索系统和检索者拒绝非相关信息的能力; c)提高查准率的方法有:使用逻辑“与” (AND). d)提高查全率的方法有:使用逻辑“或” (OR) 5. 电子邮件 1)SMTP(收件协议) 、POP3 邮局协议(发件协议) 2)电子邮件的格式:用户名邮件服务器域名,如 3)工具:Outlook、Foxmail 4)应用:邮件列表、新闻组 6. 文件传输协议:FTP 7. 远程传输协议:TELNET 第三章第三章图书信息的检索和获

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号