信息检索基础理论教材

上传人:我** 文档编号:117091460 上传时间:2019-11-18 格式:PPT 页数:101 大小:5.85MB
返回 下载 相关 举报
信息检索基础理论教材_第1页
第1页 / 共101页
信息检索基础理论教材_第2页
第2页 / 共101页
信息检索基础理论教材_第3页
第3页 / 共101页
信息检索基础理论教材_第4页
第4页 / 共101页
信息检索基础理论教材_第5页
第5页 / 共101页
点击查看更多>>
资源描述

《信息检索基础理论教材》由会员分享,可在线阅读,更多相关《信息检索基础理论教材(101页珍藏版)》请在金锄头文库上搜索。

1、第二章 信息检索理论与技 术 第一节 信息检索系统 第二节 信息标引及检索原理 第三节 检索语言 第四节 检索技术 第五节 检索途径与步骤 第一节 信息检索系统 一、信息检索系统的概念与类型 二、书本式检索系统 三、计算机检索系统 四、检索系统的质量评价 一、信息检索系统的概念与类型 1.信息检索系统的概念 信息检索系统是一类具有信息存储和检索功 能的信息服务设施 2.信息检索系统的类型 按使用设备 书本式检索系统 卡片式检索系统 缩微式检索系统 计算机检索系统 书本式检索系统 n又称检索工具 n检索工具 是用来报道文献、存储文献和提供查找文献线索 的工具 检索工具的类型 按著录方式分: 目录

2、型 题录型 文摘型 (1)、目录型检索工 具 n目录以单位出版物为著录对象, 主要揭示出版物的外表特征。 著录格式: 西葫芦、南瓜高产栽培与加工技术 / 李海真等编著 .- 北京 :中国农业出版社, 2003.03. -242页;19cm .- ISBN7-109- 07770-5 :12.00 书 名 编 者 出版地、出版者 出版年月 总页数规 格 国际标准书号 价 格 目 录 的 种 类 馆 藏 目 录 分类目录依据分类法组织而成的目录 书名目录按书名字顺组织起来的一种目录 著者目录按著者姓名或名称字顺组织起来的目录 主题目录按主题标识字顺组织排列的一种目录 联 合 目 录 国 家 书 目

3、 出版社与书店目录 (2)、题录型检索工具 n题录以单篇文献为著录对象, 主要描述文献的外表特征。 著录格式: 031007529 铲式精播打穴播种机结构参数的设计 / 李成华(沈阳农业大学,110161);赵凤琴;夏建 满等 / 农机化研究(哈尔滨).- 2003,(2).- 124-126 题录号 题 名 著者及工作单位 刊 名出版年、期、页 (3)、文 摘 n文摘以单篇文献为著录对象,既描述文献 的外表特征,又描述文献的内容特征。 著录格式:题录 + 摘要 20034168 辽沈型日光温室的建造 / 刘文合 (沈阳农业大学水利学院),王铁良 / 温室园艺 .- 2003,(1) .- 2

4、122 为使辽沈型日光温室实现正常年份冬季不 加温可越冬生产耐低温蔬菜的目标,施工时应注 意以下关键环节 题 录 文 摘 2、检索工具的结构 (1)、编辑与使用说明 (2)、目次表和主题词表 (3)、正文部分 (4)、辅助索引 (5)、附录部分 (1)、编辑与使用说明 (2)、目次表和主题词表 (3)、正文部分 (4)、辅助索引 (5)、附录部分 3、 索 引(INDEX) (1)、 索 引 的 定 义 (2)、 索 引 的 结 构 (3)、 索 引 的 类 型 (1)、索 引 的 定 义 将图书、报刊、资料等文献中的一些重要的、 有价值的知识单元,如人名、题名、分类号、主题词 等,根据需要分

5、别摘录出来,并注明它们所在的地址 (页码或文献号),再按一定的顺序排列组织起来, 附在检索工具之后,或单独编辑成册,称为索引。 (2)、索 引 的 结 构 喷灌 春小麦 产量 干旱地区 土壤水分 20031331 冬小麦 节水 优化 20032372 径流量 水土流失 预测 模型 20033380 喷灌机 大型 适应性 中国 20033298 喷灌技术 喷灌系统 20031346 标目说明语 存储地址 Microcomputers ( see : computers ) Computer software ( see also : expert systems ) “参见” 参照 “见” 参照

6、 索引款目 参照系统 标目注释 参照系统连接相关标目的媒介物 n等义参照(直接参照) see 如:South Korea(see: Korea Republic) 用于同义词之间、旧名与新名之间、缩写与全称之间、俗 名与学名之间 see后面的词为标题词 n相关参照(间接参照) see also 如:Drainage(see also: subsurface drainage ; surface drainage) 指示其他相关标题词 (3)、索 引 的 类 型 著者索引以著者为标目,按著者名称字顺排列。 主题索引以主题词为标目,按主题词字顺排列。 分类索引以分类号或类目的名称为标目,按分类 顺

7、序排列的索引。 题名索引以题名为标目,按题名字顺排列。 专用索引分子式索引、地名索引、报告号索引、 专利号索引 著 者 索 引 主 题 索 引 分 类 索 引 界 门 纲 科 属 3. 计算机检索系统 计算机检索系统由: 计算机检索软件(指令、程序或程序组) 计算机硬件 (主机、外围设备) 数据库(信息源) 数据库的类型 文献型数据库 非文献型数据库 全文数据库 书目数据库 数值型数据库 事实型数据库 图像数据库 概念数据库 数据库结构 字 段 记 录 顺排文档 倒排文档 数据库 检索工具结构 著录项目 著录款目 检索工具 正文 索引 文档 字 段 记 录 主 要 字 段 TI题名 AU著者

8、SO出处 JN刊名 PY出版年 AB文摘 DE主题词 LA语种 AN记录号 IS国际标准书号、期刊号 DT文献类型 AD著者单位 CL分类 主 要 字 段 英文 题名 作者 作者 单位 出处 语种 出版 年 文摘 (1)文献检索系统 书目检索系统 全文检索系统 超文本检索系统 存储关于文献外表、内容特征的一般描述性信息。如引文、文摘。 也称为二次文献检索系统,如CABI、Agris、Agricola等。 存储原始文献的全文信息。包括题名、著者、摘要、关键词、正文、 参考文献和著作日期全部数据。 主要用于检索网络信息资源,如网络信息检索工具搜索引擎。 第二章 第一节 信息检索系统 计算机检索系统

9、的类型 以事实为检索对象的非文献型检索系统 提供有关人物、机构、地域、事件等事实 信息。 如人物传记数据库、机构名录数据库、万 方中国企业与产品数据库、电子形式 的百科全书、年鉴、手册、名录。 (2)事实型检索系 统 第二章 第一节 信息检索系统 以数据形式记录物质、材料等实物的 特性、参数、常数、价格等。 如人口数据库、商品价格数据库、世 界粮农统计数据库。 (3)数值型检索系 统 第二章 第一节 信息检索系统 存储和检索各种图像或图形及有关说明文字资料。 (4)图像检索系 统 (5)多媒体信息检索 检索主题的“全方位”信息 分为基于文本方式的多媒体信息检索; 基于内容特征的多媒体信息检索

10、第二章 第一节 信息检索系统 四、检索系统的质量评 价 1、检索工具收录文献的齐全情况 2、摘录及标引的质量 3、索引完备情况 4、报道时差 5、使用方便情况 第二节 信息标引及检索原理 一、信息标引 二、检索原理 一、信息标引的类型及作用 1、信息标引的含义 在信息处理过程中,将文献的内容特征 和外部特征转换成检索标识,即对有 检索价值的特征信息,例如题名、作 者、主题内容、类别等进行提取与标 识,并组织成索引文档,为用户的查 询和访问提供准确而有效的检索入口 。 标引给出信息标识 地下水 土壤水 动态变化 井灌区 S152.7分类号 主题词 2、信息标引的类型 分类标引赋予信息 分类号标识

11、的标引过程 主题标引赋予信息 主题词标识的标引过程 按标识的形态和性质分 按标引手段分 人工标引 自动标引 (1)标引深度(网罗度) 详尽程度网罗度越高, 有利于提高查全率 (2)标引专指度 精细程度专指度越高, 有利于提高查准率 3、信息标引的质量 二、检索原理 匹配 命中信息 提问标识 存储标识 原始信息 标引 检索工具 标识 匹配 存储标识 检索标识 标引 信息需求 检索语言 命中信息 检索者 存储过程 检索过程 第三节 检 索 语 言 一、检索语言的含义及作用 二、检索语言的类型 一、检索语言的含义及作用 n检索语言的含义 n检索语言的作用 把文献信息的存储与检索联系起来, 把标引人员

12、与检索人员联系起来以便取得共 同理解的语言,就叫检索语言。检索语言就 是根据检索需要而创造的一种人工语言。 检索语言的含义 保证 检索语言的作用 1、存储的一致性 2、检索与存储的一致性 3、使分散的信息系统化 4、获得最高的查全率和查准率 二、检索语言的类型及特点 检索语言 分类检索语言 主题检索语言 代码检索语言 标题词语言 叙词语言 关键词语言 1、分 类 检索语言 是用分类号和类名来表达信息的主题 概念。以科学分类为基础,运用概念划分 的方法,将知识按一系列的标准和逻辑规 则进行层层划分,形成一个严格有序的直 线式的知识门类等级体系。 构 成 原 理 体 系 分 类 表 马克思主义、列

13、宁主 义、毛泽东思想、邓 小平理论 哲 学 社会科学 自然科学 综合性图书 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 A 马克思主义、列宁主义、 毛泽东思想、邓小平理论 B 哲 学、宗教 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书 S1 农业基础科学 S2 农业工程 S3 农学(农艺学) S4 植物保护 S5 农作物 S6 园艺 S7 林业 S8 畜牧、动物科学

14、、 狩猎、蚕、蜂 S9 水产、渔业 中国图书馆分类法 S11 农业数学 S12 农业物理学 S13 农业化学 S14 肥料学 S15 土壤学 S157 水土保持 X1 环境科学基础理论 X2 社会与环境 X3 环境保护管理 X4 灾害及其防治 X5 环境污染及其防治 X7 废物处理与综合利用 X8 环境质量与环境监测 X9 安全科学 体 系 分 类 表 T 工业技术 X环境科学 TH 机械、仪表工业 TK 能源与动力工程 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TU 建筑科学 TV 水利工程 体 系 分 类 表 U交通运输 U1综合运输 U2

15、铁路运输 U4公路运输 U6水路运输 41道路工程 44桥涵工程 45隧道工程 46汽车工程 48其他道路运输工具 49交通工程与公路运输技术 管理 nTS轻工业、手工业 TS2食品工业 TS20一般性问题 TS22食用油脂加工工业一般性问题 TS27饮料冷食制造工业 TS29罐头工业 TS20一般性问题 TS201基础问题 TS202食品原料及添加剂 TS205食品加工与保藏 TS206食品包装学 TS208食品加工厂 TS209食品工业副产品加工与利用 分类检索语言的特点 按学科专业集中相关文献体现了学科 的系统性 从知识分类的角度揭示文献信息之间 的区别与联系 提供从学科专业领域检索文献

16、信息 2、主题检索语言 构 成 原 理 是以主题词来表达信息主题概 念的语言。利用自然语言中的名 词术语,经过一定程度的规范化 处理,作为表达文献和提问内容 的主题词 主题检索语言的 特点 n按特定事物集中文献信息,有较强的直 观性 按标识的特点和原理 标题词语言 叙词语言 关键词语言 标题词 (1)标 题 词 语言 经过规范化 代表文献的主题概念 对同义词进行优选 对词的不同形式进行归一 对近义词进行合并 对多义词进行注释 对简称进行补全 对俗称进行引见 对自然语言的优选 主标题词起主导作用 多为表现实物、材料、结构、 理论、 现象、工艺、过程等概念的词 副标题词起说明或限定作用 多为表现主标题词某一方面内的词 BRIDGE

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号