{企业组织设计}情报检索系统信息组织

上传人:精****库 文档编号:140929220 上传时间:2020-08-02 格式:PPTX 页数:17 大小:478.94KB
返回 下载 相关 举报
{企业组织设计}情报检索系统信息组织_第1页
第1页 / 共17页
{企业组织设计}情报检索系统信息组织_第2页
第2页 / 共17页
{企业组织设计}情报检索系统信息组织_第3页
第3页 / 共17页
{企业组织设计}情报检索系统信息组织_第4页
第4页 / 共17页
{企业组织设计}情报检索系统信息组织_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《{企业组织设计}情报检索系统信息组织》由会员分享,可在线阅读,更多相关《{企业组织设计}情报检索系统信息组织(17页珍藏版)》请在金锄头文库上搜索。

1、情报检索系统中的信息组织,目标,情报检索定义:信息单元的表示、存储、组织和存取 旨在满足用户的信息需求 用户的信息需求例如: 找到关于姚明在休斯敦火箭队的所有文献,包含 (1) 他与其他几位中国球员的交往 或(2) 他与女友的交往; 重点在查找相关信息,而不是数据,数据检索Data Retrieval 文献包含的关键词是数据 含义固定 一点小错误会造成查找失败 情报检索Information retrieval 关于一个主题或话题的信息 含义常常比较宽松,有一定范围 允许一些错误,不影响查到相关内容 情报检索系统IR system: 对信息对象内容的解释 排序反映了相关性 相关性是最重要的概念

2、,情报检索时代的来临 情报检索已不是图书情报领域关心的课题,随着万维网的来临,一跃成为受人关注的关键技术之一。,基本模型,用户目标 检索 信息或数据 有目的地 浏览 随意冲浪 F1; cars, Le Mans, France, tourism,基本概念,文件的逻辑视图 数字化文本可以用全文进行索引,而不必只取“关键词”或“分类号”,结构,分词,禁用词,名词词组,词干/同义词,人工标引,文件,情报检索流程,简介,情报检索系统采用索引词处理提问(匹配) 索引词: 关键词或者规范词 任意词 用到切分或截词: connect: connecting, connection, connections

3、倒排档用于查检操作,Introduction,文件,信息需求,索引词,文件,提问,排序,匹配,简介,排序是检出文献对于用户提问的相关程度的顺序 以下原因造成问题: 索引词的匹配不太精确 用户常常会不满足 由于用户没有经过提问式编写的培训,检索效果会更糟 Web上的情报检索更是如此 相关性的测度成为匹配与排序的关键问题,情报检索模型,检索: 实际上是信息过滤,浏览,用户目的,情报检索模型,情报检索模型, 文件的逻辑视图, 以及检索任务是情报检索的三个不同方面,经典模型 基本概念,每篇文献用关键词或索引词来代表 索引词是特定文献中有意义的或代表文献主题的词 通常索引词为名词,因为只有名词自身才有意

4、义 然而搜索引擎将所有词都进行索引,成为全文索引,但是并不是所有词对于特定文献都具有相等的代表性:低频词更能区分文献(具有更小的命中文献集合) 索引词的重要性由赋予它的权重决定 如 ki 为一索引词 dj 为一文献 wij 为 (ki,dj)的权重 权重 wij 代表了索引词ki在文献dj中的重要性,经典模型 基本概念,ki 为一索引词 dj 为一文献 t 是检索系统中文献的总数 K = (k1, k2, , kt) 索引词集合 wij = 0 是与 (ki,dj)相关的权重 wij = 0 表示该词不在某篇文献dj中 vec(dj) = (w1j, w2j, , wtj) 是关于文献dj的权重矢量 gi(vec(dj) = wij is 是返回关于(ki,dj) 权重的函数,经典模型 基本概念,数字图书馆中的情报检索,一般认为数字图书馆是: 数字对象的集合所构成的资源库; 描述这些数字对象的元数据库; 实用这些数字对象的目标用户; 提供各种服务(捕捉、标引、编目、查询、浏览、检索、传递、存档、长期保存等)的系统,数字图书馆与情报检索,情报检索对于数字图书馆是至关重要的,可以使数字图书馆更为高效而且易于使用 情报检索同时是数字图书馆的一个很重要的研究领域和核心技术之一,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号