文档详情

信息检索与服务-信息管理概论-柯平15页

文库****9
实名认证
店铺
DOC
152KB
约15页
文档ID:173593406
信息检索与服务-信息管理概论-柯平15页_第1页
1/15

8 信息检索与服务信息检索是获取信息最重要、最有效的手段其作用在于节约检索者的时间和精力,避免科学研究中的重复劳动,指引读书治学等信息服务是与信息和信息工作密切相连的一种特定范围的劳动,同其它商品一样提供自己的特殊使用价值为社会带来财富本章概述了信息检索与服务的基本原理与方法,作为信息过程管理的一个重要组成部分 8.1 信息检索8.1.1 信息检索基础理论 1、信息检索(Information Retrieval)概述(1)信息检索的含义:狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程广义的检索包括信息的存储和检索两个过程:①信息存储(Storage)是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检 索功能的工具或检索系统,供人们检索和利用②检索(Retrieval)是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息2)信息检索的类型:①数据检索(data retrieval)数据检索:以文献中的数据为对象的一种检索。

存贮的信息是数据,检索时要搜索数据资料档,并针对提问输出答案数据检索是从文件、数据库或存储装置中查找和选取所需数据的操作或过程,包括数值形式和非数值形式的数据按查询问题的要求,分为简单检索(即单一因素的检索)和综合检索(即综合条件检索)如:查找各种物质的物理化学常数、各种统计数据和工程数据等某一新型载货汽车的载重量是多少?百公里油耗是多少?”)②事实检索(Fact Retrieval)事实检索以文献中的事实为对象,检索某一事件发生的时间,地点,或过程;存贮的信息是各种事实,检索时可以对被检索的事实作某种逻辑推理,进行比较和分析,然后再输出有关某一事物的具体答案如:查找鲁迅生于某年?世界上最长的斜拉桥是哪座?该桥位于什么地方?何时建成?事实检索要求检索系统不仅能够从数据 (事实) 集合中查出原来存入的数据或事实,还能够从已有的基本数据或事实中推导、演绎出新的数据或事实例如,系统中存储如下事实:①李明是A校学生②A 校学生都学外语如果该系统是事实检索系统,则它应当能回答某用户提出的“李明学外语吗?”这种问题事实检索是情报检索中最复杂的一种它要求系统中的数据和事实以自然语言或接近于自然语言的方式存储。

不仅要存入各种数据或事实单元,还要存入各单元之间的语义关系、句法关系以及各种有关的背景知识允许用户用自然语言提问,并能用自然语言作答更重要的是,系统必须具有一定的逻辑推理能力和自然语言理解功能目前事实检索通常还是依靠人工来完成③文献检索(Information Retrieval)文献检索:以文献原文为检索对象的一种检索存贮的信息是文章标题、著录项目和关键词组成的文献单元,检索时,按提问检索词查找文献资料档,输出文献题录和文摘例如,“设计人行天桥的参考文献有哪些?”文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成2、信息检索原理信息检索系统是通过信息存储和信息检索两个互逆的过程来实现系统的职能工作原理如下图所示一个完整的信息检索系统是由存储子系统和检索子系统两部分组成的1)存储过程对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程或生成检索工具库。

2)检索过程分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的应用过程3)信息存储与检索相互依存由于职业、知识水平、个人素质甚至习惯等因素的差异,信息存储人员(标引者)与信息检索用户(检索者)对同一信息的分析、理解会存在不同比如《计算机在生物化学中的应用》一文,标引者可能将其归入“生物化学”类,而检索者则可能在“计算机”类查找该文这样,标引者与检索者之间发生了标引错位,存储的信息就无法检索到 怎样才能保证信息存得进又取得出呢?那就是存储与检索所依据的规则必须一致,也就是说,标引者与检索者必须遵守相同的标引规则这样,无论什么样的标引者,对同一篇文献的标引结果一致,不论是谁来检索,都能查到这篇文献 信息存储与检索共同遵循的规则称之为信息检索语言(详见8.1.3)只要标引者和检索者用同一种检索语言来标引要存入的信息特征和要查找的检索提问,使它们变成一致的标识形式,信息的存储过程与检索过程就具备了相符性相应地,存入的文献也就可以通过信息检索工具(系统)检索出来如果检索失败了,那么就要分析一下检索提问是否确切地描述了待查课题的主题概念?在利用检索语言标引时是否出了差错,从而导致检索提问标识错误?只有检索提问标识和信息特征标识一致时,相关的文献才能被检索出来。

信息检索正是以信息的存储与检索之间的相符性为基础的如果两个过程不能相符,那么信息检索就失去了基础检索不到所需的信息,存储也就失去了意义3、信息检索方法(1)常用法又称直接法、工具法,是指直接利用检索系统(工具)检索文献信息的方法这种方法优点在于能够明确判断文献所包涵的信息内容是否符合需要,缺点是难以获得全面的文献,且费时费力如果检索课题单一,文献相对集中,又熟悉检索书刊,则可用这种检索方法,而对有多个主题、文献离散度较大的课题,就难以获得理想的检索效果由于此方法不依靠检索工具,因此不是严格意义上的文献信息检索方法它又分为顺查法、倒查法和抽查法①顺查法经过分析,确定查找文献信息的起始年代,再利用选定的检索工具或检索系统,由远及近地逐年查找,此法的检索效果显著,但费时费力,工作量较大如:查找《信息论》的资料可从1948年查起②倒查法利用选定的检索工具或检索系统,由近及远的逐年查找,重点是查找近期的文献信息,此法节省时间,但容易漏检这种方法多用于检索某一课题的新技术、新方法、新理论、新进展等③抽查法针对某学科处于兴旺发达时期的若干年进行文献信息的查找,此法的检索效果较好、效率也颇高,但使用的前提是必须熟悉该学科的发展过程及其特点。

2)追溯法追溯法是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果3)循环法 循环法又称分段法或综合法它是分期、分段交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果4、信息检索途径检索途径依赖于文献信息的特征文献具有两种特征:即外部特征和内容特征文献的外部特征主要是指文献载体上标明、易见的项目,有文献题名、责任者、序号、出版者、出版地、出版年等;文献的内容特征有所属学科及所属主题等因此,根据文献的外部特征和内容特征,将信息的检索途径分为两大类型1)内容特征途径①分类途径 分类途径是指按文献内容的学科分类体系查找文献信息的途径一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样编排的结果可将同一学科的文献集中,便于按学科查找文献分类目录和分类索引是普遍使用的分类检索工具分类途径缺点是,对于较难分类的新兴学科和边缘学科来说,查找不便,查找时须首先了解反映学科体系的分类表,再将概念变换为分类号,然后按分类号进行检索,由于概念变换为分类号的过程中易出差错,所以也会导致漏检和误检。

但是很多检索者希望从其熟悉的分类系统,从学科概念的上下左右关系了解事物的派生、隶属、平行等关系,满足族性检索的需求分类途径能够较好地满足这一要求②主题途径主题是文献所表达的中心思想、所讨论的基本问题和研究对象主题途径指根据表达文献主题内容的主题词及其派生出的关键词为标识查找文献信息的途径主题途径的主要检索工具是主题目录和主题索引,或标题词索引、关键词索引、叙词索引等主题目录按文献内容主题词组织,以文献所讨论的主题直接检索,可以查到分散于各学科里同一主题的文献主题索引是工具书辅助索引之一,它可揭示包含该主题的文献信息在文献正文中的位置主题途径检索文献信息的优点是,用主题词作为标识,表达概念准确、灵活、专指度高,可使同一主题的文献集中,检索效率高又由于主题词可随科技发展增加或更新,因此便于查找新兴学科的文献信息,在各学科和其分支交叉渗透日益增多的当前,主题途径较好地适应了这一要求主题途径检索文献信息缺点是,主题索引缺少学科系统的整体性和层次性,因此,难以达到很高的查全率③分类主题途径分类主题途径是分类途径与主题途径的结合,它能够尽量避免两者的不足,取其所长一般说它比分类体系更具体一些,无明显的学术层次划分,又比主题法概括一些,但保留了主题体系按字顺排序以便准确查检的特点。

④其它途径主要是指一些辅助检索途径,如按化学分子式排出的 “分子式索引”,可提供一种从分子式角度查找化学化工文献的目的,另外还有化学物质索引、合金索引、地名索引等各种专门索引,以满足查检特定种类文献信息的需求2)外部特征途径 ①著者途径著者途径,即通常所说的责任者途径著者是指对文献内容负责或作出主要贡献的个人或团体,包括著者名、评者、编者等著者途径是根据文献著(译、编)者的名称查找文献信息的途径,是外文检索工具较为重要的途径和惯用途径按著者姓名字顺排列,易于利用,又便于编排,也易于机械加工通过著者途径进行检索,可以查找特定学者、专家的最新论著,系统地发现和掌握他们的研究方向和研究进展在使用著者途径检索文献时,需要注意的是检索系统对著者索引的编制规则和不同国家作者姓名的拼写国外比较注重劳动者途径检索,而我国很少有人去记忆人名,故著者目录少②序号途径利用文献的代码、数字编号进行查找它的标识是书刊号、专利号、标准号等例如:ISBN号7(→国别)-5001(→出版社号)-0016(→序号)-7(→校验位)ISBN号是由10位数字组成,共分四段:㈠组号:代表出版者的国家、地理区域、语种等,我国的组号为“7”。

㈡出版者号:代表组内所属的一个具体出版者(出版社、出版公司等)由国家或地区的ISBN中心设置和分配,可取1-7位数字㈢书名号:由出版者给予每种出版物的编号㈣校验号: ISBN号的最后一位数值,它能够校验出ISBN号是否正确例如:武汉大学出版社出版的《图书馆学导论》,其中国标准书号是: ISBN7-307-00211-6/G 53其中,“7”为我国的组号,“307”为武汉大学出版社的代号,“00211”为书名号,表示该书是出版社出版的第211种书,“6”为校验码,G为分类号53”为种次号,即该书为G类的第53种书例如美国《化学文摘》的专利索引(Patent Index)、美国《政府报告通报和索引》(Grovernment Reports Announcements & Index)的合同号/资助号索引(Contract/Grant Number Index)和NTIS订购号/报告号索引(NTIS Order/Report Number Index) ③名称途径也称题名途径、书名途径题名是表达、象征、隐喻文献内容及特征的词或短语,是文献的标题或名称,包括书名、。

下载提示
相似文档
正为您匹配相似的精品文档