信息检索知识点总结.docx

上传人:m**** 文档编号:560883235 上传时间:2023-01-22 格式:DOCX 页数:8 大小:37.51KB
返回 下载 相关 举报
信息检索知识点总结.docx_第1页
第1页 / 共8页
信息检索知识点总结.docx_第2页
第2页 / 共8页
信息检索知识点总结.docx_第3页
第3页 / 共8页
信息检索知识点总结.docx_第4页
第4页 / 共8页
信息检索知识点总结.docx_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《信息检索知识点总结.docx》由会员分享,可在线阅读,更多相关《信息检索知识点总结.docx(8页珍藏版)》请在金锄头文库上搜索。

1、精选文档.信息检索考点整理( 1.信息检索的看法广义的信息检索是指将信息按必定的方式组织、储存起来,并依据信息用户的需要找出相关信息的过程,包含信息的储存和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。2.信息检索的原理就是将检索者的检索发问表记与储存在检索工具中的信息特色表记进行符合性比较,凡是信息特色表记与检索发问表记相一致或许信息特色表记包含着检索发问的表记,则拥有该特色的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。3.为何说信息储存和检索是两个不行切割的有机体?检索的全过程包含储存和检索两个过程,储存和检索是相辅相成、不行切割的。储存过程主若是利用检索语言对

2、文件进行标引,形成文件特色表记并输入检索工具,为检索供给有规律的检索门路;检索过程主若是利用检索语言对检索发问进行标引,形成检索发问表记,再按照储存所供给的检索门路,将检索发问表记与文件特色表记进行比较。检索过程是储存过程的逆过程。所以,检索者只有在全面认识储存者是如何把文件存入到检索工具中去此后,才知道如何从检索工具中把所需要的信息检索出来。4.信息检索的方法1)顺查法2)倒查法3)抽查法4)追想法5)循环法5.信息检索的门路1)内部特色门路分类门路主题门路2)外面特色门路题名门路著者门路文件编号门路目录检索门路机构检索法引文检索门路6.布尔模型的优弊端长处:(1)简单,形式简洁,易于理解;

3、2)可操作性强,应用宽泛;3)构成的逻辑发问式可以表达与用户思想习惯相一致的盘问要求,供给特别精确;.的语义看法;(4)能办理结构化发问。弊端:(1)表达用户复杂需求成效欠佳2)正确般配没法供给定量比较3)般配标准不尽合理4)检索结果不易控制7.概率排序原则:假如一个检索系统对用户的每个检索发问的反响是以文件会集中的文件按相关性递减的序次摆列的,那么系统的整体成效是最好的。8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,依据必定的方法组织和储存信息,并经过人机对话从计算机储存的大量数据中自动输出用户所需的那部分信息的过程。实质上计算机信息系检索是利用计算机信息检索系

4、统储存和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合。9.计算机信息检索的种类:(1)依据检索系统的工作方式,可分为:a).脱机信息检索脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为储存介质,而且为连续的序次检索方式,适合大量量的定题信息检索。b).联机信息检索联机信息检索是利用计算机终端设备,经过通讯线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获守信息的过程。联机检索模式是主从式,即为所有的工作都在主机长进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,所以对主机的性能要求极高。c).光盘信息检索d).网络信息检索

5、(2)依据信息的服务方式,可分为:a).定题检索定题检索是用户依据课题的要求,早先编写出逻辑检索发问式,并将储存在计算机的储存器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时获得最新的文件信息。拥有按期性、新奇性和批办理性的特色。b).回溯检索回溯检索是追想查找过去的信息,让用户一次检索一段时间内与某一课题相关的信息。也可以查找最新的信息,可以适应多数用户的盘问需要。c).平常检索10.计算机信息检索技术初级检索6个1) 布尔逻辑检索;.地点限制检索短语检索截词检索字段限制检索区分大小写检索11.计算机信息检索技术高级检索6个加权检索自然语言检索

6、相关信息反响(相像检索)看法检索模糊检索聚类检索布尔逻辑检索(1)逻辑与用AND或*表示检索式写作AANDB或A*B(2)逻辑或用“OR”或“+”表示(3)逻辑非用NOT或表示ANOTB(A中间除去B所剩下的)字段名称及缩写ABabstractTItitleAUauthorJNjournalnameLAlanguagePYpublicationyearSPsourcepublication( 分类和聚类的异同同样点:基于“类”的思想进行检索。不一样点:(1)分类基于分类法,其类目系统主若是先组式,有系统性的。类目与文件之间拥有相对独立性。而聚类则先有文件后聚类,类的性质及整体类目系统完整由系统

7、中的文件决定。(2)从类目形成过程看,分类是总到分,聚类由分到总。会成立检索式(主若是积木型)12.计算机信息检索策略含义狭义的计算机信息检索策略是指检索发问式的成立,即运用系统特定的检索技术,确立检索词之间的逻辑关系,形成表达用户信息需求的检索发问式。广义的计算机信息检索策略是指在解析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确立检索门路与检索用词,以及检索词之间逻辑关系与查找步骤最正确方案的一系列科学安排。13.计算机信息检索策略种类(即联机检索五原则)1)最专指面优先:从最专指的看法下手2)最低登录量面优先3)积木型(要点掌握,会成立此检索式)4)引文珠型增加5)逐次分馏;

8、.14.网络信息资源的谈论方法:(1)定性谈论法:是指依据必定的谈论标准从主观角度对网络信息资源所做的精选和评估,主要有指标系统法和检查表法。2)定量谈论法:国内外比较典型的定量谈论方法有信息计量法、层次解析法和对应解析法等三种。3)综合谈论法:是定性谈论和定量谈论相联合的一种方法,有包含解析法、模糊综合谈论法等。4)分类方法:分为第三方谈论法、用户谈论法和网络计量法。15.搜寻引擎的种类:1)按检索系统区分:检索型、目录型和混杂型检索工具2)按检索内容区分:综合型、专题型和特别型检索工具3)按包含检索工具数目区分:独自型和会集型检索工具4)按检索资料种类分:万维网检索工具和非万维网检索工具1

9、6.元搜寻引擎的含义所谓元搜寻引擎,是对分布于网络的多种检索工具的全局控制系统,它经过一个一致用户界面帮助用户在多个搜寻引擎中选择和利用适合的搜寻引擎来实现检索操作。17.元搜寻引擎的特色:1)虚假索引数据库2)查全率高3)用户界面友善4)适合二次加工5)扩展性好搜寻引擎118.元搜寻引擎的工作原理输入查选择搜提交查搜寻引擎2整理返询条件索引擎询央求回结果搜寻引擎3( 19.实现跨语言信息检索的方法:1)发问式翻译方法2)文件翻译方法(独一结果是源语言描述)3)发问式文件翻译方法(将盘问语言发问式翻译成目口号言发问式,与目口号言描述的信息库进行般配,检索相关信息,而后再把检索结果的所有或部分内

10、容翻译成盘问语言描述的信息。检索结果一般选择部分翻译,这样工作量较小,简单提升翻译的效率和质量,部分翻译一般是对结果文本的前两行、文摘或文本中重要的词进行翻译,在重要词的翻译中,如何确立重要词是决定这类方法成效的要点。4)中间语种翻译方法5)非翻译方法显示查询结果;.20.语义网的应用1)Web服务2)智能信息检索3)基于语义的网页搜寻引擎4)企业数据管理21.Ei收录论文的两个层次1)Compendex数据。数据的内容全面,主要包含:论文标题;作者;作者单位;英文文摘;论文所在期刊名称;卷,期;论文页码;分类码;主题辞等等。此中:分类码;主题辞需要专业人员独自给出。2)PageOne数据:数

11、据内容主要包含:论文标题;作者;作者单位;论文所在期刊名称;卷,期;论文页码;少量数据带有英文文摘。不需要任何专业人员再做工作。22.Compendex数据和PageOne数据的主要差别在于:数据中能否有分类码和主题辞;有这两项内容的数据是Compendex数据,反之是PageOne数据。有没有主题辞和分类号是判断论文能否被Compendex数据正式收录的独一标记。23.主题指南按字母序次列出与分类表中类目名称相关的主题辞,并注明相关的分类号,其实是分类表的主题索引,是从分类门路检索文件的指南。便于不可以确立分类号的读者实现从主题查到分类号,再由分类号查到文件所在页码。24.SCI(科学引文索

12、引)的编制结构及检索方法1)引文索引2)本源索引3)机构索引4)轮排主题索引25.如何决定收录期刊的数目和种类?(1)“加菲尔德文件会集定律”确立适合的期刊数目该定律以为:在几万种科技期刊中,最重要的期刊(即中心期刊)但是一千种,甚至可能还不足500。因此,把收录期刊的范围定在3000种之内,足以把重要的科技文件包含在内。(2)“花费成效原则”用来选择每一种期刊,详尽方法是“引用频率统计法”先计算一种期刊在一年内被引用的总次数,再计算此中每篇论文的均匀引文章,其余要素对引文章的影响经过加某些修正系数来解决,引用频率越高,说明该刊质量越高。经过上述两个指标决定了收录期刊的数目和种类26.什么是专

13、利?这类受法律保护的发明就称专利。含义:专利权法律受专利法保护的发明创建专利技术;.专利说明书等专利文件文件这三层含义的中心是受专利法保护的发明,而专利权和专利文件是专利的详尽表现。27.什么是同族专利?同族专利指同一个发明为了在不一样国家获得保护,而在这些国家分别申请的一系列内容同样或基真同样的专利。因为同族专利或同样专利都拥有同样的优先权项,所以经过优先权项可以方便、快捷地检索出相关同一发明的所有同样专利或同族专利。28.专利的种类1)发明专利2)适用新式专利3)外观设计专利4)植物性专利5)防卫性专利知识产权:工业产权和著作产权29.学位论文的文件价值:1)较高价值的一次文件:写作不受篇

14、幅限制,论述详尽:从研究背景、技术线路、实验方法到数据获得、解析结论论述翔实。2)宝贵的信息资源价值:能会集反响所在单位的科研领域、学术活动、研究进展和最新成就,论文的使用者可以追踪名校导师的科研进度。3)综述性二次文件:对相应研究领域有系统深入的谈论和综述,拥有详尽的参照文件,可获得课题研究现状综述。4)写作技巧的启迪蓝本:经过对学位论文的阅读,可大体梳理出作者的写作思路和研究方法,学习学位论文的写作方法。30.信息检索谈论方法1)测试文档会集法2)人机交互3)用户体验日记解析法4)自然察见解31.召回率:R=(检索出的相关文件量/数据库中的所有相关文件)x100%正确率:P=(检索出的相关文件量/检出的文件总量)x100%32.均匀正确率(并会计算)均匀正确率是一个经过所有相关文件测定系统绩效的单值指标。假如检索系统能快速返回所需的相关文件,并对被检文件进行等级排序,则该系统的性能较好。均匀正确率是求各个相关文件正确率的均匀值。所以均匀正确率的计算只考虑相关文件的数量,而与检出文件的总量没关。;.;.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号