网络信息检索基本方法.ppt

上传人:m**** 文档编号:568487884 上传时间:2024-07-24 格式:PPT 页数:73 大小:2.17MB
返回 下载 相关 举报
网络信息检索基本方法.ppt_第1页
第1页 / 共73页
网络信息检索基本方法.ppt_第2页
第2页 / 共73页
网络信息检索基本方法.ppt_第3页
第3页 / 共73页
网络信息检索基本方法.ppt_第4页
第4页 / 共73页
网络信息检索基本方法.ppt_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《网络信息检索基本方法.ppt》由会员分享,可在线阅读,更多相关《网络信息检索基本方法.ppt(73页珍藏版)》请在金锄头文库上搜索。

1、LOGO第二讲第二讲网络信息检索基本方法网络信息检索基本方法2010-9-13【目的与要求目的与要求】v掌握布尔逻辑检索等网络信息检索的基本技术。掌握布尔逻辑检索等网络信息检索的基本技术。v熟悉网络信息检索的途径和步骤。熟悉网络信息检索的途径和步骤。【重点重点】v布尔逻辑语言、邻近检索、截词检索布尔逻辑语言、邻近检索、截词检索【难点难点】v邻近检索邻近检索影响信息检索质量的因素影响信息检索质量的因素影响信息检索质量的因素影响信息检索质量的因素v信息资源本身的质量对信息检索的影响(鱼龙混杂,参差不齐)信息资源本身的质量对信息检索的影响(鱼龙混杂,参差不齐)v检索软件对信息检索的影响(不同的搜索引

2、擎,数据库系统)检索软件对信息检索的影响(不同的搜索引擎,数据库系统)v用户水平对信息检索的影响用户水平对信息检索的影响 网络信息检索的基本技术网络信息检索的基本技术网络信息检索的基本途径网络信息检索的基本途径网络信息检索基本步骤网络信息检索基本步骤网络信息检索网络信息检索基本方法基本方法 MACTH计算机将检索提计算机将检索提问词问词文献记录标引词文献记录标引词信息检索过程的实质:信息检索过程的实质:信息检索过程的实质:信息检索过程的实质:智智能能检检索索 基本技术基本技术邻近检索邻近检索 字字段段限限制制检检索索布尔逻辑检布尔逻辑检索索截词检索截词检索模糊检索模糊检索词组检索词组检索一、网

3、络信息检索的基本技术一、网络信息检索的基本技术一、网络信息检索的基本技术一、网络信息检索的基本技术1.1.布尔逻辑检索(布尔逻辑检索(布尔逻辑检索(布尔逻辑检索(booleanbooleanlogiclogic)v逻辑检索是一种比较成熟、较为流行的检索技术,现代的情报检索系统大多都采用这种技术。v逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(boolean logic operator),v它的作用主要是利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索v标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。v主要运算符有 “和(and,*)”、“或(o

4、r,+)”、“非(not,-)”。v运算优先级顺序为运算优先级顺序为NOT、AND、OR,可以用括号,可以用括号“()”改变它们的运算顺序。改变它们的运算顺序。如如Aand(BorC),检索顺序为先检索顺序为先B或或C,然后再与然后再与A实例:实例:实例:实例:v【实例】在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。逻辑算符举例逻辑算符举例逻辑算符举例逻辑算符举例查找关于查找关于“动物保护动物保护”的文献:的文献:v“动物动物AND保护保护”查找有关冬虫夏草的文献:查找有关冬虫夏草的文献:v“冬虫夏草冬虫夏草or冬虫草冬虫草or虫草虫草”查找关于能源方面的文章,但关于查

5、找关于能源方面的文章,但关于“核能核能”的不要:的不要:v“energynotnuclear”(energy-nuclear)检索西红柿种植技术的相关文章:检索西红柿种植技术的相关文章:v(西红柿西红柿+番茄番茄)*(种植种植+栽培栽培+培育培育)Exercise1Exercise1:v查找电子图书的标准查找电子图书的标准(DigitalbookORelectronicbookORe-bookORonlinebook)ANDstandardvGoolge的默认运算符就是逻辑的默认运算符就是逻辑“与与”,用空格、,用空格、“AND”和和“+”都表示,而逻辑都表示,而逻辑“非非”只能用只能用“-”

6、而不而不能用能用“NOT”表示,逻辑表示,逻辑“或或”用用“OR”表示。表示。v百度的默认运算符是逻辑百度的默认运算符是逻辑“与与”,空格均表示逻辑,空格均表示逻辑“与与”。v在在ISIWebofKnowledge平台上,逻辑算符平台上,逻辑算符“AND”、“NOT”、“OR”不区分大小写,但不支持以不区分大小写,但不支持以“*”、“-”、“+”代替。代替。v在在ScienceDirect中,逻辑中,逻辑“非非”是用是用“ANDNOT”表示,而不是我们常用的表示,而不是我们常用的“NOT”。2.2.词组检索(词组检索(词组检索(词组检索(phrasesearchphrasesearch)v通常

7、在所检索词上加通常在所检索词上加“”对所检索词视为词组处理,表示检索与对所检索词视为词组处理,表示检索与“”内形内形式完全相同的短语,以提高检索的精度和准确度,因而也有人称之为式完全相同的短语,以提高检索的精度和准确度,因而也有人称之为“精精确检索确检索”(exactsearch)。)。v例如:例如:“动物保护动物保护”,表示动物保护是个词组,检索结果动物和保护不能,表示动物保护是个词组,检索结果动物和保护不能分开。若不加分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。息地保护、动物资源保护等形式。v

8、ScienceDirect用双引号用双引号“”表示宽松短语检索,标点符号、连表示宽松短语检索,标点符号、连字符、停用字等会被自动忽略,如检索式为字符、停用字等会被自动忽略,如检索式为“heartattack”会检会检出包含出包含“heartattack”和和“heart-attack”的检索结果。的检索结果。v在该数据库中,精确检索是用在该数据库中,精确检索是用“”表示。表示。v邻近检索有时又被称为位置算符检索。v因此,我们要利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。v在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。在不

9、同的检索系统中,所采用的位置算符是不同的,功能也有差异。下面以全球最大的联机检索系统Dialog为例来说明位置算符的用法,OCLC也是如此。3.3.邻近检索(邻近检索(邻近检索(邻近检索(proximitysearchproximitysearch)布尔逻辑运算符和词组检索虽然能有效的扩大和缩小检索范围,但无法对检索词之间的相对位置进行限制 文献记录中词语的相对次序或位置不同,所表达的意思可能不同又称为位置算符检索,用来规定检索系统原始记录中的检索词之间的特定位置关系 同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样我们要利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而

10、使检索出的文献更确切地符合用户要求,提高查准率。Eg:“粉末的掺合与颜料包装 ”(W)WITH(W)WITH算符算符算符算符v表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。者是逗号。【实例实例】在在OCLC中输入中输入communicationwsatellite;wN(withN)wN(withN)算符算符算符算符v表示两个检索词之间插有表示两个检索词之间插有n个词,但顺序不能颠倒。个词,但顺序不能颠倒。v表达式:表达式:AWNBAB两词靠近,次序为两词靠近,次序为A先先B后,中间最多可后,中间最多可加加n个词。

11、个词。v【实例实例】在在EBSCO中输入中输入communicationw3satellite;N(NearN(Near) )算符算符算符算符 N( Near)表示两个检索词可以互换顺,二者之间只能间隔连字符、空格或者是逗号。v表达式:表达式:ANB:AB两词靠近,次序可变。两词靠近,次序可变。【实例】在OCLC中输入communication n satellite; nNnN ( Near N)( Near N)算符算符算符算符v表示两个检索词之间可以插入表示两个检索词之间可以插入n个词并且词序可以颠个词并且词序可以颠倒倒v表达式:表达式:A(nN)B:AB两词靠近,次序可变,中间两词靠近

12、,次序可变,中间最多可加最多可加n个词。个词。【实例】在EBSCO中输入communication n3 satellite;比较:在EBSCO中输入source and law、source w2 law(F F)FieldField(F)表示在此运算符两侧的检索词必须同时出现在文献记录的同一)表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内,如出现在篇名字段、文摘字段等,但两个词的前后顺序不字段内,如出现在篇名字段、文摘字段等,但两个词的前后顺序不限,夹在两个词之间的词的个数也不限。限,夹在两个词之间的词的个数也不限。(S)(S)算符算符算符算符v(S)算符表示在此运算符两侧的

13、检索词必须同时出现在算符表示在此运算符两侧的检索词必须同时出现在文献记录的子字段或同一段话中,两个词次序不限,中间文献记录的子字段或同一段话中,两个词次序不限,中间插入词的数量也不限。插入词的数量也不限。4.4.截词检索截词检索截词检索截词检索(truncation/wildcat)(truncation/wildcat)v截词检索又称部分一致检索,是指在检索标识中保留相同的部分,截词检索又称部分一致检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符用同部

14、分标识的记录全部检索出来。截词符用“?”或或“*”标识。标识。v截截词词检检索索是是预预防防漏漏检检,提提高高查查全全率率,尤尤其其适适用用于于英英语语,常常用用于于处处理理词词语语的的单单复复数数,不不同同拼拼写写方方式式,相相同同词词根根的的近近义义词词,以以及及动动词词的的不不同形式等。同形式等。后截断无限截断无限截断同根词检索同根词检索如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截断有限截断单复数单复数也称也称也称也称“ “右截右截右截右截” ”中截断中截断用用于

15、中美拼写不同于中美拼写不同和单复数和单复数前截断前截断同根词检同根词检索索如:如:如:如:m?nmanmen如:如:如:如:* * * *computercomputercomputercomputerminicomputerminicomputercomputercomputermicrocomputermicrocomputer“ “左截左截左截左截” ”v特别提示:特别提示:“*”、“?”的比较的比较v“*”,无限截词,代表,无限截词,代表0-无数个字符如无数个字符如regard*,代表代表regard,regarding,regardless等。等。v“?”,有限截词,代表,有限截词,

16、代表0-1个字符,如个字符,如library?,?,library,librarys。5.5.字段限制检索技术(字段限制检索技术(字段限制检索技术(字段限制检索技术(fieldlimitingfieldlimiting)组成数据库的最小单位是记录,组成数据库的最小单位是记录,一条完整的记录中的每一个著录事项为字段。一条完整的记录中的每一个著录事项为字段。一般来说,数据库的记录基本包括下列字段:一般来说,数据库的记录基本包括下列字段:v题名(题名(TI,title)、v关键词(关键词(KW,keyword)、v主题词(主题词(DE,descriptor)、v文摘(文摘(AB,abstract)、

17、v全文(全文(FT,Fulltext)、v作者(作者(AU,author)、v作者机构(作者机构(CS,CoporateSource)v期刊名称期刊名称(JN,Journal)、v出版国出版国(CO,Country)、v出版年份出版年份(PY,PublicationYear)、v语种语种(LA,Language)v字段限制检索就是通过限制字段和限制字段的范围来缩小检索结字段限制检索就是通过限制字段和限制字段的范围来缩小检索结果,达到精确检索的方法。果,达到精确检索的方法。v检索方式主要有:限定字段检索和限定范围检索检索方式主要有:限定字段检索和限定范围检索(1)限定字段检索:将检索词限定在特定

18、的字段中,一般有两种表达方式。)限定字段检索:将检索词限定在特定的字段中,一般有两种表达方式。前缀方式,将检索词放在所限定的字段代码之后,如用在著者(前缀方式,将检索词放在所限定的字段代码之后,如用在著者(AU)、刊)、刊名(名(JN)、出版年()、出版年(PY)、语种()、语种(LA)等字段后,)等字段后,例如:例如:AU=Evans,A.,LA=Chinese后缀方式,将检索词放在字段代码之前,之后用字段限定符号:后缀方式,将检索词放在字段代码之前,之后用字段限定符号:in或或/;如:;如:Furniture/TI即家具一词出现在题目中。即家具一词出现在题目中。v(2)限定范围检索:是通过

19、使用限定符来限制信息的检索范围,以达到)限定范围检索:是通过使用限定符来限制信息的检索范围,以达到优化检索的方法。优化检索的方法。v不同的检索系统略有不同,常通过使用的有:不同的检索系统略有不同,常通过使用的有:“=、=、:、:”等。等。v表达式:字段名表达式:字段名=(=、)、)v例如:例如:PY=1995即限定出版年份为即限定出版年份为1995及以后的文献;及以后的文献;PY=1996:2005即即1996年至年至2005年的文章年的文章思考:比较思考:比较思考:比较思考:比较3 3个检索式检索结果的不同个检索式检索结果的不同个检索式检索结果的不同个检索式检索结果的不同v“Informat

20、ionretrieval”/TIvInformationANDretrieval/TIvInformation(F)retrievalv不仅要求在题名字段中,还要求两者必须与输入的形式完全相同不仅要求在题名字段中,还要求两者必须与输入的形式完全相同v只要求在题名字段中,而不严格限制它们是短语,如只要求在题名字段中,而不严格限制它们是短语,如“informationorganizationmethodsforeffectiveretrieval”v只需要在同一个字段中只需要在同一个字段中Exercise2:Exercise2:v查找华中科技大学罗俊院士查找华中科技大学罗俊院士1999年以来发表的

21、文章?年以来发表的文章?vAU=LuoJunAND(CS=HuazhongUniv*)ANDPY=1999v查找查找2002年出版或发表的关于克隆人立法方面的英文著作或论文。年出版或发表的关于克隆人立法方面的英文著作或论文。v“Thelegislationofhumancloning”orhumancloneandlegislat*andLA=EnglishandPY=2002大多数网络检索工具都有类似于字段限制检索的功能,可将查找范围限制在大多数网络检索工具都有类似于字段限制检索的功能,可将查找范围限制在特定的范围中,如:特定的范围中,如:v标题(标题(title)v图像(图像(image)

22、v文本(文本(text)v统一资源定位符(统一资源定位符(url)v网站(网站(site)v链接(链接(link)v举例:举例:url:Link:whitehouse.govsite:www.harvard.edu6.6.区分大小写检索(区分大小写检索(区分大小写检索(区分大小写检索(case-case-sensitivesensitive)vchina-china,China,CHINAvChinaChinavWindows,windows7.7.模糊检索(模糊检索(模糊检索(模糊检索(fuzzysearchfuzzysearch)v又称概念检索又称概念检索(相关检索)(相关检索)。当我们输

23、入一个检索词时,搜索引擎不仅反馈。当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来与关键词意义相近的内容。包括了该关键词的网址,同时也发来与关键词意义相近的内容。v如如“检索检索”,查找查找,寻找寻找,找寻找寻,找一找找一找.v如如“土豆土豆”,模糊检索的检索结果中会返回包括,模糊检索的检索结果中会返回包括“土豆土豆”、“马铃薯马铃薯”、“洋芋洋芋”等含义相近或相关的内容。等含义相近或相关的内容。v现在大多数搜索引擎都有这种功能,只不过模糊程度不同。现在大多数搜索引擎都有这种功能,只不过模糊程度不同。8.8.自然语言检索(自然语言检索(自然语言检索(自然语言检索(nat

24、urallanguagenaturallanguagesearchsearch)v即直接采用自然语言中的字、词、句进行提问式检索,即直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。同一般口语一样。v智能检索智能检索vCouldyoupleasegivemesomeinformationonEnglishliterature?v这种智能检索也是搜索引擎发展的趋势。这种智能检索也是搜索引擎发展的趋势。v实际检索时,需要将上述各种方法综合使用才能获得最实际检索时,需要将上述各种方法综合使用才能获得最佳检索效果。如佳检索效果。如“查找查找2000年以来年以来PeterSuber教教授撰写

25、的关于开放存取授撰写的关于开放存取”的论文?可以构建检索式为:的论文?可以构建检索式为:OpenAccessOROAOR*freeresourcesOROpenSource)AND(AU=PeterSuber)ANDPY=2000。v检索式的构建不是一蹴而就的,需要根据检索结果的多检索式的构建不是一蹴而就的,需要根据检索结果的多寡和精准程度进行不断调整。另外需要特别注意的是,寡和精准程度进行不断调整。另外需要特别注意的是,不同的检索系统所使用的算符类型和符号各异,本文拘不同的检索系统所使用的算符类型和符号各异,本文拘于篇幅无法一一列举,因此使用检索系统尤其是数据库于篇幅无法一一列举,因此使用检

26、索系统尤其是数据库前必须浏览帮助系统,详细了解字段及算符的设置情况,前必须浏览帮助系统,详细了解字段及算符的设置情况,以确定最合适的途径进行检索。以确定最合适的途径进行检索。二二二二. .网络信息检索的基本途径网络信息检索的基本途径网络信息检索的基本途径网络信息检索的基本途径v即我们常说的检索点即我们常说的检索点AccessPoint检索点即是检索信息或文献时所通过或使用的渠道检索点即是检索信息或文献时所通过或使用的渠道,而检索工具提而检索工具提供的检索点是多种多样的,它以检索的对象文献的特征而定。供的检索点是多种多样的,它以检索的对象文献的特征而定。科技文献有两方面的特征,一是外表特征科技文

27、献有两方面的特征,一是外表特征文献载体的外表上记文献载体的外表上记明的易见的线索;二是文献的内容特征明的易见的线索;二是文献的内容特征即从文献内部包含的知即从文献内部包含的知识信息中的内隐的潜在的线索。识信息中的内隐的潜在的线索。1.1.按文献外表特征的检索途径:按文献外表特征的检索途径:按文献外表特征的检索途径:按文献外表特征的检索途径:v名称途径名称途径即根据书名、刊名、篇名来查找文献信息的途径,它是把文献名称按照字顺排列起来成为一个体系,构成书名检索点、刊名检索点和篇名检索点。v著者途径著者途径以著作者(个人著者、团体著者、专利发明人、专利权人、合同人及机构等),提供以作者字顺为途径的检

28、索点,以实现对知名专家或专业学术机构研究成果和科技成果的检索。v序号途径序号途径指通过号码(包括报告号、合同号、专利号、标准号、馆藏号、索取号、排架号等)查找文献的途径,这种途径主要是利用各种号码索引来组织检索,号码索引 一般是按照字母顺序和号码顺序编排。2.2.按文献的内容特征的检索途径按文献的内容特征的检索途径按文献的内容特征的检索途径按文献的内容特征的检索途径v以文献的内容特征作为检索途径。即按照课题要求来查找文献的方法,更以文献的内容特征作为检索途径。即按照课题要求来查找文献的方法,更宜于用来检索未知线索的文献。宜于用来检索未知线索的文献。分类途径分类途径按学科体系查找文献的途径 ,主

29、要利用分类目录或分类 索引 的方法,通过利用专业知识确定所研究的课题所需文献属于什 么类别,它在个学科体系中的地位,再进行检索的方法。主题途径主题途径通过文献资料的内容主题进行检索的途径,即利用从文献资料 中抽出来的或经过人工规范化的能代表文献资料内容实质的标 引词来检索,检索词可分为关键词、标题词、元词、叙词等几 种类型。v综合来说,分类途径和主题途径是文献检索的常用途径,但一些检索综合来说,分类途径和主题途径是文献检索的常用途径,但一些检索工具还提供了分子式索引、环系索引、化学物质索引、会议索引、图书索工具还提供了分子式索引、环系索引、化学物质索引、会议索引、图书索引等,作为某些专业与学科

30、检索用的辅导性检索途径。引等,作为某些专业与学科检索用的辅导性检索途径。1.23从已知文献特征选择检索途径,如果事先已知文献名称、著者、从已知文献特征选择检索途径,如果事先已知文献名称、著者、序号等条件,应相应采用名称索引、号码索引或有关的目录索序号等条件,应相应采用名称索引、号码索引或有关的目录索引。引。从检索工具提供的索引选择检索途径。从检索工具提供的索引选择检索途径。从课题检索要求选择检索,课题学科范围要求广的应用特性从课题检索要求选择检索,课题学科范围要求广的应用特性检索检索-主题途径,范围窄的采用分类途径。主题途径,范围窄的采用分类途径。3.3.选择检索途径的原则选择检索途径的原则选

31、择检索途径的原则选择检索途径的原则三三三三. .网络信息检索基本步骤网络信息检索基本步骤网络信息检索基本步骤网络信息检索基本步骤v思考:思考:我们想想完成一个检索任务,哪些要素必不可少?我们想想完成一个检索任务,哪些要素必不可少?检索词、检索式(检索策略)、检索途径、检索系统检索词、检索式(检索策略)、检索途径、检索系统 检索前的准备工作检索前的准备工作1.网络信息检索基本步骤示意图网络信息检索基本步骤示意图网络信息检索基本步骤示意图网络信息检索基本步骤示意图课题分析课题分析2.2.选择检索系选择检索系统统3.确定检索确定检索途径和检途径和检索方法索方法4.确定检索词确定检索词6.实施检索、实

32、施检索、分析检索分析检索结果、索结果、索取原文取原文5.制定检索制定检索策略,编策略,编制检索式制检索式7.调整检索调整检索式,优化式,优化策略策略v主要指明确检索目的与要求。主要指明确检索目的与要求。分析课题的主要内容及所涉及学科范围,以便确定有关检索标识(分类)分析课题的主要内容及所涉及学科范围,以便确定有关检索标识(分类)、检索途径和选择合适的检索工具。、检索途径和选择合适的检索工具。分析课题所需信息的类型、文献量、年代范围、涉及语种、有关著者、分析课题所需信息的类型、文献量、年代范围、涉及语种、有关著者、机构等。机构等。确定课题对查新、查准和查全的指标要求,例如:确定课题对查新、查准和

33、查全的指标要求,例如:v若要了解某学科、理论、课题等最新进展和动态,则要检索最近的文献信息,若要了解某学科、理论、课题等最新进展和动态,则要检索最近的文献信息,强调强调“新新”字;字;v若要解决研究中某具体问题,找出技术方案,则要求检索有针对性、能解决实若要解决研究中某具体问题,找出技术方案,则要求检索有针对性、能解决实际问题的文献信息,强调际问题的文献信息,强调“准准”字;字;v若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调则要检索详尽、全面、系统的文献信息,强调

34、“全全”字。字。1.课题分析课题分析2.2.选择检索系统选择检索系统选择检索系统选择检索系统主要是根据课题的检索要求选择合适的检索工具或数据库,如:主要是根据课题的检索要求选择合适的检索工具或数据库,如:v查找图书查找图书可用可用OPAC书目数据库;书目数据库;v查学科术语或数据等查学科术语或数据等可用事实型数据库、参考工具书或网络搜索引擎;可用事实型数据库、参考工具书或网络搜索引擎;v撰写学位论文、申请研究课题撰写学位论文、申请研究课题尽可能选用一些收录年份较长的综合型和专业数据库。尽可能选用一些收录年份较长的综合型和专业数据库。考虑权威性数据库考虑权威性数据库;数据库的学科专业范围是否与课

35、题的学科相吻合;数据库的学科专业范围是否与课题的学科相吻合;需要的是题录、文摘信息还是全文信息,还是事实、图形、数据等;需要的是题录、文摘信息还是全文信息,还是事实、图形、数据等;数据库收录的文献类型、年限、更新周期,所需文献信息在国别和语种是数据库收录的文献类型、年限、更新周期,所需文献信息在国别和语种是否符合检索需求等。否符合检索需求等。举例:举例:v考虑学科范围、信息类型和数据量【例题】用_检索-呋喃甲醇羧酸酯的合成、含有碳和氢元素的化合物的英文综合学术性文献。 A.外文Elsevier数据库 B.外文农业类CAB文摘数据库 C.外文农业类AGRICOLA数据库 D.外文食品科技文摘数据

36、库FSTAv了解收录的文献类型【例题】已知参考文献:徐经长等.国际会计学.中国人民大学出版社.1999.要找原文,使用_检索国际会计学。 A.中文科技期刊数据库 B.中国人民大学报刊全文数据库 C. 图书馆的馆藏查询 【例题】使用检索CN03250961.8苗间除草机构密封传动箱。A.维普中文科技期刊数据库 B.图书馆馆藏查询C.中国人民大学报刊全文数据库D.中国国家知识产权 大 局专利数据库E.中国国家科技图书文献中心(NSTL)【例题】用检索编号是GB/T17302.2-1998的文献A.中国国家知识产权局 B.中国国家科技图书 专利数据库 文献中心(NSTL)C.国务院发展研究中心信息网

37、 D. 中国标准信息服务网v考虑信息的时间范围 同一个数据库版本不同,时效性也不一定相同。 例如清华大学图书馆收藏的工程索引(EI)各种载体及馆藏的简况比较: 印刷版(EI)月刊,年度更新,收录文献源2600种,馆藏年限1968-1996。 光盘版(Ei Compendex)季度更新,收录文献源2600种,馆藏年限19701997年。 网络版(Ei CompendexWeb)包括光盘版(Ei Compendex)和Ei PageOne两部分,半月更新,收录文献源5000种,馆藏年限1970至今。 因此网络版(Ei CompendexWeb)信息更新最快,量最大。3.3.确定检索途径和检索方法确

38、定检索途径和检索方法确定检索途径和检索方法确定检索途径和检索方法检索途径主要有:分类、主题、著者、序号。检索途径主要有:分类、主题、著者、序号。v分类途径:按文献内容的学科分类体系查找文献的途径。在印刷型检索工具中主要分类途径:按文献内容的学科分类体系查找文献的途径。在印刷型检索工具中主要有分类目录和分类索引。在计算机检索系统中,则把文献按分类聚类,通过层层点有分类目录和分类索引。在计算机检索系统中,则把文献按分类聚类,通过层层点击进行检索,或利用系统提供的分类号进行检索。击进行检索,或利用系统提供的分类号进行检索。v主题词主题词/关键词途径:按表达文献主题内容的主题词或关键词作为标识查找文献

39、的关键词途径:按表达文献主题内容的主题词或关键词作为标识查找文献的途径。途径。v题名途径:是根据文献的标题或名称,包括书名、刊名、篇名等来查找文献的途径题名途径:是根据文献的标题或名称,包括书名、刊名、篇名等来查找文献的途径v著者途径:是根据已知文献著(编、译)者的名称查找文献的途径。著者途径:是根据已知文献著(编、译)者的名称查找文献的途径。v代码途径:如标准号、专利号、代码途径:如标准号、专利号、ISSN号等号等v时间途径:以文献的时间范围查找文献的途径。时间途径:以文献的时间范围查找文献的途径。检索方法检索方法检索方法检索方法一般有直接检索法、间接检索法、追溯检索法和循环检索法四种。一般

40、有直接检索法、间接检索法、追溯检索法和循环检索法四种。直接检索法直接检索法又称浏览法,是通过广泛阅读、浏览近半年的各类文献资料来获得所需的最新信息。同时,在课又称浏览法,是通过广泛阅读、浏览近半年的各类文献资料来获得所需的最新信息。同时,在课题确定后,可阅读百科全书、专业手册、年鉴等参考工具书,了解课题的相关背景知识。题确定后,可阅读百科全书、专业手册、年鉴等参考工具书,了解课题的相关背景知识。缺点:费时费力,具有一定的盲目性和偶然性。缺点:费时费力,具有一定的盲目性和偶然性。间接检索法间接检索法又称系统检索法,指借助于检索工具或系统查找所需文献的方法。常用的有顺查法、倒查法和抽查又称系统检索

41、法,指借助于检索工具或系统查找所需文献的方法。常用的有顺查法、倒查法和抽查法。法。v顺查法:是以所查课题的起始年代为起点,由远而近按时间顺序查找文献的方法,适合于大课题顺查法:是以所查课题的起始年代为起点,由远而近按时间顺序查找文献的方法,适合于大课题的检索。优点是查全率高,缺点是工作量大。的检索。优点是查全率高,缺点是工作量大。v倒查法:是由从最新的文献开始,由近到远进行查找的方法。特点是效率高,查得的文献比较新倒查法:是由从最新的文献开始,由近到远进行查找的方法。特点是效率高,查得的文献比较新颖,时常用于科技查新。颖,时常用于科技查新。v抽查法:是根据检索需求,抓住课题研究发展迅速、出版文

42、献较多的时间段进行集中检索。抽查法:是根据检索需求,抓住课题研究发展迅速、出版文献较多的时间段进行集中检索。用这用这种方法能获得一指具有代表性、反映学科发展水平的文献。种方法能获得一指具有代表性、反映学科发展水平的文献。追溯法:利用文献末尾所附的参考文献为线索查找文献的方法,这种检索方法基于文追溯法:利用文献末尾所附的参考文献为线索查找文献的方法,这种检索方法基于文献之间的引用和被引用揭示了文献主题之间存在着某种内在的联系。献之间的引用和被引用揭示了文献主题之间存在着某种内在的联系。v追溯引文法:先查出一批与检索课题有关的文献,再以这批文献后面的参考文献追溯引文法:先查出一批与检索课题有关的文

43、献,再以这批文献后面的参考文献作为线索,查找文献的方法。作为线索,查找文献的方法。v引文索引法:利用引文索引,从被引文献开始查找引用它的全部论文的方法。引文索引法:利用引文索引,从被引文献开始查找引用它的全部论文的方法。交替检索法:间接检索法和追溯法的结合。先利用检索工具查得一批相关交替检索法:间接检索法和追溯法的结合。先利用检索工具查得一批相关文献,然后再利用这批文献所附的参考文献进行追溯查找,文献,然后再利用这批文献所附的参考文献进行追溯查找,如此交替使用,直至满足检索需求为止。如此交替使用,直至满足检索需求为止。4.4.确定检索词确定检索词确定检索词确定检索词概念的分析:概念的分析:任何

44、一个特定的检索课题,往往都是用若干个概念表达任何一个特定的检索课题,往往都是用若干个概念表达的,将检索课题从不同角度对课题内容进行概念分析,并针对每一个概念,的,将检索课题从不同角度对课题内容进行概念分析,并针对每一个概念,选择尽可能多的检索词。主题概念转化而成的检索词应能准确、完整地表选择尽可能多的检索词。主题概念转化而成的检索词应能准确、完整地表达检索课题的内容。达检索课题的内容。如:检索课题:如:检索课题:“土壤环境条件对豆科作物固氮作用的影响土壤环境条件对豆科作物固氮作用的影响”土壤环境、豆科作物、固氮作用土壤环境、豆科作物、固氮作用漏检漏检我们应利用自已所学的专业知识对课题进行深入细

45、致的分析,把那些与课题关系密我们应利用自已所学的专业知识对课题进行深入细致的分析,把那些与课题关系密切、能全面、准确表达课题内容实质的词一起作主题词。切、能全面、准确表达课题内容实质的词一起作主题词。v决定土壤环境条件的温度、湿度、决定土壤环境条件的温度、湿度、PH值等;值等;v豆科作物中的大豆、花生等;豆科作物中的大豆、花生等;v固氮作用中起重要作用的根瘤菌、固氮菌等。固氮作用中起重要作用的根瘤菌、固氮菌等。隐含概念的分析隐含概念的分析隐含概念的分析隐含概念的分析课题的隐含的概念和相关的内容需要从课题所属的专业角度作深课题的隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能够提炼

46、出能够确切反映课题内容的检索概念。入分析,才能够提炼出能够确切反映课题内容的检索概念。v如:检索如:检索“人造金刚石人造金刚石”方面的文献,方面的文献,其中其中“人造(人造(manmade)的含义包括有)的含义包括有“人工合成(人工合成(synthetic)在内,单选用在内,单选用“manmade”检索会漏掉许多有用的文献检索会漏掉许多有用的文献;v检索检索“古代家具设计古代家具设计”的相关文献的相关文献古代包括明代、清代、宋代等朝代,不能仅以古代作为检索词。古代包括明代、清代、宋代等朝代,不能仅以古代作为检索词。确定检索词的规则确定检索词的规则确定检索词的规则确定检索词的规则a.要用哪些词?

47、要用哪些词?v同义词应尽量选全:同一概念的几种表达式同义词应尽量选全:同一概念的几种表达式v同一名词的单数、复数、动名词、过去分词等用截词解决,如:同一名词的单数、复数、动名词、过去分词等用截词解决,如:child,childrenv规范称谓、俗称、全称、简称等,如:盘丽鱼俗称七彩神仙鱼规范称谓、俗称、全称、简称等,如:盘丽鱼俗称七彩神仙鱼v充分利用选定主题概念的上位或下位概念,找不到课题对应的主题词时,可采用最充分利用选定主题概念的上位或下位概念,找不到课题对应的主题词时,可采用最近一级的上位词。近一级的上位词。如:如:“山核桃产品加工山核桃产品加工”方面的文章,如果方面的文章,如果“山核桃

48、加工山核桃加工”没有检索记录的话,就没有检索记录的话,就得选得选“核桃加工核桃加工”作检索词作检索词v充分考虑相关的词,如研究三带双锯鱼的生活习性,假如找不到相关的文献,可以充分考虑相关的词,如研究三带双锯鱼的生活习性,假如找不到相关的文献,可以查找同属或同种的鱼类的研究资料,借以参考。查找同属或同种的鱼类的研究资料,借以参考。b.不用哪些词?不用哪些词?v少用或不用对检索课题意义不大的词少用或不用对检索课题意义不大的词v一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频词词v词义泛指过度大的词:如词义泛指过度大的词

49、:如“展望展望”趋势、现状、近况等,趋势、现状、近况等,“应用应用”作用、用途、用法等作用、用途、用法等v词义延伸过多的词:如词义延伸过多的词:如“制造制造”制备、生产、加工、工艺等,制备、生产、加工、工艺等,“提炼提炼”精炼、提取、萃取、回收,以及诸如精炼、提取、萃取、回收,以及诸如“有机物有机物”、“无机物无机物”、“病虫害病虫害”等外延十分宽的概念等,一般都应转换成具体的方法或材料、化等外延十分宽的概念等,一般都应转换成具体的方法或材料、化合物及具体的病害与虫害的名称表示。合物及具体的病害与虫害的名称表示。例:例:神经网络在旋转机械故障诊断中的应用研究神经网络在旋转机械故障诊断中的应用研

50、究 1.1.本课题包含本课题包含“神经网络神经网络”“旋转机械旋转机械”“故障诊断故障诊断”三个概念三个概念, ,“应用应用”和和“研究研究”属于意义过于宽泛的词,不应属于意义过于宽泛的词,不应该作为检索词。该作为检索词。 2.2.扩展扩展 神经网络:相关的上位词有人工智能神经网络:相关的上位词有人工智能旋转机械旋转机械故障诊断:相关词有故障定位、故障检测,上位词有故障诊断:相关词有故障定位、故障检测,上位词有容错技术容错技术 3.3.检索式:检索式:(神经网络(神经网络 OR OR 人工智能)人工智能)ANDAND(旋转机械)(旋转机械)AND (AND (故障诊断故障诊断 OR OR 故障

51、定位故障定位 OR OR 故障检测故障检测 OR OR 容错技术)容错技术)5.5.制定检索策略,编制检索式制定检索策略,编制检索式制定检索策略,编制检索式制定检索策略,编制检索式v检索策略通过编制检索式,选择检索途径来实施。检索策略通过编制检索式,选择检索途径来实施。v检索式是检索策略的逻辑表达式,指利用布尔逻辑运算符、位置算符、截检索式是检索策略的逻辑表达式,指利用布尔逻辑运算符、位置算符、截词符和字段符等,对各检索词进行准确、合理地逻辑和位置组合,编制出词符和字段符等,对各检索词进行准确、合理地逻辑和位置组合,编制出检索提问式。检索提问式。v再配合选择检索点,即检索入口,通常的检索入口,

52、如:题名、著者、主再配合选择检索点,即检索入口,通常的检索入口,如:题名、著者、主题词、关键词、分类、引文、文摘、全文、出版年等。题词、关键词、分类、引文、文摘、全文、出版年等。v举例:举例:明代家具的美学研究(明式家具明式家具+明代家具明代家具)*(审美审美+美学美学)6.6.实施检索、分析检索结果、索取原文实施检索、分析检索结果、索取原文实施检索、分析检索结果、索取原文实施检索、分析检索结果、索取原文v可直接下载的可直接下载的v无全文的无全文的7.7.调整检索式调整检索式调整检索式调整检索式, ,优化策略优化策略优化策略优化策略v当命中文献太少时,应进行扩检,提高查全率当命中文献太少时,应

53、进行扩检,提高查全率准确把握检索对象及目的,选择合适的数据库。准确把握检索对象及目的,选择合适的数据库。降低检索词或分类号的专指度。降低检索词或分类号的专指度。更多地采用学科分类途径来扩大检索范围。更多地采用学科分类途径来扩大检索范围。减少逻辑减少逻辑“与与”及逻辑及逻辑“非非”的使用,增加逻辑的使用,增加逻辑“或或”及截词检索技术的及截词检索技术的使用。使用。将检索途径调整到更宽泛的字段中。将检索途径调整到更宽泛的字段中。不限定检索对象的文献类型、时间段、文种等。不限定检索对象的文献类型、时间段、文种等。v当命中文献太多时当命中文献太多时,可对检索策略进行细化,提高查准率可对检索策略进行细化

54、,提高查准率提高检索词或分类号的专指度。提高检索词或分类号的专指度。更多地采用专用名词及特性检索的途径。更多地采用专用名词及特性检索的途径。选择逻辑选择逻辑“与与”及逻辑及逻辑“非非”的使用。的使用。减少或不采用逻辑减少或不采用逻辑“或或”及截词检索技术的使用。及截词检索技术的使用。限定检索词出现的字段及在段落、文句中的位置。如将检索词的查找范围限制在篇名限定检索词出现的字段及在段落、文句中的位置。如将检索词的查找范围限制在篇名和叙词字段中。利用文献的外表特征限制检索,不选和叙词字段中。利用文献的外表特征限制检索,不选“全文检索全文检索”。限定检索对象的文献类型、时间段、文种及其它特征。限定检

55、索对象的文献类型、时间段、文种及其它特征。将检索词向下位类收缩,提高检索的专指性;将检索词向下位类收缩,提高检索的专指性;在检出记录中选取新的检索词对结果进行再次限制。在检出记录中选取新的检索词对结果进行再次限制。【例题例题】华中科技大学学生已知一些理华中科技大学学生已知一些理工科类大学学位论文题目,如何获得原工科类大学学位论文题目,如何获得原文?文?【题解】方法1:使用华中科技大学图书馆的馆藏目录查询到图书形式的学位论文,直接借阅:方法2:使用图书馆购买的学位论文数据库检索,可以直接查看近年来的原文。方法3:本地没有的则通过网上检索得到题目后,再从高校图书馆、国家科技图书文献中心(NSTL)

56、通过馆际互借寻找全文,收费较低,时差也短。方法4:外文图书可以通过OCLC获取。 Exercise3:Exercise3:v练习三:松毛虫的防治策略研究练习三:松毛虫的防治策略研究v检索词间关系:松毛虫检索词间关系:松毛虫and(防治(防治or预防)预防)v检索式:松毛虫检索式:松毛虫*(防治防治+预防预防)Exercise4Exercise4v论家具设计中的简约主义论家具设计中的简约主义v检索词之间的关系:家具检索词之间的关系:家具and(简约主义简约主义or简约风格简约风格)v检索式:家具检索式:家具*(简约主义简约主义+简约风格简约风格)LOGOThankYou!2010-9-13OCLCOCLC检索结果检索结果检索结果检索结果EBSCO检索结果检索结果OCLC检索结果检索结果EBSCO检索结果检索结果EBSCO检索结果检索结果EBSCO检索结果检索结果

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号