因特网信息资源检索

上传人:自*** 文档编号:25948514 上传时间:2017-12-20 格式:PPT 页数:28 大小:1.09MB
返回 下载 相关 举报
因特网信息资源检索_第1页
第1页 / 共28页
因特网信息资源检索_第2页
第2页 / 共28页
因特网信息资源检索_第3页
第3页 / 共28页
因特网信息资源检索_第4页
第4页 / 共28页
因特网信息资源检索_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《因特网信息资源检索》由会员分享,可在线阅读,更多相关《因特网信息资源检索(28页珍藏版)》请在金锄头文库上搜索。

1、10 因特网信息资源检索,10.1 搜索引擎 10.2 常用中文搜索引擎的使用 10.3 常用中英文目录型网络检索工具,101 搜索引擎,10.1.1搜索引擎 的定义搜索引擎(Search Engine)是指对因特网各种信息资源进行标引和检索的工具。 搜索引擎使用自动搜索软件来采集、发现、收集并标引网页、建立数据库,以WWW页形式提供给用户一个检索界面,供用户通过关键词、词组或短语等检索项来进行检索。,10.1.2 搜索引擎工作原理,1.信息的采集与存储 人工采集: 由专门的信息人员跟踪和选择有用的WWW站点或页面,并按规范方式分类标引并组建成索引数据库。自动采集: 是通过自动索引软件(Spi

2、der、Robot或Worm)在网络上不断搜索相关网页来建立、维护、更新索引数据库的。自动采集能够搜索、采集和标引网络上众多站点和页面,并根据检索规则和数据类型对数据进行加工处理,因此它收录、加工信息的范围广、速度快,能及时地向用户提供Internet中的新增信息,及其检索提问的所有网址并提供链接点。,2、建立索引数据库信息采集与存储后,搜索引擎要对已收集的信息进行整理,建立索引数据库,并定时更新数据库内容。索引数据库中每一条记录基本对应于一个网页,记录包括关键词、网页摘要、网页URL等信息。,3、检索界面的建立每个搜索引擎都必须提供一个良好的信息查询界面,接收用户在检索界面中提交的搜索请求,

3、搜索引擎根据用户输入的关键词,在索引数据库中查找,把查询命中的结果(均为超文本链接形式)通过检索界面返回给用户,通过搜索引擎提供的链接,即刻访问相关信息。,10.1.3 搜索引擎的基本检索功能,1、布尔逻辑检索2、词组检索3、截词检索4、字段检索5、自然语言检索6、多语种检索7、区分大小写检索,10.2 常用中文搜索引擎的使用,10.2.1 百度中文搜索引擎 百度(http:/)于1999年底成立于美国硅谷,是由资深信息检索技术专家、超链分析专利的唯一持有人李彦宏及徐勇博士创建的。,百度是世界上最大的中文搜索引擎,支持搜索4亿中文网页,并且每天增加几十万新网页,对重要中文网页实现每天更新,用户

4、通过百度搜索引擎可以搜索到世界上最新最全的中文信息。百度标题下,对新闻搜索、网页搜索等最常用的搜索对象做出了链接,可在特定范围内搜索信息。,1. 百度的检索方式和检索功能 关键词检索,高级检索,2. 百度中文搜索引擎的检索语法特点,(1)不支持逻辑运算“AND”、“OR”的使用,用“” 表示逻辑“或”。如用户要查询“足球”或“申花”相关资料,不需要分两次查询,只要输入“足球申花”。用减号“”表示逻辑“非”操作,如需查询关于“足球”但不含“意大利”的资料,输入“足球意大利”即可搜索到相关信息。(2)用“ ” 表示精确检索(词组 短语 或 句子)(3)百度对英文字符大小写不敏感,所有的字母均作小写

5、处理。例如:搜索“FOOTBALL”、“football”或“Football”,得到的结果都一样。,3. 百度的高级搜索语法,(1)site:表示搜索结果局限于某个具体网站或某域名内的网页。如: 网球site: 表示在体坛周报网站内搜索和足球相关的资料; 足球site: 表示在域名以“”结尾的网页内搜索和足球相关的资料。,(2)file type:表示限定检索某种文献类型。 如“filetype:pdf flash教程” 即检索有关flash教学的PDF文档,(3) intitle:在标题中搜索。例如 :“intitle:足球” 表示搜索标题中含有关键词“足球”的网页; “intitle:

6、足球 中国” 表示搜索标题中 “足球”和“中国”的网页。,(4) URL搜索:在“inurl”后加url中的文字,表示限制在网页的URL中检索。例如:“inurl:足球”表示搜索URL中含有足球的网页。,10.2.1 Google搜索引擎Google(http:/)是目前因特网上最优秀的支持多种语种的搜索引擎之一,功能强大,特点突出,技术先进,服务优良。在Google的索引目录中贮存了30多亿个网页及网页快照,以及4亿多张图片,用户可以使用86种语言文字进行搜索。,1. 检索方式和检索功能关键词检索。在Google标题上方排列了几大功能模块:网站搜索、图象、新闻、网上论坛、GMAIL,默认的是

7、所有网站搜索。,高级检索:对搜索结果进行更多设定,如各种语言、文件格式、日期、检索内容位于网页的不同位置等,并对每个页面显示搜索结果数量做出设定。,(1)Google自动带有“AND”功能进行查询,用空格表示逻辑“与”的操作,Google用减号“” 表示逻辑“非”操作,用大写“OR” (小写的or,查询时将被忽略,变成“与”的查询)表示逻辑“或”操作。(2)Google不支持通配符 * 、 ?等的搜索,只能做精确查询,关键字后面的通配符会被忽略掉。(3)Google对英文字符大小写不敏感,所有的字母均作小写处理。例如:搜索“FOOTBALL”、“football”或“Football”,得到的

8、结果都一样。,2. Google的检索语法特点,(4)Google关键字可以是词组(中间无空格),也可是句子(中间有空格),用句子做关键字搜索,须加英文引号(精确检索)。(5)Google对一些网络上出现频率极高的词(主要是英文单词),如“i” “com” “http”,以及一些符号如 * “的” 等均做忽略处理,若要求关键字中包含这些常用词,用“ ”精确检索。(英文符号,如问号,句号,逗号等,无法成为搜索关键字 ),3. Google的高级搜索语法(1) “site” 表示搜索结果局限于某个具体网站或网站频道,如“”,或者 “”、“com”等域名。如果要排除某个网站或者域名范围内的页面,只需

9、要“-网站/域名”即可。如:搜索中文教育科研网站()上所有包含“丁玲”的页面: 丁玲site: 即可 包含“丁玲”的新浪网站页面:丁玲site: (2)使用“link”语法,可搜索所有链接到某个URL地址的网页。 如:搜索所有指向华军软件园 链接的网页,搜索式“link:”.,(3)使用“in url”语法,返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,如“MP3”等,可以用inurl语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。,(4) “all inurl”语法:返

10、回的网页链接中包含所有查询关键字。,(5)allintitle和intitle的用法类似上面的allinurl和inurl,前者是对网页的标题栏进行查询,而后者是对URL进行查询。例如查找彭丽媛的相册:“intitle:彭丽媛 写真”,4. Googl的其他重要功能目录检索 如果不想搜索网页,而只想寻找某些专题网站,可以访问Google: 分类目录 http:/directory.G, 中文目录 http:/directory.G Simplified/。,网页快照主要有三个作用: 一是如果原地址打开很慢,则可直接查看Google缓存页面,因为Google服务器速度极快。 二是如果原链接已经死

11、掉或暂时不通,则可以通过Google快照看到该页面的信息。 三是如果打开的页面信息量巨大,找不到关键词所在位置,则可通过Google快照。,新闻组搜索: 进入Google新闻组http:/group.G translation of search results into your interface Language”这个选项即可。,思考与练习,1、因特网有哪些检索工具?它们的功能如何?2、google搜索引擎网页快照主要有哪三个作用? 3、掌握Google的使用方法并浏览Google搜索结果的样式。4、Yahoo!的检索方式及检索功能主要有哪些? 5、使用不同搜索引擎查找同一主题的信息,试比较查找结果的异同。6、搜索引擎的基本检索功能与类型有哪些?7、试述Google、百度中文搜索引擎的检索语法特点及其他重要功能,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号