大型综合性搜索引擎介绍

上传人:M****1 文档编号:569723407 上传时间:2024-07-30 格式:PPT 页数:58 大小:1.65MB
返回 下载 相关 举报
大型综合性搜索引擎介绍_第1页
第1页 / 共58页
大型综合性搜索引擎介绍_第2页
第2页 / 共58页
大型综合性搜索引擎介绍_第3页
第3页 / 共58页
大型综合性搜索引擎介绍_第4页
第4页 / 共58页
大型综合性搜索引擎介绍_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《大型综合性搜索引擎介绍》由会员分享,可在线阅读,更多相关《大型综合性搜索引擎介绍(58页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 网络信息检索网络信息检索v第一节第一节 网络信息检索工具与方网络信息检索工具与方法法 v第二节第二节 搜索引擎及其检索搜索引擎及其检索第一节第一节网络信息检索工具与方法网络信息检索工具与方法一、一、网络信息检索的特点网络信息检索的特点二、网络信息检索工具二、网络信息检索工具三、三、网络信息检索的方法网络信息检索的方法一、网络信息检索的特点一、网络信息检索的特点1、存取范围覆盖、存取范围覆盖Internet上所有资源上所有资源2、传统检索方法与全新检索技术相结合、传统检索方法与全新检索技术相结合3 3、用户界面友好且操作方便用户界面友好且操作方便4、具备良好的导航和编辑功能、具备良

2、好的导航和编辑功能5、用户透明度、用户透明度二、网络信息检索工具二、网络信息检索工具q网络信息检索工具按照不同标准可以划分不同类型:网络信息检索工具按照不同标准可以划分不同类型:q1、按照网络信息资源类型划分:按照网络信息资源类型划分: WWWWWW检索工具、非检索工具、非WWWWWW检索工具检索工具q2、按照检索机制划分:、按照检索机制划分:关键词检索工具、分类目录检索工具、混合型检索关键词检索工具、分类目录检索工具、混合型检索工具工具q3、按照包含检索工具数量划分:、按照包含检索工具数量划分:单一型检索工具、多元型检索工具单一型检索工具、多元型检索工具4、按照检索内容划分:、按照检索内容划

3、分:综合型检索工具、专题型检索工具、特殊型检索工综合型检索工具、专题型检索工具、特殊型检索工具具二、网络信息检索工具二、网络信息检索工具v查查UsenetUsenet新闻组资源的新闻组资源的WAISWAISv查查FTPFTP资源的资源的ArchieArchiev查查GopherGopher资源的资源的VeronicaVeronicav查查TelentTelent资源的资源的HytelentHytelentv查查WWWWWW资源资源Search EngineSearch Engine(搜索引擎)(搜索引擎) 其中其中Search EngineSearch Engine 应用最为普及应用最为普及主

4、要搜索引擎的建立时间及网址建立年月建立年月搜索引擎的名称及网址搜索引擎的名称及网址1994年4月WebCrawlerhttp:/1994年5月Lycoshttp:/1994年底Yahoo!http:/1995年初Infoseekhttp:/1995年10月AltaVistahttp:/第二节第二节搜索引擎及其检索搜索引擎及其检索一、搜索引擎的构成及工作原理一、搜索引擎的构成及工作原理用用户户检检索索策策略略搜索搜索引擎引擎用户用户接口接口搜索引擎本地的搜索引擎本地的摘要信息数据库摘要信息数据库各万维各万维网站点网站点资源资源访问详细信息反馈摘要信息反馈各记录链接信息资源搜集二、搜索引擎的功能二

5、、搜索引擎的功能搜索引擎有两个主要的功能:搜索引擎有两个主要的功能:1、收集网络信息资源,对其进行收集网络信息资源,对其进行索引并建立数据库。索引并建立数据库。2、提供网络的信息导航与检索服、提供网络的信息导航与检索服务(主要的功能)。务(主要的功能)。搜索引擎的基本检索功能搜索引擎的基本检索功能v1、布尔逻辑检索、布尔逻辑检索v逻辑与逻辑与(与、(与、and、AND、)vAandBABv逻辑或(或、逻辑或(或、or、OR、|)vAorBA;B;AB;v逻辑非(非、逻辑非(非、not、NOT、!)、!)vAnotBAAB2 2、完全字符串检索、完全字符串检索采用双引号采用双引号“”代表字符串代

6、表字符串精确查找精确查找“知识经济知识经济”知识经济知识经济o3、截词检索(截词检索(*)o前方一致检索前方一致检索o扩大检索范围扩大检索范围onutri*nutria+nutrient+onutrilitei+nutrimento+nutrition4 4、字段限制检索、字段限制检索限定检索词在检索结果中出现的位置,限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。用来控制检索结果的相关性。如:如:URLURL限制(限制(urlurl:):) 主机名限制(主机名限制(hosthost:):) 标题限制(标题限制(titletitle:):)5 5、位置检索、位置检索 目前只有目前只

7、有Alta VistaAlta Vista能提供能提供 邻近位置运算邻近位置运算nearnear运算。运算。6 6、 + +、- - 检索检索+ +:放在检索词前,表示该检索词在检索结:放在检索词前,表示该检索词在检索结 果中必须出现。果中必须出现。- -:放在检索词前,表示该检索词在检索结:放在检索词前,表示该检索词在检索结 果中不能出现。果中不能出现。几乎所有的搜索引擎都支持这种功能。几乎所有的搜索引擎都支持这种功能。如:如:+ +computer+viruscomputer+virusCIHCIH搜索引擎的高级检索功能搜索引擎的高级检索功能1 1、自然语言检索、自然语言检索支持字、词、句

8、子检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业如:知识经济的支柱产业 How has WTO developedHow has WTO developed?2 2、模糊检索、模糊检索当输入一个检索词时,搜索引擎会把与该检索词当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。相关的词一并反馈,列出供用户选择。相关性检索相关性检索如:在雅虎中国查找如:在雅虎中国查找“搜索引擎搜索引擎”一词时,模糊一词时,模糊检索会把检索会把“搜索引擎搜索引擎”、“搜寻引擎搜寻引擎” ” 、“引擎引擎”等相关的检索词一并列出。等

9、相关的检索词一并列出。3 3、概念检索、概念检索 用某一检索词进行检索时,能同时对用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高进行检索,以达到扩大检索范围,提高查全率的目的。如:查全率的目的。如:ExciteExcite4 4、区分大小写检索、区分大小写检索大多数搜索引擎在查询中要区分大小写大多数搜索引擎在查询中要区分大小写小写小写匹配大小写字符匹配大小写字符大写大写只只匹配大写字符匹配大写字符5 5、管道(、管道(| |)检索)检索 用管道符(用管道符(| |)连接两个或者多个检索词,)连接两个或者多个

10、检索词,如如 apple | diseaseapple | disease,先对前一个检索,先对前一个检索词进行检索,再在其检索结果的基础上词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的以达到逐步缩小检索范围提高查准率的目的。目的。6 6、相关信息反馈检索、相关信息反馈检索 提供与检索结果类似的检索结果。如:提供与检索结果类似的检索结果。如: 雅虎中国的雅虎中国的“相关网站、相关网页、相相关网站、相关网页、相关新闻关新闻”。 LycosLycos的的“More Like This”More Like Th

11、is” Excite Excite的的“Search for more Search for more documents like this one”documents like this one”7 7、范围限制检索、范围限制检索在某一范围内检索指定的检索词。在某一范围内检索指定的检索词。 分类范围、时间范围、地域范围、分类范围、时间范围、地域范围、 信息来源、检索词位置、语种范围、信息来源、检索词位置、语种范围、 特殊范围特殊范围三、搜索引擎的分类搜索引擎的分类1、根据信息检索方式分类:、根据信息检索方式分类:分类搜索引擎、关键词搜索引擎、混合分类搜索引擎、关键词搜索引擎、混合搜索引擎搜

12、索引擎2、根据信息覆盖范围及适用用户群分类:、根据信息覆盖范围及适用用户群分类:综合性搜索引擎、专用性搜索引擎综合性搜索引擎、专用性搜索引擎3、根据搜索范围分类:、根据搜索范围分类:独立搜索引擎、集成搜索引擎独立搜索引擎、集成搜索引擎四、搜索引擎常见的查询方式四、搜索引擎常见的查询方式按照搜索引擎提供的分类目录逐级按照搜索引擎提供的分类目录逐级查询,用户一般不需要输入检索词,查询,用户一般不需要输入检索词,而是按照查询系统提供的几种分类而是按照查询系统提供的几种分类项目,选择类别进行查询,这种方项目,选择类别进行查询,这种方式也叫式也叫分类检索。分类检索。用布尔逻辑组配方式查询,这种方式也用布

13、尔逻辑组配方式查询,这种方式也叫定制搜索。(多个关键词)叫定制搜索。(多个关键词)五、搜索引擎检索的步骤五、搜索引擎检索的步骤1、输入、输入URL地址,登陆到搜索引擎地址,登陆到搜索引擎的主页。的主页。2、输入检索提问式或点击分类目录,、输入检索提问式或点击分类目录,进行实时的交互式的信息检索。进行实时的交互式的信息检索。3、搜索引擎输出、搜索引擎输出HTML文件,并且翻文件,并且翻译译HTML,显示检索结果。,显示检索结果。六、搜索引擎的选择技巧六、搜索引擎的选择技巧查全率、查准率查全率、查准率更新速度、死链接更新速度、死链接易用性、稳定性易用性、稳定性搜索速度搜索速度高级搜索的支持能力高级

14、搜索的支持能力七、常用搜索引擎简介七、常用搜索引擎简介1 1、主要中文搜索引擎、主要中文搜索引擎2 2、主要英文搜索引擎、主要英文搜索引擎3 3、各具特色的专用搜索引擎、各具特色的专用搜索引擎主主要要中中文文搜搜索索引引擎擎百度是世界上规模最大的中文搜索引擎,拥有全球最大百度是世界上规模最大的中文搜索引擎,拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。人次的搜索请求。百度高级搜索百度高级搜索主主要要中中文文搜搜索索引引擎擎一搜(一搜()是雅虎公司基于全球领先的是雅虎公司基于全球领先的YSTYST(Yahoo Sear

15、ch TechnologyYahoo Search Technology)技术,在中国推出的搜技术,在中国推出的搜索门户。一搜具有简洁专业、海量、客观精准、国际化、索门户。一搜具有简洁专业、海量、客观精准、国际化、稳定高速等特点,是值得依赖的专业搜索门户。稳定高速等特点,是值得依赖的专业搜索门户。主主要要中中文文搜搜索索引引擎擎主主要要中中文文搜搜索索引引擎擎一搜高级搜索一搜高级搜索主主要要中中文文搜搜索索引引擎擎雅虎中国雅虎中国主主要要中中文文搜搜索索引引擎擎雅虎中国高级搜索雅虎中国高级搜索主主要要中中文文搜搜索索引引擎擎新浪新浪主主要要中中文文搜搜索索引引擎擎搜狐搜狐主主要要中中文文搜搜索

16、索引引擎擎网易网易主主要要中中文文搜搜索索引引擎擎主主要要中中文文搜搜索索引引擎擎263263搜索搜索主主要要英英文文搜搜索索引引擎擎Alta Vista :http:/主主要要英英文文搜搜索索引引擎擎Excite: http:/主主要要英英文文搜搜索索引引擎擎Hotbot:http:/主主要要英英文文搜搜索索引引擎擎Hotbot:http:/主主要要英英文文搜搜索索引引擎擎Lycos:http:/Google搜索引擎和百度搜索引擎Google搜索引擎百度搜索引擎2.1 Google搜索引擎网址:http:/Google是一个全自动搜索引擎,它是利用计算机程序直接在网页中抓取相关字串。“Goo

17、gle”一词来源于“googol”(仍然是英文),是10的100次方,表示是一个非常巨大的数字的概念。正如其名,Google是一个功能强大、使用方便的搜索引擎。与其他搜索引擎相比Google的优点:1) 对于用户所输入的关键字,Google 会最大程度的寻求语义匹配。例如想查找有关某人的网页,但输入“同音不同字的名” ,Google 也能找到你想要得信息。或者,在查询框中输入作者的名字,所有文章与网页都会被检索,连那个网页有转载都会显示出来。此外,Google 还包含有汉字的相关性 ,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。2) Google还提供网页快照(Cached)功能。

18、 Google将检索的网页都做了一番“快照”,然后存放在自己的服务器上,当被搜索的内容站点当前不存在时,用户可以用网页快照功能。Google检索须知当检索结果过多,需进一步缩小时,可选择“缩小搜索”或在“结果中搜索”。只要输入更多的关键词即可,或在不需要的关键词前“-”号。注意“-”后应留一空格。Google 不支持OR检索,也不区分英文大小写,所有字母均当小写处理。在专用词语上加双引号可以进行精确查询,这在查找某个产品或专用术语时特别有用。“-+=,”等也作为短语连接符。例如,尽管Micro-computer,不加引号,仍作为专用词语处理。Google 会忽略http和com 等字样,以及数

19、字和单字,因为他们出现过频繁,因此无助于检索,还会减低速度。Google的“手气不错”功能将自动连接到Google推荐的网页,无需再查其他结果,快速方便Google检索示例2.2 百度搜索引擎网址:http:/百度搜索引擎特点1)中国人自己开发研制的,适合中文网站搜索2)“网页的相关检索功能”例如输入“手机”,在检索的上方还会出现“手机的价格”、“手机铃声”等与“手机”相关的词,此时再点一下“手机铃声”,则会检索出“手机铃声”的结果3)在百度的检索结果中,用户可以选“重新查询”;也可选“在结果中再查”则将在第一次的结果中在按新输入的词查询,这相当于AND,结果会更精确些;选在“结果中去除”则将在第一次的结果中“减去”新输入的词查询,相当于NOT。4)百度支持多关键词查询。关键词之间可用空格、逗号、+以及&符号,他们都代表AND,而竖线符号“|”代表OR,“-”仍然为NOT。在输入关键词前加“t:”将搜索网站标题(title),加“u:”则搜索网站地址URLs 。百度搜索示例

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号