internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)

上传人:繁星 文档编号:88250409 上传时间:2019-04-22 格式:PPT 页数:64 大小:2.27MB
返回 下载 相关 举报
internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)_第1页
第1页 / 共64页
internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)_第2页
第2页 / 共64页
internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)_第3页
第3页 / 共64页
internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)_第4页
第4页 / 共64页
internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)》由会员分享,可在线阅读,更多相关《internet应用从入门到精通 教学课件 陈郑军 internet网络系统与实践(第五章)(64页珍藏版)》请在金锄头文库上搜索。

1、在线教务辅导网:http:/,教材其余课件及动画素材请查阅在线教务辅导网,QQ:349134187 或者直接输入下面地址:,http:/,Internet网络系统与实践 第5讲,主讲:陈郑军 邮箱:,教材介绍,教 材:Internet应用从入门到精通 出版社:人民邮电出版社 主 编:陈郑军,章节介绍,第一章:Internet概述(主讲:敖开云) 第二章: Internet接入方式(主讲:敖开云) 第三章:浏览器的使用 (主讲:敖开云) 第四章:电子邮件(主讲:李健苹) 第五章:搜索引擎的使用(主讲:陈郑军) 第六章:电子商务(主讲:陈郑军) 第七章:Internet常用的工具软件(主讲:陈郑军

2、),课程学习建议,认真听课,多做作业。 结合教材,上机动手实践各种案例。 登录教学平台获取资源。 使用搜索引擎获得最新软件和技术。 使用BBS和聊天软件获得帮助。 多和老师同学交流,及时解决疑问。,第五章 搜索引擎的应用,章节要点: 搜索引擎概述 搜索引擎的发展 百度搜索引擎应用,什么是搜索引擎,搜索引擎(Search Engine) 它是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,将处理后的信息显示给用户,是为用户提供检索服务的系统。,搜索引擎的工作过程,搜索引擎的工作过程主要包括:信息采集、信息存储、信息加工、信息输出等几个部分。 运用Spiders

3、等被称为“网络机器人”或“自动跟踪索引机器人”的智能型软件,每隔一段时间自动追寻万维网上的链接。一方面系统采集并整理每个检索到的网页关键字信息,另一方面很多搜索引擎的自动搜索程序还会直接抓取网页保存 。 信息采集和存储后,要建立索引查询系统,使检索者能够快速地检索到所需信息,主要进行信息语词切分和语词词法分析、词性标注及相关的自然语言处理、建立检索项索引等处理。,搜索引擎的信息输出,一旦用户进行了信息检索,搜索引擎就要根据检索内容对用户进行响应,将检索结果回应给用户。这个时候主要需要解决好用户检索出的多个符合的结果如何排序显示。 网上信息检索的结果往往很庞大,所以,搜索引擎还要根据文件的相关程

4、度进行排列,最相关的文件通常排在最前面。每个搜索引擎确定相关性的方法也各不相同,其中有概率方法、位置方法、摘要方法、分类或聚类方法等。,搜索引擎确定相关性的办法,(1)概率方法根据关键词在文中出现的频率来判定文件的相关性,出现的次数多的文件相关程度就越高。 (2)位置方法根据关键词在文中出现的位置来确定文件的相关性,一般认为关键词出现在越前面,文件相关程度就越高。 (3)摘要方法是指搜索时为每个文件生成一份摘要,让检索者自己判断结果的相关性,以使检索者进行选择。 (4)分类或聚类方法是自动把查询结果归入到不同的类别中。,搜索引擎确定相关性的办法,除了相关性因素外,搜索引擎的商业排名竞价方式也会

5、影响部分检索信息的排序情况,支付较高费用的商业信息可能会被显示到更靠前位置。,搜索引擎的检索功能,一般检索功能 通常情况下,布尔逻辑检索、词组检索、截词检索、字段检索、限制检索等都属于一般检索功能,这是搜索引擎最基本的作用所在。 一般说来,并不是每种搜索引擎都包括了全部的检索功能,而且每一种检索功能在各个不同的搜索引擎中,表现也不完全相同,每个搜索引擎都有自己的特色,在某一方面特别突出。,搜索引擎的检索功能,特殊检索功能 (1)自然语言(Natural Language)检索,即直接采用自然语言中的字、词或句子提问式进行检索。 (2)多语种检索,即提供多语言种类的检索环境供检索者选择,系统可按

6、指定的语种进行检索,并输出相应的检索结果。 (3)地图检索,即提供对地图上地理位置的检索功能。 (4)图形搜索引擎,即提供多媒体数据检索功能。,搜索引擎的分类,1、全文索引 全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。,搜索引擎的分类,2、目录索引 目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。,搜

7、索引擎的分类,3、元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。,搜索引擎的分类,4、其他非主流搜索引擎形式: (1)集合式搜索引擎。 (2)门户搜索引擎。 (3)免费链接列表。,搜索引擎的商业盈利方式,在搜索引擎发展早期,多是作为技术提供商为其他网站提供搜索服务,网站付钱给搜索引擎。 现在搜索引擎的主流商务模式都是在搜索结果页面放置广告,通过用户的点击或查看次数向广告主收费。这种模式有两个特点: 一是点击付费(Pay Per Click),用户不点击则广告主不用付费。 二是竞价排序,根据广告主的付费多少排列结果

8、。,搜索引擎的商业盈利方式,搜索引擎的发展,现代搜索引擎的鼻祖: 1990年,加拿大麦吉尔大学计算机学院的师生开发出Archie。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。 虽然Archie搜集的信息资源不是网页,但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。,搜索引擎的发展,最早现代意义上的搜索引擎: 1994年7月。卡内基.梅隆大学的 Michael Mauldin将John L

9、eavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。 除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。,搜索引擎的发展,90年代最耀眼的搜索引擎巨头: 1994年4月,斯坦福大学的两名博士生,杨致远和David Filo共同创办了Yahoo!。Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。,搜索引擎的发展,目前最大的搜索引擎: Google源于斯坦福大学的一个小项目BackRub。G

10、oogle公司则把1998年9月27日认作自己的生日。 Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客文化氛围、不作恶的理念,为Google赢得了极高的口碑和品牌美誉,Google迅速取代Yahoo成为全球最大的搜索引擎。,搜索引擎的发展,美国搜索引擎市场排名:,国内搜索引擎,最早的中文搜索引擎: 1996年8月,搜狐公司成立,制作中文网站分类目录。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu于2004年8月建立独立域名的搜索网站“搜狗” ,自称“第三代搜索引擎”。,国内搜索引擎,目前最大的中文搜

11、索引擎: 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇在北京中关村创立了百度公司,专注于中文搜索。 中国所有提供搜索引擎的门户网站中,超过80%以上都曾由百度提供搜索引擎技术支持。百度是目前全球最大的中文搜索引擎,同时在全球搜索引擎排名第三,占全球搜索市场份额5.2%,仅次于Google和Yahoo,而在中文搜索市场则是市场老大,占据超过70%的市场。,国内搜索引擎,中文搜索引擎排名:,百度搜索引擎的使用,最简单的搜索: 百度搜索简单方便。您只需要在搜索框内输入需要查询的内容,即我们所说的关键字,敲回车键或者鼠标点击搜索框右侧的百度搜索按钮,就

12、可以得到最符合查询需求的网页内容。当然为了提高搜索的有效性,我们的关键字应该尽量是一个名词、一个短语或短句,百度搜索引擎的使用,最简单的搜索:,百度搜索引擎的使用,提高简单搜索的效果: 如果检索的结果不理想,可以使用百度提供的“相关搜索” 或者更换关键字来重新搜索。,百度搜索引擎的使用,提高简单搜索的效果: 如果简单的一个关键词效果无法达到,我们可以采用多关个词语来进行组合查询。,百度搜索引擎的使用,提高简单搜索的效果: 搜索到了符合要求网页,却打不开,可以使用百度快照。 每个未被禁止搜索的网页,在百度上都会自动生成临时缓存页面,称为“百度快照”,只要可以访问百度就可以使用网页快照功能,使用快

13、照功能时你访问的实际上是百度,而不是网页所在的原服务器。,百度搜索引擎的使用,百度快照:,百度搜索引擎的使用,提高简单搜索的效果: 由于汉字输入法的局限性,我们在搜索时经常会输入一些错别字,导致搜索结果不佳。百度会给出错别字纠正提示。错别字提示显示在搜索结果上方。,百度搜索引擎的使用,提高简单搜索的效果: 百度为了最大程度的方便用户检索,将用户常见检索信息进行了一些大类划分,选择适当的类别进行搜索,其检索准确率将大大提高。,百度搜索引擎的使用,“新闻”类别搜索效果图:,百度搜索引擎的使用,“网页”类别的搜索效果:,百度搜索引擎的使用,“贴吧”类别的搜索效果:,百度搜索引擎的使用,“知道”类别的

14、搜索效果:,百度搜索引擎的使用,“MP3”类别的搜索效果:,百度搜索引擎的使用,“图片”类别的搜索效果:,百度搜索引擎的使用,“视频”类别的搜索效果:,百度搜索引擎的使用,“地图”类别的搜索效果:,百度搜索引擎的使用,百度还有一些其他的搜索类别。,使用百度高级搜索功能,百度的高级搜索功能包括: 高级语法搜索 综合界面的高级搜索,高级语法搜索,百度支持一些高级语法的检索,通过这些语法限制可以更准确的获取检索目标。特别注意的是语法搜索中的所有标点符号都是小写的。随着百度搜索引擎的不断升级新的语法搜索功能会不断出现,同时一些原有的语法搜索功能可能会被放弃。 注意语法结构:号后面要紧跟关键词,不能有空

15、格。,高级语法搜索,把搜索范围限定在网页标题中intitle 网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。 格式:关键词1 intitle:关键词2。 表示查找网页标题包含关键词2,并且网页内容中包含关键词1的网页。,高级语法搜索,intitle语法检索,高级语法搜索,把搜索范围限定在特定站点中site 格式:关键词 site:网站域名 如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。,高级语法搜索,site语法搜索:,高级语法搜索,把搜索范围限定在url链接中inurl : 格式:关键词1 inurl:

16、关键词2 网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。,高级语法搜索,inurl 高级语法搜索:,高级语法搜索,精确匹配双引号 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。,高级语法搜索,精确匹配双引号,高级语法搜索,精确匹配书名号 书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。 加上书名号的查询词,有二层特殊功能: 一是书名号会出现在搜索结果中; 二是被书名号扩起来的内容,不会被拆分。 实际应用书名号还能优先查询文艺相关内容。,高级语法搜索,书名号语法搜索:,综合界面的高级搜索,综合界面的高级搜索:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号