第4讲:信息检索搜索引擎

上传人:飞*** 文档编号:49556849 上传时间:2018-07-30 格式:PPT 页数:95 大小:4.27MB
返回 下载 相关 举报
第4讲:信息检索搜索引擎_第1页
第1页 / 共95页
第4讲:信息检索搜索引擎_第2页
第2页 / 共95页
第4讲:信息检索搜索引擎_第3页
第3页 / 共95页
第4讲:信息检索搜索引擎_第4页
第4页 / 共95页
第4讲:信息检索搜索引擎_第5页
第5页 / 共95页
点击查看更多>>
资源描述

《第4讲:信息检索搜索引擎》由会员分享,可在线阅读,更多相关《第4讲:信息检索搜索引擎(95页珍藏版)》请在金锄头文库上搜索。

1、第四讲:搜索引擎第四讲:搜索引擎搜索引擎应用与经典搜索案例2成功=智商+情商+搜商搜商:人类的第三种能力搜网(sowang)总裁 陈沛 著清华大学出版社 2006-11案例一-寻找网友 两个网友的谈话: 在某聊天室里,帅哥J和美女R,两人相谈甚欢 J:你是做什么工作的啊?可以告诉我吗? R:我在一个出国服务公司做翻译呢。经过几个月的聊天,J发现自己已经深深喜欢上了R.见R一面的想法不 断冲击着他.不过R并不同意见面: J:你上班的环境好吗? R:挺好的,在一个商厦里,而且旁边就是我们这儿最大的广场,交通什么 的都很方便. J:哦 ,那我能来见你一面吗? R:为什么要见面呢?网上不是挺好的吗?

2、J:. J太想见到R了,但他甚至连她在什么地方都还不知道。这时,J注 意到这个聊天室可以看到网友的IP地址,于是他查到R的IP是 61.130.1.234 亲爱的朋友,你能带J找到R吗?解决方法 1、查找R的IP地址归属地 2,找到当地最大的广场 3、通过电子地图查找广场位置,并查看四 周确定商厦名称 4、通过公司性质找到公司名称及网站 http:/ 2搜索引擎使用十大经验搜索引擎使用十大经验3 33.1搜索引擎原理和概况搜索引擎原理和概况1、什么是搜索引擎? 定义:提供信息检索服务的工具平台,它使用某 些程序把因特网上的网站信息进行收集和归类。 搜索引擎其实就是一个网站,是专门提供信息“检

3、索”服务的。 一般是利用其内部的一个叫SPIDE(蜘蛛)的程序 ,自动提取网站的信息和网址加入自己的数据库, 供用户查询。 搜索引擎是人们获取网络信息最常用的工具。2、搜索引擎的发展历史搜索引擎发展历史元搜索元搜索 引擎引擎 19951995Yahoo!Yahoo! 19941994GopherGopher 19931993ArchieArchie 19901990第一代搜索第一代搜索 目录搜索目录搜索GoogleGoogle 19961996 BaiduBaidu 19991999 第二代搜索第二代搜索 网页搜索网页搜索3、搜索引擎的工作原理3.2常用搜索引擎3.2.1、搜索引擎的类型目录类

4、搜索引擎元搜索引擎 全文搜索引擎目录搜索引擎 具有搜索功能,严格意义上不是真正的搜 索引擎,是按目录分类的网站链接列表 。 靠分类目录检索,用户通过逐级层层点击 浏览类目,导找自己所需的信息。 用户必须清楚信息所属的类别,找到的是 相关的网站。 例如:Yahoo、搜狐、新浪、网易等。 元搜索引擎 1995年,一种新的搜索引擎形式出现了:元搜索引擎 (A Meta Search Engine Roundup)。用户只需提 交一次搜索请求,由元搜索引擎负责转换处理后提 交给多个预先选定的独立搜索引擎,并将从各独立 搜索引擎返回的所有查询结果,集中起来处理后再 返回给用户。 第一个元搜索引擎,是Wa

5、shington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引 擎概念上好听,但搜索效果始终不理想,所以没有 哪个元搜索引擎有过强势地位。 元搜索引擎通常是引用比较知名的搜索引擎,查全 率很高,但查准率低。杨家燕搜索引擎应用与经典搜索案例14全文搜索引擎 名副其实的搜索引擎 按关键词检索 当用户以关键词查找信息时,搜索引擎会 在数据库中进行搜寻,如果找到与用户要 求内容相符的网站,便采用特殊的算法计 算出各网页的相关度及排名等级,然后根 据关联度高低,按顺序将这些网页链接返 回给用户。 例如:Google、百度等。Google搜索引擎

6、Google搜索引擎诞生于斯坦福大学的一个学生宿舍里,然后迅速传播到全球的信息搜索者。 Google 目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问 一个包含超过 80 亿个网址的索引。 “Google”来自于数学名词“Googol”, Googol表 示一个 1 后面跟着 100 个零。Google Int.使用这一术语体现了公司整合网上海量信息的远大目标。 Google 简介: Larry Page,创始人之一,主管产品 的总裁。密西根安娜堡大学的荣誉毕 业生,拥有理工科学士学位。他还因 其出色的领导才能获得过多项荣誉,以奖励他对工学 院的贡献。他曾担任密西

7、根大学 Eta Kappa Nu 荣誉学会的会长。目前他暂时从斯坦福大学计算机研究所 博士班休学,其指导教授是 Terry Winograd 博士。Google 就是由Page在斯坦福大学发起的研究项目转变而来的。Larry PageGoogle 简介: Sergey Brin,创始人之一,主管技术的总裁。出生于莫斯科,是马里兰大学校本部的荣誉毕业生,拥有数学专业和计算机专业的理学士学位。已取得斯坦福大学计算机专业硕士学位,目前暂时从博士班 休学。29 岁的 Sergey 是美国国家科学基金会的奖学金得主。他在斯坦福 遇到了 Larry Page 并参与了后来成为Google 的研究项目。他们

8、于1998年共同创立了 Google。Sergey Brin .Google语法简介提供可能最符 合要求的网站1 一般功能:逻辑运算: 逻辑“与”:空格即可 逻辑“或”:大写“OR”表示 逻辑“非”:用“-”表示,“-”前必须有空格词语检索 双引号“”,常用于专业词语的检索大小写Google不区分大小写 2 特殊功能查询某一类文档:“关键词 filetype:文档类型”如:“教育技术 filetype:ppt” 常用查询类型包括:.xls、.ppt、.doc, .swf、 .pdf文档等共13种类型。检索结果教育技术 fileype:ppt对搜索的网站进行限制“site:”表示检索结果局限于某

9、个具体网 站或某个域名。如:搜索中国教育科研网站()上所有 包含“教育家”的网页,检索提问为:“教育家 site: ”其他限制 “intitle:” 如:intitle:george walker bush “link:” 如:link:等等检索结果能从Google服 务器里直接取出 缓存的网页Intitle:”george walker bush”2.3 Google的学术搜索2.3.1 Google Scholar简介 定位:专门面向学术资源的免费搜索工 具 推出时间:2004年11月 网址:http:/ 搜索结果:论文、图书、预印本、摘要、技 术报告等。 信息来源:合作伙伴(ACM、IE

10、EE、Nature 、 OCLC等);互联网2.3.2 Google学术搜索(中文)简介2006年1月11日,Google公司宣布将( Google Scholar)扩展至中文学术文献领域, 推出面向中文的Google学术搜索服务。搜索结果:论文、图书、预印本、摘要、 技术报告等。信息来源:合作伙伴(万方、维普等); 互联网Google Scholar应用示例: L.C. Spears Practicing Servant Leadership, Leader to Leader, 2004,34, pages 7-11. L.C.Spears 2004杨家燕搜索引擎应用与经典搜索案例32GO

11、OGLE高级检索常用语法杨家燕搜索引擎应用与经典搜索案例33语法词说明举例 site结果局限在某网站或某域名吸星大法 site: Site:cn 红旗 Link联接网站页面Link:Inurl网页链接中包含查询第一个关 键字,后面的关键字出现在联 接中或文档中Inurl:security web inurl:midi 沧海一声笑 inurl:pdf ecommerce Allinurl网页链接中包含所有查询关键 字Allinurl:pdf +cgiintitle在网页的标题中查询intitle:藤原纪香 电影Allintitle在网页的标题中查询allintitle:古龙 金庸filetype

12、限定所查文献类型filetype:ppt 信息检索GOOGLE高级检索罕用语法杨家燕搜索引擎应用与经典搜索案例34语法词说明举例related用来搜索结构内容方面相 似的网页related:cache用来搜索GOOGLE服务 器上某页面的缓存,这个 功能同“网页快照”,通常 用于查找某些已经被删除 的死链接网页Cache:http:/www.jiuji bakanghong/info用来显示与某链接相关的 一系列搜索,提供cache 、link、related和完全包 含该链接的网页的功能info: 结果:有关 的网页信息define:定义,查找概念,维基百科define:信息搜索引擎应用与

13、经典搜索案例35GOOGLE告诉我们世界是怎样的(趣味网络计量学) 检索词1检索词2检索词1页 面数检索词2页 面数结论金庸 琼瑶42万12万3000金庸占压倒性优势!qqmsn480 万523 万还差一点点,民族软件加油!开始结束969 万284 万有多少开始没有结束?书电影946 万305 万书籍的力量!赵薇李亚鹏32万7 万7500臭名也是名啊 用户名密码363 万482 万这是部分用户常更改密码所致搜索引擎应用与经典搜索案例36检索词1检索词2检索词1页面 数检索词1页面 数结论战争和平132 万121 万愿上帝保佑我们打假制假35万50007 万1000恩恩重拳出击! ! 求婚 结婚

14、11万76万6000浪漫没了麻烦省了效率 高了。 鲸鱼是鱼鲸鱼不是鱼1 万56009100狂汗美女女人1202万 5000633 万6000哈哈这个世界美女比女 人还多 警察小偷326 万29万十个警察抓一个小偷都 抓不完。 面包爱情23万8000237 万要爱情还是面包? google给了我们答案 爱情万岁! 得到失去824 万262 万富有哲理的答案1. Google Picasa 图片编辑处理工具2. 桌面搜索程序3. Google Earth(http:/)4. Gmail (免费邮箱)5. Googlepages(http:/)6. Google Calendar(http:/ Google Scholar (http:/)8. Google Finance (http:/)9. Google Print (http:/)10.本地搜索(http:/ 全球最大中文搜索引擎。提供网页快 照、网页预览/预览全部网页、相关搜索 词、错别字纠正提示、新闻搜索、Flash 搜索、信息快递搜索、百度搜霸、搜索援 助中心。 地址: http:/ 一、概况 百度(B,Inc)于1999年底 成立于美国硅谷,2000年,落

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号