Google搜索从入门到精通v

上传人:夏** 文档编号:572106875 上传时间:2024-08-12 格式:PDF 页数:8 大小:467.02KB
返回 下载 相关 举报
Google搜索从入门到精通v_第1页
第1页 / 共8页
Google搜索从入门到精通v_第2页
第2页 / 共8页
Google搜索从入门到精通v_第3页
第3页 / 共8页
Google搜索从入门到精通v_第4页
第4页 / 共8页
Google搜索从入门到精通v_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《Google搜索从入门到精通v》由会员分享,可在线阅读,更多相关《Google搜索从入门到精通v(8页珍藏版)》请在金锄头文库上搜索。

1、转1,前言2,摘要3,如何使用本文4,Google 简介5,搜索入门6,初阶搜索6.1,搜索结果要求包含两个及两个以上关键字6.2,搜索结果要求不包含某些特定信息6.3,搜索结果至少包含多个关键字中的任意一个7,杂项语法7.1,通配符问题7.2,关键字的字母大小写7.3,搜索整个短语或者句子7.4,搜索引擎忽略的字符以及强制搜索8,进阶搜索8.1,对搜索的网站进行限制8.2,查询某一类文件8.3,搜索的关键字包含在 URL 链接中8.4,搜索的关键字包含在网页标题中8.5,搜索的关键字包含在网页“锚”内9,其他罕用语法9.1,搜索所有链接到某个 URL 地址的网页9.2,查找与某个页面结构内容

2、相似的页面9.3,从 Google 服务器上缓存页面中查询信息10,图片搜索11,目录检索12,新闻组搜索13,Google 的其他杰出功能13.1,网页快照13.2,集成化的工具条13.3,单词英文解释13.4,网页翻译13.5,单词纠错13.6,搜索结果过滤14,Google 尚未发布的一些新特性和功能14.1,对网页更新日期做出限定14.2,新闻搜索14.3,分类广告搜索14.4,其它 Google 的最新发展动态14.5,一个有趣的地方15,后记1,前言我是在 2000 年上半年知道 Google 的。在这之前,我搜索英文信息通常用 AltaVista,而搜索中文信息则常用 Sina。

3、但自使用了Google 之后,它便成为我的 FavoriteSearchEngine 了。这也得感谢新浪网友曹溪,因为当初正是因为他的大力推介,才使我识得了 Google。记得 1996 年夏季的时候,当我第一次接触 Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的 WWW 冲浪和如痴如醉的 BBS 沉迷之后,我意识到 Internet 对我影响至深的还是在于学习方式的变迁。如何来描述这种变迁呢?以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信

4、息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我们到了大型的图书城,往往有一种不知所措的感觉。旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨把这称为“即学式” ,相应的,旧有的称为“预学式” 。不过, “即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,Internet 可以充当那个海量的信息库,而搜索引擎,则正是寻找光明之火的绝好工

5、具。“公欲善其事,必先利其器” 。Internet 只有一个,而搜索引擎则有 N 多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容” 。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。 不同的时期,涌现出不同的强者。 就目前而言, 我们非常幸运的有了:*Google*2,摘要本文简要的介绍了 Google 的历史和特点,Google 的基本搜索语法和高级搜索语法,Google 的特色功能,包括图片搜索、新闻组搜索和集成工具条等。尽管本文名为“Google 搜索从入门到精通”

6、,但事实上,本文只能算是对 Google 的一个并不十分完全的介绍而已。3,如何使用本文阅读本文最好具备一些最基本的布尔代数基础,如“与” 、 “或” 、 “非”等。不过,即便你没有这方面的知识,也不必在意。对那些实例进行练习,你的疑惑就会迎刃而解。对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。此外,你也可以参考中文 Google 大全:/intl/zh-CN/about.html,以及搜索帮助 intl/zh-CN/help.html,那是官方 Google 使用手册以及问题解答中心。4,Googl

7、e 简介斯坦福大学博士生 LarryPage 与 SergeyBrin 于 1998 年 9 月发明, GoogleInc.于 1999 年创立。 2000 年 7 月份, Google 替代 Inktomi成为 Yahoo 公司的搜索引擎,同年 9 月份,Google 成为中国网易公司的搜索引擎。98 年至今,Google 已经获得 30 多项业界大奖。到 Google 的新闻/press/index.html) ,你可以找到关于一切关于 Google 的历史和新闻资料。Google 的成功得益于其强大的功能和独到的特点:Google 检索网页数量达 24 亿,搜索引擎中排名第一;Googl

8、e 支持多达 132 种语言,包括简体中文和繁体中文;Google 网站只提供搜索引擎功能,没有花里胡哨的累赘;Google 速度极快,年初时据说有 15000 多台服务器,200 多条 T3 级宽带;Google 的专利网页级别技术 PageRank 能够提供准确率极高的搜索结果;Google 智能化的“手气不错”功能,提供可能最符合要求的网站;Google 的“网页快照”功能,能从 Google 服务器里直接取出缓存的网页。Google 具有独到的图片搜索功能;Google 具有强大的新闻组搜索功能;Google 具有二进制文件搜索功能(PDF,DOC,SWF 等) ;Google 还有很

9、多尚在开发阶段的令人吃惊的设想和功能。等等5,搜索入门第一次进入 Google,它会根据你的操作系统,确定语言界面。需要提醒的是, Google 是通过 cookie 来存储页面设定的,所以,如果你的系统禁用 cookie,就无法对 Google 界面进行个人设定了。Google 的首页很清爽,LOGO 下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎” ,选中“搜索中文(简体)网页”选项,然后点击下面的“Google 搜索”按钮(或者直接回车) ,结

10、果就出来了。搜索: “搜索引擎”结果:已搜索有关搜索引擎的中文(简体)网页。共约有 707,000 项查询结果,这是第 1-10 项。搜索用时 0.08 秒。仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。6,初阶搜索上例是最基本的搜索,即查询包含单个关键字的信息。但是,你可以发现,上例中,单个关键字“搜索引擎” ,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。6.1,搜索结果要求包含两个及两个以上关键字一般搜索引擎需要在多

11、个关键字之间加上“” ,而 Google 无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页搜索: “搜索引擎历史”结果:已搜索有关搜索引擎历史的中文(简体)网页。共约有 78,600 项查询结果,这是第 1-10 项。搜索用时 0.36 秒。用了两个关键字,查询结果已经从 70 多万项减少到 7 万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史” ,并不是我们所需要的“搜索引擎的历史” 。怎么办呢?

12、删除与搜索引擎不相关的“历史” 。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史” 、 “世界历史” 、 “历史书籍”等。6.2,搜索结果要求不包含某些特定信息Google 用减号“-”表示逻辑“非”操作。 “A?B”表示搜索包含 A 但没有 B 的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化” 、 “中国历史”和“世界历史”的中文网页搜索: “搜索引擎历史-文化-中国历史-世界历史”结果:已搜索有关搜索引擎历史-文化-中国历史-世界历史的中文(简体)网页。共约有 36,800 项查询结果,这是第 1-10 项。搜索用时 0.22 秒。我们看到

13、,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:搜索引擎直通车搜索引擎发展历史搜索引擎直通车,.搜索引擎专业介绍站点.www.se- 搜索王本站检索整个网站在此输入关键词.你的当前位置:首页Internet 搜索手册搜索引擎的历史.也符合搜索要求。但是,10 个结果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开 se- 的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛” ,而最早成型的搜索引擎是“Lycos” ,使搜索引擎深

14、入人心的是“Yahoo” 。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。注意:这里的“”和“-”号,是英文字符,而不是中文字符的“”和“” 。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎-文化” ,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。6.3,搜索结果至少包含多个关键字中的任意一个。Google 用大写的“OR”表示逻辑“或”操作。搜索“ AORB” ,意思就是说,搜索的网页中, 要么有 A,要么有 B,要么同时有 A 和 B。在上例中,我们希望搜索结果中最好含有“archie” 、 “lycos” 、 “蜘蛛”等关键字中的

15、一个或者几个,这样可以进一步的精简搜索结果。示例: 搜索如下网页,要求必须含有 “搜索引擎”和 “历史” ,没有 “文化” , 可以含有以下关键字中人任何一个或者多个: “Archie” 、“蜘蛛” 、 “Lycos” 、 “Yahoo” 。搜索: “搜索引擎历史 archieOR 蜘蛛 ORlycosORyahoo-文化”结果:已搜索有关搜索引擎历史 archieOR 蜘蛛 ORlycosORyahoo-文化的中文(简体)网页。共约有 8,400 项查询结果,这是第 1-10项。搜索用时 0.16 秒。我们看到,搜索结果缩小到 8 千多项,前 20 项结果中,大部分都符合搜索要求。如果你想了

16、解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。注意: “与”操作必须用大写的“OR” ,而不是小写的“or” 。在上面的例子中,我介绍了搜索引擎最基本的语法“与” “非”和“或” ,这三种搜索语法 Google 分别用“” (空格) 、 “-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“”连起来) ,目标信息不能含有的关键字(用“-”去掉) ,目标信息可能含有的关键字(用“OR”连起来) 。7,杂项语法7.1,通配符问题很多搜索引擎支持通配符号,如“*”代表一连串字符, “?”代表单个字符等。Goog

17、le 对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用引起来。比如, “以*治国” ,表示搜索第一个为“以” ,末两个为“治国”的四字短语,中间的“*”可以为任何字符。7.2,关键字的字母大小写Google 对英文字符大小写不敏感, “GOD”和“god”搜索的结果是一样的。7.3,搜索整个短语或者句子Google 的关键字可以是单词(中间没有空格) ,也可以是短语(中间有空格) 。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。示例:搜索关于第一次世界大战的英文信息。搜索: “worldwarI”结果:已向英特网搜索worldwari.共约有 9

18、37,000 项查询结果,这是第 1-10 项。搜索用时 0.06 秒。7.4,搜索引擎忽略的字符以及强制搜索Google 对一些网路上出现频率极高的英文单词,如“i” 、 “com” 、 “www”等,以及一些符号如“*” 、 “.”等,作忽略处理。示例:搜索关于 www 起源的一些历史资料。搜索: “www 的历史 internet”结果:以下的字词因为使用过于频繁,没有被列入搜索范围:www 的.已搜索有关 www 的历史 internet 的中文(简体)网页。共约有75,100 项查询结果,这是第 1-10 项。搜索用时 0.22 秒。我们看到,搜索 “www 的历史 internet

19、” ,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了 “历史”和“internet” 。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www 的历史”的时候,搜索引擎实际上把这个短语分成三部分, “www” 、 “的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www 的历史” ,但搜索引擎还是把这个短语当成三个关键字分别检索。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。搜索: “+www+的历史 internet”结果:已搜索有关+www+的历史 internet 的中文(简体)网页。共约有 25,000

20、 项查询结果,这是第 1-10 项。搜索用时 0.05 秒。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”worldwarI”中, “I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。搜索: “www 的历史internet”结果:已搜索有关www 的历史internet 的中文(简体)网页。共约有 7 项查询结果,这是第 1-6 项。搜索用时 0.26 秒。我们看到,这一搜索事实上把“www 的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。注意:大部分常用英文符号(如问号,句号,逗号等)无法成

21、为搜索关键字,加强制也不行。8,进阶搜索上面已经探讨了 Google 的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。8.1,对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道,如“” 、 “” ,或者是某个域名,如“” 、 “com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名” 。示例:搜索中文教育科研网站()上关于搜索引擎技巧的页面。搜索: “搜索引擎技巧 site:”结果:已搜索有关搜索引擎技巧 site: 的中文(简体)网页。共约有 608 项查询

22、结果,这是第 1-10 项。搜索用时 0.05 秒。示例:上着名 IT 门户网站 ZDNET 和 CNET 搜索一下关于搜索引擎技巧方面的资讯。搜索: “searchengineOR”注意,在这里 Google 有个小 BUG。 “” ,其实应该表述成“” 。示例:搜索新浪科技频道中关于搜索引擎技巧的信息。搜索: “”注意:site 后的冒号为英文字符,而且,冒号后不能有空格,否则, “site:”将被作为一个搜索的关键字。此外,网站域名不能有“”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。8.2,在某一类文件中查找信息“filet

23、ype:”是 Google 开发的非常强大实用的一个搜索语法。也就是说,Google 不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google 已经能检索微软的 Office 文档如.xls、.ppt、.doc,.rtf,WordPerfect 文档,Lotus1 - 2-3 文档,Adobe 的.pdf 文档,ShockWave 的.swf 文档(Flash 动画)等。其中最实用的文档搜索是 PDF 搜索。PDF 是 ADOBE 公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google 检索的 PDF 文档大约有 2500 万左右,大约占所有索引的二进制

24、文档数量的 80。PDF 文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。示例:搜索几个资产负债表的 Office 文档。搜索: “资产负债表 filetype:docORfiletype:xlsORfiletype:ppt”结果:已搜索有关资产负债表 filetype:docORfiletype:xlsORfiletype:ppt 的中文(简体)网页。共约有 481 项查询结果,这是第1-10 项。搜索用时 0.04 秒。注意,下载的 Office 文件可能含有宏病毒,谨慎操作。示例:搜索一些关于搜索引擎知识和技巧方面的 PDF 文档搜索:?searchenginetipsO

25、Rtutorialfiletype:pdf”结果:已向英特网搜索searchenginetipsORtutorialfiletype:pdf.共约有 12,600 项查询结果,这是第 1-10 项。搜索用时 0.22秒。我们来看其中的一个结果:PDFSearchEnginesTips文档类型:PDF/AdobeAcrobat-HTML 版可以看到,Google 用PDF来标记这是一个 PDF 的文档检索,另外,它还给出了该 PDF 文档的 HTML 版本,该 HTML 版保留了文档的文字内容和结构,但没有图片。8.3,搜索的关键字包含在 URL 链接中“inurl”语法返回的网页链接中包含第一

26、个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3” 、 “GALLERY”等,于是,就可以用INURL 语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL 语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。示例:查找 MIDI 曲“沧海一声笑” 。搜索: “inurl:midi“沧海一声笑”结果:已搜索有关 inurl:midi沧海一声笑的中文(简体)网页。共约有 27 项查询结果,这是第 1-10 项。搜索用时 0.34 秒。注意: “inurl:”后面不能有

27、空格,Google 也不对 URL 符号如“/”进行搜索。例如,Google 会把“cgi-bin/phf”中的“/”当成空格处理。“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。示例:查找可能具有 PHF 安全漏洞的公司网站。通常这些网站的 CGI-BIN 目录中含有 PHF 脚本程序(这个脚本是不安全的) ,表现在链接中就是“域名/cgi-bin/phf” 。搜索: “allinurl:cgi-binphf+com”结果:已向英特网搜索 allinurl:cgi-binphf+com.共约有 51 项查询结果,这是第 1-10 项。搜

28、索用时 0.11 秒。8.4,搜索的关键字包含在网页标题中“intitle”和“allintitle”的用法类似于上面的 inurl 和 allinurl,只是后者对 URL 进行查询,而前者对网页的标题栏进行查询。网页标题,就是 HTML 标记语言 title 中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。示例:查找日本明星藤原纪香的照片集。搜索: “intitle:藤原纪香写真集”结果:已搜索有关 intitle:藤原纪香写真集的中文(简体)网页。共约有 315 项查询结果,这是第 1-10 项。搜

29、索用时 0.15 秒。8.5,搜索的关键字包含在网页的“锚” (anchor)链点内所谓“锚” ,就是在同一个网页中快速切换链接点。与 URL 和 TITLE 类似,Google 提供了两种对 anchor 的检索, “inanchor”和“allinanchor” 。对此不作详述。9,其他罕用语法9.1,搜索所有链接到某个 URL 地址的网页如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。示例:搜索所有含指向华军软件园“”链接的网页。搜索: “link:”注意: “link”不能与其他语法相混合操作,所以“link:”后面即使有空格

30、,也将被 Google 忽略。另外还要说明的是,link 只列出 Google 索引链接很小一部分,而非全部,所以如果你用 Google 没有搜到链到你的主页的链接,也不必灰心丧气。除了上述功能,link 语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用 link 语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。9.2,查找与某个页面结构内容相似的页面“related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,

31、搜狐首页,中华网首页等) , “” 。我到现在也不明白这个语法有什么作用,如果有谁知道,请不吝指教。预先感谢。9.3,从 Google 服务器上缓存页面中查询信息“cache”用来搜索Google 服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。其它罕用语法如 info、stock 等不一一介绍,有兴趣的读者可以参阅 Google 大全。10,图片搜索Google 自称可以检索 390,000,000 张图片,并称自己为“互联网上最好用的图像搜索工具” 。从使用结果来看,Google 的图片搜索的确不错,但个人以为比 AltaVis

32、ta 的还是要差一些,主要体现在检索图片数量比不上 AV,匹配度比 AV 的图片搜索器也差了些。但 AltaVista 国内用户无法正常访问,因此对中国用户而言,Google 的图片搜索引擎已经是最好的了。Google 首页点击“图像”链接就进入了Google 的图像搜索界面“”。你可以在关键字栏位内输入描述图像内容的关键字,如“britneyspears” ,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列。Google 给出的搜索结果具有一个直观的缩略图(THUMBNA

33、IL) ,以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“RemoveFrame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。Google 图像搜索目前支持的语法包括基本的搜索语法如“” 、 “-” 、 “OR” 、 “site”和“filetype:” 。其中“filetype:”的后缀只能是几种限定的图片类似,如 JPG,GIF 等。示例:查找新浪网上本拉登的图片搜索: “”举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布于各种新闻报道

34、中。如果用搜索图片库的方式(最容易想到的如“BenLadinphoto”但是,如果查找的图片在网上有很多主题“gallary”综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用 google 图片搜索;如果要搜索的图片通常是处于某个图片集合中的,则不适合用 google 图片搜索。11,目录检索如果不想搜索广泛的网页,而是 想寻找某些 专题 网站,可以访问 Google 的分类目录“ http:/” ,中文目录是“/Top/World/Chinese_Simplified/” 。分类的网站目录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所需要的信息能否在一

35、个专门主题的网站上找到。不过需要说明的是,用目录检索,往往需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览也就无从谈及了。目前Google 使用的分类目录采用了ODP 的内容。“OpenDirectoryProject”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。另外,Google 根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。示例:查找一下介绍搜索引擎方面的中文网站搜索:先进入中文简

36、体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,再进入“搜寻”子目录。我们看到在“WorldChineseSimplified计算机互联网络搜寻”下,还有两个子目录“分类目录(33)搜索引擎(10)” ,以及 6 个相关网站。显然,这些都是我们所需要的信息。除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。结果:在分类 Google 网页目录项中搜索搜索引擎。共约有 387 项查询结果,这是第 11-20 项。搜索用时 0.09 秒。可以看到,上述查询结果比普通的检索更有效, 因为在分类 “

37、互联网络”下进行搜索剔除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。但愿这个问题能随着 Google 以及 ODP 项目在国内名声的响亮而能得到改观。12,新闻组(论坛)搜索新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。DEJA 一直是新闻组搜索引擎中的佼佼者。2001 年 2 月份,Google 将 DEJA 收购并提供了所有 DEJA的功能。现在,除了搜索之外,Google 还支持新闻组的

38、WEB 方式浏览和张贴功能。进入 Google 新闻组“/” ,你有两种信息查找方式。一种是一层层的点击进入特定主题讨论组,另一种则是直接搜索。现在,我们进行一个最简单的搜索试验,查找一下新闻组中关于山顶洞人的讨论信息。搜索: “山顶洞人”结果:在各群组内搜索山顶洞人共约有 2,400 项查询结果,这是第1-10 项。搜索用时0.94 秒。搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”按钮,让帖子按照发布日期排列。因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、留言者、留言

39、代码、语言和发布日期作为条件进行搜索。其中作者项指 作者发帖所用的唯一识别号电子信箱。13,Google 的其他杰出功能13.1 网页快照网页快照是 Google 抓下来缓存在服务器上的网页。它有三个作用:第一,如果原地址打开很慢,那么可以直接查看 Google 缓存页面,因为 Google 服务器速度极快。第二,如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过 Google 快照看到该页面信息。当然,快照内容不是该页最新页面。第三,如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过Google 快照,因为快照中Google 用黄色表明关键字位置。13.2,集成化

40、的工具条为了方便搜索者,Google 提供了工具条,集成于浏览器中,用户无需打开 Google 主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank 等。最方便的一点在于用户可以快捷的在Google 主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。 欲安装 Google 的工具条,可以访问 “/” ,按页面提示可以自动下载并安装。不过,Google工具条目前只支持 IE5.0 以上版本。对于经常进行网络搜索者而言,Google 工具条实在是必备的东西! !13.3,单词英文解释写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。

41、现在有了 Google,一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可使用在线词典。进 入 英 文Google , 输 入 你 要 查 的 单 词 。 举 个 例 子 , 我 想 查 一 下suggest的 用 法 。 结 果 如 下 :“Searchedthewebforsuggest.Results1-10ofabout8,000,000.Searchtook0.08seconds.”注意看上面句子中,单词 suggest 下出现了一个横线,点击这个链接,就跳转到另外一个网站“” ,Google 已经把单词提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧

42、。13.4,网页翻译你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎么办?呵呵, Google 提供了网页翻译功能! !虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。试着做以下搜索: “bigbangsite:fr” 。这个表示查找关于宇宙大爆炸的法文网页。看第一条结果:TheBigBangWebsite-Translatethispage.AproposdeBigBang.Lederniernumroendate.Lesanciensnumros.Autresactivits.Concertsprogressifse

43、nFrance.Emissionsderadio.Liens.perso.club-internet.fr/calyx/bigbang/-3k-Cached-Similarpages有点晕。没关系,点击“Translatethispage”按钮。再看结果,嗯,大致能看明白,这原来是个叫“bigbang”的乐队的网站,与大爆炸无关.机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内容是不可能的。但西文间的互相转译比中英文机译强得多得多了。至少能看明白。13.5,单词纠错笔者记忆力很差,英文单词经常拼写错误。但Google 有纠错功能。比如在写上文的时候,我要用到英文单词

44、“tutorial” ,我只是依稀记得好像是“tatorial”的样子,但不肯定,于是用Google 查了一下,它马上提醒: “您要找的会不会是:tutorial” ,呵呵,正是这个单词。13.6,繁简转换对中文用户而言,常希望能同时检索繁体和简体信息。Google 能做到这一点。Google 默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索。这样省了不少力气。当然,如果你不希望这样的话,也可以在“ 使用偏好”中把这个选项关掉。13.7,搜索结果过滤网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,Google 新设立了成人

45、内容过滤功能,见 Google 的设置页面, (使用偏好/参数选择) ,最底下有一个选项 SafeSearchFiltering。不过,中文状态下的 Google 尚没有这个功能。14,Google 尚未发布的一些新特性和功能14.1,对网页更新日期做出限定“daterange:”评价一个搜索引擎的好坏,更新频率是一个很关键因素。通常情况下,我们总希望能找到最新的网页。Google 已经开发了对更新日期做限定的搜索语法,但目前还未公布。而且比较麻烦的是,Google 现在支持的日期格式为 julian(凯撒日)格式,把通用日期数值切换成 julian 格式需要借助第三方。不过,在下面这个自称是

46、“Google 终极搜索界面”的网页上,你已经可以利用Google的这项新特性了,它自动提供日期转换功能。Google 为什么要这样做呢?也许是在测试阶段,不想让太多人使用吧。14.2,新闻(资讯)搜索“http:/ 的新闻搜索尚在 B 测试阶段,但使用起来已经非常不错了。新闻首页按头条新闻,各国新闻,以及不同领域做了分类。你可以通过 Google 搜索各大门户和新闻网站的新闻,简单、快捷、方便。遗憾的是,目前 Google 新闻只检索英文信息。14.3,分类广告搜索“ B 测试阶段。主要是对电子分类广告做检索。广告页为 JPG 图片格式。14.4,其它 Google 的最新发展动态想了解 G

47、oogle 公司的工程师们都在忙些什么吗?去看一下 Google 实验室 的最新设想都在这个地方向访问者展现出来。现在处于发展和试验阶段的新功能有:术语查询、语音查询、键盘查询等等。网络工程师和程序员可以看看这个地方:/apis/(co,我想可以让你喜出望外的。14.5,一个有趣的地方想看看世界各国网民都用 Google 搜索什么信息么?到/press/zeitgeist.html(英文网页)看一下就知道了。从这些资讯中,你大致可以了解到世界热点和流行时尚走向。15,后记这个文章 4.0 版本与 3.0 版本相比,变更很大,主要把一些与Google 无关的东西删除了,另外随Google 的变化作了一些修正,并增加了一些 Google 尚未发布的新功能。关于搜索技巧和搜索实例,是各个搜索引擎共通的东西,是搜索者长期的经验积累,要写出来,是件工程很浩大的事情,因此在这个小文章中我就不献丑了。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号