文档详情

网上搜索资料.doc

新**
实名认证
店铺
DOC
99.50KB
约10页
文档ID:555495439
网上搜索资料.doc_第1页
1/10

目录一、搜索引擎的认识 2二、搜索引擎的分类 2(一)全文搜索引擎 2(二)目录搜索引擎 2三、搜索引擎的作用 2四、搜索引擎的工作原理 2(一)从互联网上抓取网页 2(二)建立索引数据库 2(三)搜索排序 2五、搜索引擎的组成 2(一)搜索器 2(二)索引器 3(三)检索器 3(四)用户接口 3六、搜索引擎的使用技巧 3(一)简单查询 3(二)使用双引号用("") 3(三)使用加号(+) 4(四)使用减号(-) 4(五)使用通配符(*和?) 4(六)使用布尔检索 4(七)使用括号 4(八)使用元词检索 4(九)区分大小写 4七、搜索引擎的优化 5(一)优化与行销 5(二)域名和空间 51、域名对搜索引擎的影响 52、空间搜索引擎的影响 5(三)优化目的 6(四)网站优化与搜索引擎 6(五)搜索引擎优化的步骤 61、关键词的研究并选择 62、全面的客户网站诊断和建议 63、搜索引擎和目录的提交 74、月搜索引擎排名报告和总结 75、季度网站更新 7八、搜索引擎的营销 7(一)搜索引擎营销思想 7(二)搜索引擎营销主要实现方法包括 7(三)特点 7(四)搜索引擎营销 81、网站推广需要有效的网站内容 82、网站内容策略与网站推广策略密不可分 8(五)主要实现方法、方法策略 9搜索引擎searchengine一、搜索引擎的认识 搜索引擎(searchengine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

二、搜索引擎的分类(一)全文搜索引擎 基于关键字的搜索方式,当用户输入要查询的关键字后,检索与用户查询条件相匹配的记录,按一定的排列顺序将结果返回给用户 优点:信息量大、更新及时、不需人工干预 缺点:信息量过多、用户必须从结果中进行筛选(二)目录搜索引擎 以人工方式或者半自动方式搜索信息,人工形成信息摘要,并将信息存储在事先确定好的分类框架中 优点:查询信息准确度高 缺点:需要人工维护量大、搜集到的信息少、信息更新不及时三、搜索引擎的作用 搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值 1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用 2、从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销 3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。

四、搜索引擎的工作原理(一)从互联网上抓取网页 利用能够从互联网上自动收集网页的Spider(蜘蛛)系统程序,自动访问互联网,并沿着任何网页上得所有URL爬到其他网页,重复这过程,并把爬过的所有网页回来二)建立索引数据库 对回来的网页进行分析,提取网页信息,根据一定的算法进行大量复杂计算,得到每一个网页针对页面内容中得每一个关键词的相关度,然后利用这些信息建立索引数据库三)搜索排序 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,并按相关度数值排序五、搜索引擎的组成(一)搜索器 搜索器的功能是在互联网中漫游,发现和搜集信息它常常是一个计算机程序,日夜不停地运行它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死连接和无效连接目前有两种搜集信息的策略: 1、从一个起始URL集合开始,顺着这些URL中的超链(Hyperlink),以宽度优先、深度优先或启发式方式循环地在互联网中发现信息这些起始URL可以是任意的URL,但常常是一些非常流行、包含很多链接的站点(如Yahoo!)。

2、将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索 搜索器搜集的信息类型多种多样,包括HTML、XML、Newsgroup文章、FTP文件、字处理文档、多媒体信息 搜索器的实现常常用分布式、并行计算技术,以提高信息发现和更新的速度商业搜索引擎的信息发现可以达到每天几百万网页二)索引器 索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表 索引项有客观索引项和内容索引项两种:客观项与文档的语意内容无关,如作者名、URL、更新时间、编码、长度、链接流行度(LinkPopularity)等等;内容索引项是用来反映文档内容的,如关键词及其权重、短语、单字等等内容索引项可以分为单索引项和多索引项(或称短语索引项)两种单索引项对于英文来讲是英语单词,比较容易提取,因为单词之间有天然的分隔符(空格);对于中文等连续书写的语言,必须进行词语的切分 在搜索引擎中,一般要给单索引项赋与一个权值,以表示该索引项对文档的区分度,同时用来计算查询结果的相关度使用的方法一般有统计法、信息论法和概率法短语索引项的提取方法有统计法、概率法和语言学法。

索引表一般使用某种形式的倒排表(InversionList),即由索引项查找相应的文档索引表也可能要记录索引项在文档中出现的位置,以便检索器计算索引项之间的相邻或接近关系(proximity) 索引器可以使用集中式索引算法或分布式索引算法当数据量很大时,必须实现即时索引(InstantIndexing),否则不能够跟上信息量急剧增加的速度索引算法对索引器的性能(如大规模峰值查询时的响应速度)有很大的影响一个搜索引擎的有效性在很大程度上取决于索引的质量三)检索器 检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制 检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种四)用户接口 用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯用户输入接口可以分为简单接口和复杂接口两种 简单接口只提供用户输入查询串的文本框;复杂接口可以让用户对查询进行限制,如逻辑运算(与、或、非;+、-)、相近关系(相邻、NEAR)、域名范围(如.edu、.com)、出现位置(如标题、内容)、信息时间、长度等等。

六、搜索引擎的使用技巧(一)简单查询  在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息二)使用双引号用("")  给要查询的关键词加上双引号(半角,以下要加的其它符号同此),可以实现精确的查询,这种方法要求查询结果要精确匹配,不包括演变形式例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“”之类网页三)使用加号(+)  在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出现在搜索结果中的网页上,例如,在搜索引擎中输入“+电脑++”就表示要查找的内容必须要同时包含“电脑、、”这三个关键词四)使用减号(-)  在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词,例如,在搜索引擎中输入“电视台-中央电视台”,它就表示最后的查询结果中一定不包含“中央电视台”五)使用通配符(*和?)  通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要受到限制,主要用在英文搜索引擎中例如输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。

六)使用布尔检索 所谓布尔检索,是指通过标准的布尔逻辑关系来表达关键词与关键词之间逻辑关系的一种查询方法,这种查询方法允许我们输入多个关键词,各个关键词之间的关系可以用逻辑关系词来表示 and,称为逻辑“与”,用and进行连接,表示它所连接的两个词必须同时出现在查询结果中,例如,输入“computerandbook”,它要求查询结果中必须同时包含computer和book  or,称为逻辑“或”,它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入“computerorbook”,就要求查询结果中可以只有computer,或只有book,或同时包含computer和book not,称为逻辑“非”,它表示所连接的两个关键词中应从第一个关键词概念中排除第二个关键词,例如输入“automobilenotcar”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车) near,它表示两个关键词之间的词距不能超过n个单词 在实际的使用过程中,你可以将各种逻辑关系综合运用,灵活搭配,以便进行更加复杂的查询七)使用括号  当两个关键词用另外一种操作符连在一起,而你又想把它们列为一组时,就可以对这两个词加上圆括号。

八)使用元词检索 大多数搜索引擎都支持“元词”(metawords)功能,依据这类功能用户把元词放在关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征例如,你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页在键入的关键词后加上“domainrg”,就可以查到所有以org为后缀的网站 其他元词还包括:image:用于检索图片,link:用于检索链接到某个选定网站的页面,URL:用于检索地址中带有某个关键词的网页九)区分大小写  这是检索英文信息时要注意的一个问题,许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网七、搜索引擎的优化 搜索引擎优化(SearchEngineOptimization,简称SEO)是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式由于不少研究发现,搜索引擎的用户往往只会留意搜索结果最前面的几个条目,所以不少网站都希望通过各种形式来影响搜索引擎的排序当中尤以各种依靠广告维生的网站为甚。

所谓“针对搜索引擎作最佳化的处理”,是指为了要让网站更容易被搜索引擎接受深刻理解是:通过SEO这样一套基于搜索引擎的营销思路,为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益 搜索引擎优化(别名:网站优化技术)是针对搜索引擎对网页的检索特点,让网站建设各项基本要素适合搜索引擎的检索原则,从而使搜索引擎收录尽可能多的网页,并在搜索引擎自然检索结果中排名靠前,最终达到网站推广的目的。

下载提示
相似文档
正为您匹配相似的精品文档