seo基础知识整理

上传人:206****923 文档编号:91265815 上传时间:2019-06-27 格式:DOC 页数:6 大小:55.02KB
返回 下载 相关 举报
seo基础知识整理_第1页
第1页 / 共6页
seo基础知识整理_第2页
第2页 / 共6页
seo基础知识整理_第3页
第3页 / 共6页
seo基础知识整理_第4页
第4页 / 共6页
seo基础知识整理_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《seo基础知识整理》由会员分享,可在线阅读,更多相关《seo基础知识整理(6页珍藏版)》请在金锄头文库上搜索。

1、一、 SEO英文Search Engine Optimization搜索引擎优化是一种利用搜索引擎的搜索规则来提高目前网站在有关搜索引擎内的自然排名的方式。搜索引擎:是指根据一定的策略、运用特定的计算机程序(蜘蛛和爬虫)从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。常用的搜索引擎:百度、搜狗、谷歌、360、搜搜等。了解蜘蛛或者爬虫有没有来过网站,可以通过软件分析一下logfiles文件,日志文件会记录蜘蛛的爬取状况。常见的蜘蛛爬虫:百度爬虫 * Baiduspider+(+http:/ google爬虫 * Mozilla/5.0 (c

2、ompatible; Googlebot/2.1; +http:/ * Googlebot/2.1 (+http:/ * Googlebot/2.1 (+http:/ 雅虎爬虫(分别是雅虎中国和美国总部的爬虫) *Mozilla/5.0 (compatible; Yahoo! Slurp China; http:/ *Mozilla/5.0 (compatible; Yahoo! Slurp; http:/ 新浪爱问爬虫 *iaskspider/2.0(+http:/ *Mozilla/5.0 (compatible; iaskspider/1.0; MSIE 6.0) 搜狗爬虫 *Sogou

3、 web spider/3.0(+http:/ *Sogou Push Spider/3.0(+http:/ 网易爬虫 *Mozilla/5.0 (compatible; YodaoBot/1.0; http:/ ) MSN爬虫 *msnbot/1.0 (+http:/ Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码。消息(1字头)编辑这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。成功(2字头)编辑这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。成功200 正常;请求已完成。201

4、 正常;紧接POST命令。202 正常;已接受用于处理,但处理尚未完成。203 正常;部分信息 返回的信息只是一部分。204 正常;无响应 已接收请求,但不存在要回送的信息。重定向(3字头)编辑这类状态码代表需要客户端采取进一步的操作才能完成请求。通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的 Location 域中指明。重定向301 永久重定向 请求的数据具有新的位置且更改是永久的。302 暂时重定向 请求的数据临时具有不同 URI。303 请参阅其它 可在另一URI下找到对请求的响应,且应使用 GET方法检索此响应。304 未修改 未按预期修改文档。305 使用代理

5、必须通过位置字段中提供的代理来访问请求的资源。306 未使用 不再使用;保留此代码以便将来使用。请求错误(4字头)编辑这类的状态码代表了客户端看起来可能发生了错误,妨碍了服务器的处理。除非响应的是一个 HEAD 请求,否则服务器就应该返回一个解释当前错误状况的实体,以及这是临时的还是永久性的状况。这些状态码适用于任何请求方法。浏览器应当向用户显示任何包含在此类错误响应中的实体内容。代码中的错误400 错误请求 请求中有语法问题,或不能满足请求。401 未授权 未授权客户机访问数据。402 需要付款 表示计费系统已有效。403 禁止 即使有授权也不需要访问。404 找不到服务器找不到给予的资源;

6、文档不存在。406 不可接受 根据此请求中所发送的“接受”标题,此请求所标识的资源只能生成内容特征为“不可接受”的响应实体。407 代理认证请求 客户机首先必须使用代理认证自身。410 请求的网页不存在(永久);415 介质类型不受支持 服务器拒绝服务请求,因为不支持请求实体的格式。服务器错误(5字头)编辑这类状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。除非这是一个HEAD 请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。错误5

7、00 内部错误 因为意外情况,服务器不能完成请求。501 未执行 服务器不支持请求的工具。502 错误网关服务器接收到来自上游服务器的无效响应。503 无法获得服务 由于临时过载或维护,服务器无法处理请求。搜索引擎的排名原理:百度算法:网页标题、关键词个数、关键词密度、网站导航是否是文字导航、图片原创添加alt标签、网站代码简洁、空间要稳定、友情链接、网站按规律更新、高质量外链、站内链接等等。(1) 网站本身内容、结构:通过百度蜘蛛下载回来的网页放到补充数据区,通过各种程序计算过后才放到检索区,才会形成稳定的排名,检索区的数据排名是相对比较稳定的。(2) 外部链接:百度蜘蛛在从首页登陆后抓取首

8、页后调度会计算其中所有的连接,返回给百度蜘蛛进行下一步的抓取连接列表,百度蜘蛛再进行下一步的抓取。(增加相关连接来提高网页质量,通过增加其他页面对该页的反向连接来提高权重,通过外部连接增加权重。)搜索引擎的工作原理爬、抓、处、排、展。爬的意思就是派蜘蛛出来做搬运工的事情,也就是在你的网站上进行爬取,但记住爬取不代表抓取,抓取是指蜘蛛觉得你的内容是不错的,它把内容带回到处理中心,反过来内容不好的话就没有抓取这个动作。所以在抓的过程中就有了处理这个过程,处理的过程一般我们称为它是一个算法,英文叫做Algorithm。在这个算法过程中,对于用户来讲没有办法进行所谓的人工干预,但也不排除某些搜索引擎会

9、的,在算法过程中我们知道所有的排序,内容处理,匹配,仿spam的处理。整个处理过程中最终是会展现出关键词的在首页或是前几页的顺序,这个顺序不只是排名的高与低,还有各式的形式或是称为排名多样性等等。那在排之后就是所谓给予用户的一个展现。搜索引擎的算法决定排名。二、网站结构(1)一个内容丰富的网站指的是文字,图片,产品等内容上的丰富,网站建设内容不仅要做到多,更要做到精。图文并茂,排版专业清晰,文字通顺合理,遣词造句体现功底,体现专业权威这些都是最基本的要求。绝大数的企业老板喜欢在网站首页放置flash和大图,首先这两样都是蜘蛛陷阱,蜘蛛是无法识别他们的,除了图片可以加ALT标签后可以识别,fla

10、sh是百度蜘蛛无法识别的,整个网站首页后导航下再加个大图或者flash。第一,网站的树形结构。这是一个大的方向。网站建设人员在建站的时候往往很容易忽视这个问题。首先要知道一点,一个页面处于根目录下的第几级页面将直接决定了spider对其权重的判断,这也是树形结构为什么如此重要的原因。而spider的爬行顺序一般都是由主页,到二级目录,然后是三级目录,当你把所有的页面放在一起的时候,很明显,这是不利于爬行的。这对于网站SEO来说是一个非常头疼的问题,因为一旦做好了,如果要修改这些路径,是非常麻烦的。第二,网站的代码。百度虽然一直都在重复声明已经在完善对于动态页面的收录情况,但是事实告诉我们,它只

11、是一直在声明,却从未做到过。网站建设或者网站的程序人员需要注意的是在网站的开发过程中,不到万不得已千万别用动态,用伪静态都行。继而就是网站的样式标签和JS调用了。这也是网站建设过程中一个非常需要关注的问题。CSS样式表和网站的JS文件并不是拿来看的,它可以有效的减少spider对于网站爬行的量,让spider在爬行你网站的时候更为简单,快捷,给蜘蛛好感。所以笔者友情提示下,网站的样式与JS尽量写在CSS与JS里面,别给网站增加压力。还有就是代码的类型了。很多的代码都已经被越来越多的优化引擎所淘汰。如以前的table标签,现在就越来越被spider所不喜欢了,现在的spider喜欢的是DIV。还

12、有一点就是网站SEO优化非常重要的,那就是title、keywords和description标签了。网站程序人员在程序开发的时候务必要注意二级或者三级页面的这些问题,因为如果能做到统一好,就不需要再后期进行修改了。第三,架构上的合理。spider对于网站的抓取仅限于文本这是一个众所周知的潜规则。而一个网站90%左右的文本类型基本上都集中于产品页与新闻页中,故如何能让这两个页面被spider所抓取是建站的时候 要考虑的问题之一,比如多增加这些页面的入口等。当然这些页面的价值体现了,最终还是要返回给主页的。这时候面包屑的标签就体现出来了。所有二级页面三级页面的权重传递几乎都是依靠面包屑标签来传递

13、的。这也是为什么网站优化人员一直重视它的原因。网站结构优化 1.网站页面布局要做到扁平化 2. 网站URL路径,要做到简洁(域名规范化)3.站内相关链接,把网站内部链接做好是非常重要优化手段,我们可以利用内部链接,为关键词建立更多反向链接。反向链接是针对网页与网页中间链接,而非网站之间链接,所有反向链接其实对网站排名也是有帮助。(2)网站的三要素什么是降权?降权,一般是指搜索引擎给网站评定的级别下降了,也是搜索引擎对网站进行的一种处罚方式。使用site指令,不在首页第一位收录异常,收录量大幅减少搜索自己的网站名称关键词排名下降蜘蛛爬行日志异常导致降权的可能原因过度的SEO,或者过于明显的SEO

14、同一服务器垃圾站点过多内容数量过大幅度的增加或者减少友情链接一。什么是网站页面的三要素,三要素分别指什么?这里的网站页面三要素主要是指网站的meta标签的三大标签:标题(title)、描述(description)、关键词(kewords)。二。下面来进行详细的讲解和介绍 标题:网站定位。标题长度尽量要固定在28个汉字,否则,在搜索结果中过长的标题会用省略号省略。标题过长也会分散网站的权重。描述 描述对网站内容的概括,要与网站的主题内容相匹配,描述要有自己的特色,表现出自己网站的价值定位。描述中适当的插入2个关键词,在搜索结果中会被加红。关键词关键词是一种获取信息的一种精炼的词汇。从所有的信息当中去挖取出信息的核心意思,再从核心意思去转换成一个单词,这个单词或是小段短语就是所谓的关键词了。因此,关键词是一个大内容下的精炼体。总结来说搜索引擎的算法决定排名,用户的关键词开启展现。有些是客观的,有些是用户能决定。总体关键词分为三大类。第一类就如同树一样底部的根系,我们称为词根,比如地铁这个词root keywo

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号