SEO入门知识点SEO基础技巧SEO教程.docx

上传人:自*** 文档编号:126228851 上传时间:2020-03-23 格式:DOCX 页数:11 大小:43.97KB
返回 下载 相关 举报
SEO入门知识点SEO基础技巧SEO教程.docx_第1页
第1页 / 共11页
SEO入门知识点SEO基础技巧SEO教程.docx_第2页
第2页 / 共11页
SEO入门知识点SEO基础技巧SEO教程.docx_第3页
第3页 / 共11页
SEO入门知识点SEO基础技巧SEO教程.docx_第4页
第4页 / 共11页
SEO入门知识点SEO基础技巧SEO教程.docx_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《SEO入门知识点SEO基础技巧SEO教程.docx》由会员分享,可在线阅读,更多相关《SEO入门知识点SEO基础技巧SEO教程.docx(11页珍藏版)》请在金锄头文库上搜索。

1、SEO入门知识点,SEO基础技巧,SEO教程 SEO方面的知识,很是有趣,能学些新东西的感觉总是好的,随着经历增多心境较之前也少了些浮躁,当下的年纪也正是钻研些好玩事物的大好时光.1. SEO定义:Search Engine Optimization(全称)也即搜索引擎优化,就是从搜索引擎上获得流量的技术。搜索引擎的主要工作包括:通过了解搜索引擎的工作原理掌握如何在网 页流中爬取网页、如何进行索引以及如何确定某一关键词排名位置从而对网页内容进行科学的优化,使其符合用户浏览习惯的同时提高排名与网站访问量,最终获得 商业化能力的技术。2. 搜索引擎工作原理:主要有三段工作流程:爬行抓取、预处理、服

2、务输出2.1 爬行抓取主要功能是对网页进行抓取,目前有三种爬行抓取方法批量收集:对互联网上只要是存在链接的网页都收集一遍,耗时较长,在几周左右,缺点是增加了额外的带宽消耗,时效性也不高。增量收集:在原有已收集的网页基础上搜索新增加的网页,变更上次收集之后有改变的页面,删除收集重复和不存在的网页。站长通过工具向搜索引擎主动提交网站,这种方法的响应速度比较慢,主流上还是提倡让搜索引擎蜘蛛主动来爬取。2.1.1 常见蜘蛛搜索引擎蜘蛛是搜索引擎的一个自动程序,作用是访问互联网上的网页、图片、视频等内容,建立索引库,一般用法为spider+URL这里的URL是搜索引擎的痕迹,可以通过查看服务器里的日志里

3、是否有该URL,同时还能查看一些列属性。百度蜘蛛:可根据服务器的负载能力调价访问密度,降低服务器的压力,但百度蜘蛛通常会抓取同样的页面,导致其他页面无法被抓取而不能被收录,一般通过robots协议来避免Baiduspider+(+http:/ China;http:/ 爬行策略深度优先爬行:沿着一条线抓取下去,知道最后,然后返回到另一条线广度优先爬行:在一个页面发现多个链接后,把所有第一层的链接抓取一遍,然后再沿着第二层、第三层2.1.3 预处理也即对抓取回来的数据进行一个索引工作,其中包括多个流程,在后台提前完成。2.1.3.1 关键词提取将HTML、JS、CSS等标签&程序去除,提取用于排

4、名的有效文字。2.1.3.2去除停用词即反复出现的无用词,如:“得、的、地、啊、阿、再”等2.1.3.3分词技术是中文搜索引擎特有的技术支持,中文不同于英文单词与单词之间用空格分隔,因此搜索引擎必须把整个句子切割成小单元词,分词的方法有两种基于字符串匹配的分词方法按照方向的不同,可以分为正向匹配、逆向匹配和最少切词,混合使用后产生正向最大匹配,逆向最大匹配、正向最小匹配、逆向最小匹配。笔者个人理解为按照中文的习惯对整句进行组词形式的拆分。基于统计分词方法 直接调用分词词典中的若干词进行匹配,同时也使用统计技术来识别一些新的词语,将所有的统计结果匹配起来发挥切词的最高效率。2.1.3.4消除噪声

5、消除网页上各种广告文字、图片、登录框、版权信息等对搜索引擎无用的东西。2.1.3.5分析网页建立倒排文件!Upload 索引.jpg failed. Please try again.正向索引:把页面转换为一个关键词组合,同时记录每一个关键词在页面上的出现频率、出现次数、格式、位置,使每一个页面都可以记录为一串关键词组合,其中每个关键词的词频、格式、位置等权重信息也都记录在案。倒排索引:正向索引不可以直接用于排名,倒排索引以关键词为索引2.1.3.6 链接关系计算计算出页面上有哪些链接指向哪些其他页面,每个页面有哪些导入链接,链接使用了什么锚文本等,Google推出的PR是代表之一。2.1.3

6、.7 特殊文件处理对flash、视频、PPT、XLS、图片等非文字内容不能执行脚本和程序。图片一般使用标签2.2 服务输出输出结果的展现方式,如:与搜索关键词匹配的部分用红色字体标出3. 网站分类目录是人为编辑的搜索结果,将互联网上优秀的网站收集整理在一起,按照不同的分类或者主题放在相应的目录中,多靠人为提交,如:hao123网址导航4. 关键词一般指用户在搜索框中自定义输入的信息,按照概念可以分为:目标关键词、长尾关键词、相关关键词;按页面上分,可以为首页、栏目页、内容页关键词;按目的来分可以分为直接性、营销性关键词5. 权重和PR值(PageRank)PR值是谷歌搜索引擎用来衡量网页重要性

7、的一种方法,也是其判断一个网站好坏的重要标准之一,最大的影响因素为是否拥有大量的高质量外链。网站权重是指网站与网站在搜索引擎眼中的分级制“待遇”表现,是搜索引擎中的一个综合表现指标,决定因素有:外部链接的导入、稳定的高质量内容和结构清晰的网站结构等。要注意区分这是两个不同的概念6. 白帽SEO和黑帽SEO7. 锚文本、外链、内链、单向链接、双向链接、导出链接、导入链接8. 有机列表是SERP中的免费列表,即搜索结果页面的免费列表,可以通过制定SEO策略进行优化。9. robots.txt文件Robots Exclusion Protocol,网站通过Robots协议告诉搜索引擎哪些页面可以抓取

8、,哪些页面不能抓取。多用来避免出现大量404页面、死链接如何查看?格式:在浏览器中输入URL/robots.txt即可,下面是!Uploading d62a6059252dd42a8d159f41013b5bb5c9eab838_722675.jpg . . BaiduspiderDisallow: /User-agent: baiduspiderDisallow: /User agent 指浏览器robots文件常通过组合的方式来运用,主要有如下四种情况User-agent: *Disallow:/ 禁止抓取所有页面User-agent: *Disallow:/ 允许抓所有页面User-a

9、gent: BadBot Disallow:/ 禁止某个搜索引擎的访问User-agent: Baiduspider.Disallow:User-agent:Disallow 允许百度抓取,而不允许其他抓取10. nofollow决定是否对网站进行投票,传递权重,可以用来防止垃圾链接可以出现在网页级元标记中,用于指示搜索引擎不要抓取网页上的任何可以出现在链接前,指示蜘蛛不要抓取某特定链接 signin11. 黑链只存在于源代码中的超链接12.动态网址和静态网址13.搜索跳出率用户查到一个网站并点击进入,且只浏览了一个页面就离开所占的比例14. 网页快照搜索引擎在收录网页时,对网页进行备份,存在

10、自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。15. 了解网站常见HTTP状态码16. SEO常见指令site:+URL 用于查询特定网站的收录情况“Link:+URL” 查外链“related:+URL” 查询相关网页指令,找到与你的网站内容相关的网站“info:+URL” 查询某个特定网站的收录信息、最近的快照情况、相似网页、站点链接、内部链接及包含域名的链接,是一个综合指令,只支持Google。allintext/intext:有效的查询某个特定关键词在特定网页文档上出现情况,发现最相关的网页

11、和潜在链接对象,只支持Google。“allinurl/inurl:”查找特定网页url中包含特定url关键词,可以和其他指令组合使用,只支持Google。“allintitle/intitle:”查找特定网页标题中和所输入的信息相同的文字,查找竞争对手,intitle可以用来查询特定论文或者文章标题中出现特定的关键词,只支持Google。allinanchor/inanchor: 查找特定关键词的锚文本链接,只支持Google。“define:” 查找特定的关键词“filetyle:” 搜索特定后缀的文件,如pdf、doc等“domain:”查询网站的百度相关域,即百度外链,只用于百度搜索引

12、擎,在谷歌中相当于一个关键词17. 网站地图又称站点地图,它就是一个页面,上面放置了网站上需要搜索引擎抓取的所有页面的链接(注:不是所有页面),大多数人在网站上找不到自己所需要的信息时,可能会将网站地图作为一种补救措施。18. 网站目录结构网站目录结构网 站的目录是指你建立网站时所创建的目录,目录结构则主要是指物理结构和逻辑结构这两种。当网站涉及到多个尤其是成千上万页面时,往往就需要有个清晰的网站 结构,来确保搜索引擎和用户的访问,网站的目录结构就起到这样的作用,它在SEO中意义非凡。网站的目录层级一般建议不要超过3层。19. 301重定向页 面永久性移走(301重定向)是一种非常重要的“自动

13、转向”技术。网址重定向最为可行的一种办法。当用户或搜索引擎向网站服务器发出浏览请求时,服务器返 回的HTTP数据流中头信息(header)中的状态码的一种,表示本网页永久性转移到另一个地址。在更换网站域名时使用,常用于传递权重。20. 长尾关键词“长尾”具有两个特点:细和长。细,说明长尾是份额很少的市场,在以前这是不被重视的市场;长,说明这些市场虽小,但数量众多。众多的微小市场累积起来就会占据市场中可观的份额这就是长尾的思想。21. 全站链接-所有链接都指向首页;首页链接-只有网站首页有指向你的网站链接,在链接互换、购买时会做首页链接22. 反向链接反向链接其实就是在目标文档内部进行声明。换言之,常规链接在文档A中标明“指向文档B”,而反向链接则在文档B中要求“使文档A指向我”。23. 伪静态2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号