《seo实战密码》第4章、 网站结构优化(整理笔记)

上传人:kms****20 文档编号:40437024 上传时间:2018-05-26 格式:DOC 页数:15 大小:41.50KB
返回 下载 相关 举报
《seo实战密码》第4章、 网站结构优化(整理笔记)_第1页
第1页 / 共15页
《seo实战密码》第4章、 网站结构优化(整理笔记)_第2页
第2页 / 共15页
《seo实战密码》第4章、 网站结构优化(整理笔记)_第3页
第3页 / 共15页
《seo实战密码》第4章、 网站结构优化(整理笔记)_第4页
第4页 / 共15页
《seo实战密码》第4章、 网站结构优化(整理笔记)_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《《seo实战密码》第4章、 网站结构优化(整理笔记)》由会员分享,可在线阅读,更多相关《《seo实战密码》第4章、 网站结构优化(整理笔记)(15页珍藏版)》请在金锄头文库上搜索。

1、SEOSEO 实战密码实战密码第第 4 4 章、章、网站结构优化网站结构优化( (整理笔记整理笔记) )=第四章、网站结构优化=通过链接将权重倾向重要页面;锚文字是排名算法中重要部分(学习维基百科)-搜索引擎友好的网站设计-1.蜘蛛找页面:外部链接到首页,沿着内链遍历网站,页面离首页不要太远2.能抓取页面内容:数据库动态生成、多参 URL、SessionID、flash 页面、frame 框架、可以转向、大量复制内容。对于不想收录的不要有链接到该文件还可以用 robots 文件或 metarobots 标签禁止3.提炼页面内容:关键词合理分布、重要标签撰写、兼容、html 代码精简-避免蜘蛛陷

2、阱-:首页做成 flash 或放 flash 动画片头(flashIntro) ,html 中只有个链向 flash 文件的链接(可用 SWFObject 或sIFR 技术使 flash 更易于搜索)ID:每次用户访问会在 URL 中加不同的 sessionID,蜘蛛来也会生成,这将会使内容一样却多次被爬,影响网站优化。最好用 cookies 不要生成 sessionID,或判断是普通用户还是蜘蛛3.各种跳转:访问首页自动跳到某个目录下的页面,首页转向无目的原因,最好避免。若网址更改转向使用 301,可以把页面权重转移。302 跳转、javascript 跳转、flash 跳转、metaref

3、resh 跳转都不建议4.框架结构:蜘蛛访问时 html 中只包含调用其他 html 的代码,不包含文字信息,而且其他 html 文件不是完整页面,无导航只有文字5.动态 url:有数据库驱动的网站:有问号、等号和参数链接:虽然搜索引擎在尝试解析 JS 脚本但仍不建议,可用 css 做导航系统。但也有特殊用途:没有排名意义,重复内容的页面可以用js 脚本阻止爬行。7.要求登录:用户登录才能看到的,搜索引擎无法看到,蜘蛛不会注册、登录8.强制使用 cookies:网站若强制使用 cookies,而用户浏览器没有启用 cookies,则会页面显示不正常。蜘蛛=强制禁用 cookies 的浏览器,会

4、无法正常访问-网站结构-1.物理结构:真实的网站目录及文件位置扁平式:适合小型网站(根目录文件权重深层目录文件) ;树形/金字塔形:2.链接结构:对搜索引擎比物理结构重要。收录难易看页面处于链接位置与首页点击距离而不是目录层次,若在首页有链接,则就是仅次首页的二级页面注意:1.文字导航:用 css 实现,不要 javascript、flash、图片做导航2.锚文本关键字:导航中链接是分类页面获得内部链接的最主要来源,量大其对目标页面的相关性相当大影响。分类名称尽量使用目标关键词3.面包屑导航:强烈建议使用4.页脚堆积:页脚堆积富含关键词的分类页面链接会带来惩罚-子域名和目录-1.搜索引擎会将子

5、域名当做独立站点,其与主域名是两个完全不同的站点。相比目录来说,搜索引擎会将子域名 url 当做首页,主域名会传递一定的信任度给子域名,权重排名会比目录高点。但在推广时是要将优化工作全做一遍(外部链接建设、网站 PR 值和权重会被分散,是网站变小,目录会使网站变大) 。2.子域名适用于:大型门户网站、跨国公司、公司多种非同类产品、不同地域分类信息网站3.若搜索引擎为百度,用子域名或独立域名有利,因百度给首页权重高;google 给予首页、目录和内页的机会大致相同-禁止收录机制-不希望被收录的页面:付费内容、测试阶段页面、复制内容页面无法保证一定不被收录:不出现链接、javascript、fla

6、sh、nofollow 不能保证保证不被收录:robots 文件、meta robots 标签文件:放在网站分目录下,无论是否有禁止抓取都要有 robots 文件,防止服务器设置问题带来一些错误。robots 文件格式:域:可选空格域值可选空格禁止所有搜索引擎抓取任何内容:User-agent:*/用来指定适用于哪个蜘蛛(Baiduspider、Googlebot)Disallow:/阻止蜘蛛抓取某些文件或目录,必须分开写,每个一行Disallow:/tmp/Allow:/tmp/cd/不允许 tmp 下其他内容,但允许抓取 cd 目录下内容-Sitemaps-:网站地图位置robots 文件

7、中的搜索引擎不会访问,不抓取,但若有导入链接指向,也会出现在搜索结果中,其在搜索结果中显示的格式:1)google 处理:只显示 URL,无标题、描述2)百度处理:导入链接的锚文字显示为标题和描述3)显示开放目录或雅虎收录的标题和描述http:/192.186.23.236 http:/192.186.23.237 http:/192.186.23.238 http:/192.186.23.239 http:/192.186.23.240 http:/192.186.23.241 http:/192.186.23.242 http:/192.186.23.243 robots 标签(用于页面)

8、:禁止索引该页面,是 head 中 meta 标签的一种,可以写在一起,逗号分隔/不会索引但会抓取,页面 url 不会出现在搜索页面中NOINDEX:禁止索引本页面NOFOLLOW:禁止跟踪本页中链接NOSNIPPET:禁止在搜索结果中显示说明文字NOACHIVE:禁止显示快照NOODP:禁止使用开放目录中标题和说明Google、Bing、雅虎以上都支持,百度只支持 NOFOLLOW 和NOACHIVE(适用本链接):百度、雅虎、Bing 都支持锚文本用途:1)垃圾链接(博客评论、论坛帖子、社会化网站、留言板中留下的链接) ,会在评论中自动加上 nofollow2)广告链接:广告目的是流量,而

9、不是 PR 值或搜索排名,所以加入防止传递链接权重3)控制内部链接权重和 PR 流动分布:在联系我们、隐私权政策、用户条款、用户登录等用户很少关注的页面4)电子商务网站:产品列表的各种排序方式、显示格式2008 年 google 改变算法,若有 10 个链接有 10 个权重和 PR 值可以传递,在 5 个加 nofollow 链接后,以前可以每个传递 2 份,现在只能传递 1 份,浪费了 PR 和权重。其他搜索引擎如何处理尚不知。-URL 静态化-原因:1)陷入无限循环:网站中万年历2)收录大量重复内容:动态 URl,参数顺序不同就是不同网址,单页面内容一样方法:http:/192.186.2

10、3.244 http:/192.186.23.245 http:/192.186.23.246 http:/192.186.23.247 http:/192.186.23.248 http:/192.186.23.249 http:/192.186.23.250 http:/192.186.23.251 http:/192.186.23.252 http:/192.186.23.253 http:/192.186.23.254 http:/204.74.210.17 http:/204.74.210.18服务器 URL 的重写模块(伪静态化):LAMP 服务器中 mod_rewrite 模块中

11、.htaccess 文件或 Windows 服务器中 ISAPIRewrite 模块/?id=123=/products/123.htaccess 文件代码:RewriteRule/products/(0-9+) /?id=$1动态 URL 中 2-3 个参数对收录无影响,google 建议不要静态化,因为这样会影响蜘蛛理解-URL 设计-1)URL 短;2)避免太多参数;3)物理目录层次少;4)文件及目录名具有描述性;5)URL 中包含关键词,越靠近域名越好其次是目录;6)字母全小写(Linux 服务器区分大小写,混用会出现 404 错误;robots 文件代码也区分大小写) ;7)连词符使

12、用:用短横线而不是下划线,搜索引擎会将短横线当空格处理,下划线则被忽略;8)url 设置为目录形式还是文件形式:目录形式在网站更换编程语言时,url 不必变化,而文件形式的 url 在文件扩展名变化后需要做 url 重写。-网址规范化(10%-30%为不规范化网址)-1)首页带与否都为不同网址2)URL 静态化后,静态和动态 url 共存,都有链接,都可访问3)目录后帯与不带斜杠是不同网址4)加密网址:http 与 https5)URL 中有端口号与否6)跟踪代码:/?affid=100影响:1)分散权重,不利于排名2)搜索引擎认为的网址不是站长想要的网址3)不同版本网址会造成复制内容,被误判

13、为作弊解决方法:1)通常以 www.版本为规范化2)google 管理工具中设置首选域(不适用于其他搜索引擎)3)301 重定向将不规范的 url 转向规范的 url(有的因技术不能做301)4)使用 canonical 标签5)提交给搜索引擎的 xml 网站地图中全部使用规范化网址-301 转向-数据流头信息部分状态码的一种,表示网址永久性转到另一个地址2.其他转向方法:302 临时转向、javascript 转向、php/asp/CGI程序转向、metarefresh 等(被认为作弊行为)一切正常;404-页面不存在;302-临时性转向;500-内部程序错误会传递 301 转向的大部分权重

14、,反应时间为 1-3 个月;百度传递所有权重,但数据库中新旧 url 会存在很长时间,一年后仍会有新旧地址5.如何做 301 转向1)LAMP 主机:中用.htaccess 文件(用于密码保护、转向、错误处理,放在根目录下)做 301 转向1)redirect 301 或 redirect permanent/ /2)用 mod_rewrite 模块2)windows 主机:纯静态 html 页面无法做 301,可用 javascript或 metarefresh 转向;页面为 asp 或 php 可以做 301 转向。在控制面板中设定用途:1)解决网址规范化问题2)保护版权,公司有多个域名3)网站改版(页面删除、改变地址、url 命名系统改变)4)动态 url 静态化-Canonical 标签(规范化网址)-在 html 文件头部加代码=页面内 301 转向,区别是用户仍在原网址不

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号