360搜索-行业分析报告:2017年网页质量白皮书

上传人:豆浆 文档编号:50951379 上传时间:2018-08-11 格式:PPTX 页数:14 大小:175.88KB
返回 下载 相关 举报
360搜索-行业分析报告:2017年网页质量白皮书_第1页
第1页 / 共14页
360搜索-行业分析报告:2017年网页质量白皮书_第2页
第2页 / 共14页
360搜索-行业分析报告:2017年网页质量白皮书_第3页
第3页 / 共14页
360搜索-行业分析报告:2017年网页质量白皮书_第4页
第4页 / 共14页
360搜索-行业分析报告:2017年网页质量白皮书_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《360搜索-行业分析报告:2017年网页质量白皮书》由会员分享,可在线阅读,更多相关《360搜索-行业分析报告:2017年网页质量白皮书(14页珍藏版)》请在金锄头文库上搜索。

1、网页质量白皮 书目录Catalogue344451111111214前言网站价值判断标准1. 网站主题1.1 体现网站价值的主题1.2 符合法律法规及政策导向的原 则2. 网站的稳定与安全2.1 网站访问 的稳定性2.2 网站安全 网页质量评估维度 3. 内容质量3.1 不同类型网页的质量关注维度3.2 网页内容质量现状与收录的权 衡3.3 内容质量好的网页3.4 内容质量一般的网页3.5 内容质量差的网页3.6 作弊网页4. 用户体验4.1 广告对主体内容的干扰度4.2 内容整洁度5. 网页资 源可访问 性5.1 具有打开及获取权限的网页5.2 死链及失效页面 总结 与建议678899- 2

2、 -前 言在过去的一段时间,搜索引擎的策略保守且封闭。站长们 往往通过试错 的办法,试探 搜索引擎对网站、网页的质量判定标准,但这种尝试 可能只会取得短期的正向效果。而各 种针对 搜索引擎刻意作弊的手段,对用户不友好的行为也开始大量出现。网页质 量,是网页在设计 、版式、内容等维度上对用户需求是否满足的一个衡量标准。 基于搜索引擎生态及用户体验的大背景,360搜索制定了一套判断网页质 量的标准。在这个 标准框架下, 360搜索对高质量、 原创并且符合用户需求的网页内容, 会给予收录和排序的机 会。同时,对一些存在安全风险,针对 搜索引擎作弊,影响用户体验及需求满足的低质量 内容,在收录与排序上

3、进行控制!此次推出的360搜索网页质 量白皮书 (1.0版本) ,旨在公开360搜索在网页质 量方面 的判断标准,为站长们 提供建议指南,指导网站的内容建设,进而促进更多高质量原创内 容的产生, 构建良性的互联网内容生态。我们愿意与站长们 携手, 在满足搜索用户需求,为网 站带来流量的共赢基础上,共同为广大用户服务,让优质 网站更好更长远 地发展!360搜索网页质 量白皮 书- 3 -360搜索网页质 量白皮 书网站价值判断标准 网站主题1.1 体现网站价值的主题网站在建立伊始,一般都会确定后续的内容主题方向,比如图片站、企业站等。然后 再根据这个主题方向,扩充相关的内容。360搜索建议:网站

4、应紧 扣自身所在的行业领域及网站主题框架,产出符合用户需求 的优质内容,形成自己的特色,从而体现出自身的价值。我们非常不建议网站通过大规模 批量采集的方式,摘录其他网站的内容来扩充自己的网站,对于这一种情况,我们会视情 况降低其收录量和排序,甚至直接拒绝收录!但是,目前也存在着一个不可否认的现状:随着网站数量的增长,网站同质化问题越 来越严重,例如: 新闻资讯 站、小说站、商情站的数量非常多。一些内容在互联网中重复性 太高,可替代性很强。建议站长朋友们在选择 网站内容主题方向时,可以优先考虑小众, 并且可深入挖掘内容的门类 ,在内容上与其他网站形成差异化,做成更加精细化和专业 化的 网站!1.

5、2 符合法律法规及政策导向的原则网站的内容需和国家现行法律法规、政策导向、社会正向思潮保持一致。站长朋友们 应坚决避免网站中出现各类政治有害、诈骗、博彩、虚假、色情敏感及灰色产业 信息。涉 违法信息的网站会被主管部门问责 整改或处以行政、刑事处罚 ,违法类有害信息也是360搜 索坚决抵制的一种类型!网站的稳定与安全2.1 网站访问 的稳定性网站存在访问 异常,一般分为两种情况 :- 4 -类 型说 明访问 不稳定是指因设置问题 或故障,导致网站时而可访问,时而又无 法访问 的情况。域名失效 / 无法访问是指域名设置错误、停止解析、服务到期、故障等原因, 而导致网站无法访问 的状态。360搜索网

6、页质 量白皮 书360搜索会对 存在访问 异常的网站进 行处 理,具体来讲 : 如果网站经 常处 在访问 不稳 定的状态 (特别 是首页 都经 常无法打开的) ,360搜索会降低网站的收录量及排序; 如果域名停靠或者无法访问 ,我们将直接删除网站在360搜索中的收录 。因此,我们建议: 建站初期:在遴选域名及空间服务器时,选择 品质优 秀、服务稳定的产品,并建议配设相应的容灾机制和应急方案,避免因为服务故障导致网站访问 异常; 运营过 程中:不建议频 繁变更网站设置,特别是与网站访问 直接相关的服务器设置;做好网站可持续访问 的准备,提前做好域名、空间续费 等事宜,防止他人恶意抢注域名, 给您

7、造成损失;网站关闭:做好网站关停准备及数据处理,并及时通过站长平台申请删 除网站死链。 此外,我们在这里也建议各位站长,将360搜索的蜘蛛IP 添加到网站的访问 白名单中,保证360搜索能够 正常抓取网站的内容。2.2 网站安全网站不安全,用户在访问 网站过程中可能会遭遇中毒、受骗。 网站被黑,一般是网站对安全问题 不受重视,从而导致大规模被挂马和被篡改。在搜索引擎结果里,被黑的网站往往会有以下体现: 在搜索引擎中,网站标题 摘要被篡改成博彩、色情、违法信息,如下图所示:使用 site 语法,可发现 域名下出现大量垃圾子域名或垃圾网页; 通过搜索引擎的访问请 求,会被强制跳转到博彩、色情等非法

8、内容站点; 用户去点击这 些网站时,可能还会出现被某些安全软件提示报毒等。图1 网站被黑导致标题摘要被篡 改- 5 -360搜索网页质 量白皮 书图 2 访 问被 黑 站 点 时被 提 示 风 险360搜索对 于网站是否安全的态 度:对于网站内容优质 、访问 安全的网站,我们会优先考虑收录; 对于不安全网站,我们会采取降低排序的办法,或直接拒绝收录。建议网站完善风控机制,规范账号密码及信息管理的流程。及时备 份网站数据。防 范 潜在的挂马、被黑的风险 ,防止让他人有机可乘。保障网站的稳定运行!网页质 量评估维度网站是多个网页共同组成的集合。细化到单个网页的质量时,360搜索在一般会按以 下几个

9、维度进行综合衡量:内容质量; 用户体验; 网页资 源可访问 性。下面,我们向大家具体介绍这 些维度:内容质量在评价网页的内容质量时,360搜索首先会考虑这 个网页内容的优劣,以及对用户需 求是否可以被满足。3.1 不同类型网页的质量关注维度网页的形态不尽相同,针对 不同类型的页面,360搜索在质量上也会有不同的关注 维 度。我们在此举一些常见的例子,供大家参考:网站首页:标签 是否完善、清晰;网页中的内容及链接是否可访问 。 列表页、搜索结果页:内容与网页主题、搜索词是否有相关性,并且内容清晰,符合用- 6 -360搜索网页质 量白皮 书户的习惯 。文章页:是否提供完整、真实的内容,图文并茂更

10、佳。 新闻页 :具备新闻属性,对新近发生的事实有完整准确的报道,图文并茂更佳。 小说页 :能否提供清晰可阅读 的小说内容,无错章,章节之间连贯 ,更新及时。 文档页:用户是否可以正常阅读 ,是否有权限限制。 视频页 :是否清晰且能正常播放,是否有权限限制。 图片页:图片是否清晰且能浏览 ,有文字信息介绍该图 片中的内容更佳。 百科及问答知识页 :是否对某一事物、词语 、现象进行了准确的解释,或具有参考价值的答案。带有图片或参考资料说明更佳。以 U G C 为主要特征的网页(如:博客、自媒体、贴吧、社区帖子) :是否能产出独具自 身特色或观点的内容,内容完整丰富,具有一定的阅读 价值。商品页:是

11、否提供了完整真实的商品信息,是否提供了可成功购买 入口。如有产品评价 的内容会更好。分类信息页:是否提供了完整有效准确的信息(如黄页中的联系方式,地址,联系人, 公司,产品信息是否准确有效) ,并且没有过期。下载页 :是否提供了下载的入口,是否有下载权 限限制,下载的资源安全且真实。3.2 网页内容质量现状与收录的权衡根据2017年7月发布的第40次 中国互联网络发 展状况统计报 告:截止2017年月, 中国网站的总数已达 506 万个,半年增长率为 4.8% 。中国网民规模已达到 7.51亿 。目前,全网网页数量已接近万亿级别 。网页内容的质量情况大体分布如下:数据来自:360站长平台通过数

12、据我们可以知道:尽管网站、网页数量目前已经达到了一个惊人的数量级,但 优质内容仍然较为 稀缺。互联网中大部分内容都属于质量一般的内容,还有相当一部分内 容是属于内容质量差的。因此,基于网页资 源质量的实际 情况,从用户需求和内容索引择 优的原则出发,并非所有网页都会被360搜索收录。- 7 -360搜索网页质 量白皮 书3.3 内容质量好的网页一个内容质量好的网页,往往是网站投入了一定精力来制作的。具备原创属性。资源有 效、权威,能充分满足用户的需求,能彰显出网页及网站的价值。个别内容甚至是全网独 家拥有的稀缺资源。对于此类网页,360搜索会在一定程度上给予优先收录和排序的机会。我们列举了其中

13、 一小部分网页作为例子,供大家来感受一下:- 8 -3.4 内容质量一般的网页相较于内容质量好的网页,这种类型的网页往往可能不是网站自身原创的,也能在一 定程度上满足用户的需求,但本身网页中的内容可替代性较强。对于此类网页,360搜索 会综合其资源可替代性、需求满足程度、用户体验等维度考虑其是否收录及排序高低。示 例说 明case1政府网站一个权威且完整有效的通知。case2新闻网站的原创内容,倾注了精力运营的新闻报 道或专题 。case3医疗网站发布的内容丰富且权威的页面。 针对 感冒, 提供了问答、 文章、 症状、诊断和鉴别 等内容,可满足用户的需求。case4经过 网友用心编辑 ,内容丰

14、富的 UGC 内容。case5房产网站的一个丰富且内容有效的列表页。case6一个 IT 技术类 博客文章,内容完整且能解决专业 技术性问题 。case7购物网站一个包含商品信息、评价的完整页面。case8汽车网站提供的车系聚合信息页, 包含了汽车价格, 配置参数, 经销 商, 评价等全面且多样的信息。360搜索网页质 量白皮 书3.5 内容质量差的网页这种类型的网页,往往主体内容不完整,缺失有效信息,无法从实质 性上解决用户的需 求。请站长们 尤其需要注意:如果在一个网站中此类网页占比很大,不仅影响用户的体 验,也会影响到360搜索对这 个网站或网页的评价。提供一些 badcase 例子,供

15、站长们 参考:- 9 -3.6 作弊网页此类网页往往有作弊行为, 内容粗制滥造, 完全不能为用户提供任何帮助, 甚至还夹带 病 毒,没有任何价值。360搜索会依据实际 情况,做降低排序和直接拒绝收录的处理!在此,我们列举一部分例子,请各位站长知悉:示 例说 明case1网页主体内容缺失。case2交易、团购、活动结 束,商品下架,招聘失效等,不能满足用户当 前时效需求。case3问答类网页存在有问无答、回答无用、回答推广等特征。case4差标签页 、差搜索结果页,列表页的标题 和内容相关性差。case5视频页标题 文不对题 ,还带 有推广的性质。case6网页中的文字、链接、图片、视频 或必要

16、的下载链 接失效。case7论坛 水贴。case8通过新闻网站、博客等渠道发布的医疗推广内容,以及差医疗站点。case9网页或文章的标题 与内容相关性差,或者毫无关系。示 例说 明case1在正常文章的句子或段落之前穿插其他无关联的关键词 或锚文本。360搜索网页质 量白皮 书用户体验对于用户体验,我们主要从以下两个维度进行判定: 广告对主体内容的干扰度;- 10 -示 例说 明case2在网页或标题 中刻意的大量重复关键词 或锚文本,进行恶劣优化,提 高关键词 密度,从而欺骗搜索引擎。case3网页打开跳转到其他带有明显推广盈利性质的页面,如博彩、色情等, 或跳转到其他明显作弊特征的页面。case4把转载 的文章进行再加工,欺骗搜索引擎,让其认为这 是一片原创的 文章。case5页面有虚假电话 、虚假下载、钓鱼 网站等危害用户安全的行为。case6网站内容采集于其他网站,通常有规模大、范围广、板式差、不完整等特征,并可能兼有其他黑帽 SEO 或作弊行为,达到被搜索引擎收录的目的。case7网站将目录或频道页租售出去,或自行有意而为之。在全站或其中几个目录下,发布大量与网站主

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号