当前位置:首页网站改版带来的404抓取错误解决实践 举报文章

网站改版带来的404抓取错误解决实践

作者:admin    来源:用户投稿    时间:2015.6.10   

  网站建设中一项重要的工作就是改版,每次改版肯定是往好的方面进行,因为每个阶段的定位不同,我们要网站所表现的企业形象也不同,而且一个好看大气的网站绝对能够在潜在客户心里提升我们公司的地位。但是多数的改版对于我们网站的SEO都会造成一定的影响,这里就需要我们对网站的情况掌握的非常熟悉之后,然后进行有效地控制,减少改版造成的404页面过多情况。

  最近有一个新网站上线,因为是一年多的域名,之前网站和新站内容完全不同,网站结构也做了很大的调整,所以带来了很多的404错误抓取页面,当时并没有特别注意这个问题,后来持续更新了2个星期左右,发现快照都没有更新,发了一些简单的外链也没有作用,这个问题就引起了我的注意。下面具体的跟大家分析下自己的一些思路:

  1、利用日志分析工具找到404错误抓取页面

  日志分析工具利用最常用的光年日志分析工具就可以了,首先利用FTP下载好最近几天的网站LOG日志,当然,想更多的分析,那么多下载一段时间的LOG日志也可以,利用日志分析工具新建任务分析各个阶段的百度蜘蛛抓取情况,这里主要考虑百度抓取情况,因为建立这个分析工作的前提是快照停滞,收录为1。

  这里建议大家分为三个时间段来分析:

  A、分析最近一天的LOG日志,可以是今天的,但是最好是昨天的,因为昨天的会比较全,今天的你即使是晚上来分析也会有一部分时间没有统计到。

  B、分析改版之后的LOG日志,因为这涉及到百度蜘蛛对于网站改版的一些判断,例如我们可以分析百度蜘蛛什么时候开始判断网站已经改版,或者什么时候已经放弃对于旧站URL的抓取等等。

  C、改版前后抓取量的对比,分析改版对于百度蜘蛛的抓取量影响多大。

  至于日志分析工作后面的分析工作都是一键式的,具体的分析思路有了之后,我们对照着进行分析,就会找到很多平时我们没有注意到的问题,例如下面出来改版造成的404页面,还有不少的页面也是404错误,我并没有意识到,例如下面的wp-login.php页面就是一个最典型的例子:

  

404错误抓取页面

  404错误抓取页面

  2、利用百度站长工具中的死链提交工具进行死链提交

  百度站长平台LEE团队说:404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。当然,百度的说法只能作参考,因为分析网站日志发现,2个多星期百度蜘蛛还是来抓取这些错误页面,当然,百度对于404错误页面的指导性操作,还是非常有针对性的。

  

百度站长平台对404页面的看法

  百度站长平台对404页面的看法

  特别是死链提交工具中提交死链sitemap,这一条大家可以根据自身的情况进行死链提交,我这边提交后暂时还没有大的效果,因为大家都知道百度的效果展现周期一般都比较长。

  3、利用robots.txt和nofollow标签引导蜘蛛抓取

  404错误页面一个最大的坏处就是给蜘蛛带来一些错误的抓取,浪费了蜘蛛抓取资源,举个例子,首先我们要达成这样的一个共识:任何一个网站的蜘蛛抓取访问资源都是有限的,小网站自然要少很多,而大网站就要多很多,要想蜘蛛抓取率更高,抓取的更合理,那么一些错误的链接造成的404错误量就要尽可能的减少。

  所以我这里针对网站的这些资源的浪费进行了适当的引导,让蜘蛛抓取我想让他抓的一些页面,对于/wuchenshi/、/gaoxiao/等类似的栏目页面都进行robots限制抓取,对于网站中一些不参与排名的链接实行nofollow,引导蜘蛛抓取重要页面。下面看看蜘蛛6.3号抓取的情况,首先目录抓取中已经没有了网站中不存在的目录:

  

蜘蛛对目录的抓取情况

  蜘蛛对目录的抓取情况

  对于蜘蛛访问的404页面,就只剩下一个图片的404错误抓取:

  

改进后404错误抓取

  改进后404错误抓取

  目前还没有看快照更新和收录增加,当然,理论上这种操作应该会帮助网站更快的获得搜索引擎的认可,后面如果有恢复,会在文章中为大家做一个补充。

  本文由虚雨网络(http://www.xuziyu.com) SEO虚子雨发表,欢迎大家转载,转载时请注明出处,谢谢合作!

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:网站  改版  带来  带来的  来的  抓取  错误  误解  解决  实践  
  • 相关搜索
图片推荐
    浅析:网站优化之负面排名的因素有哪些

    浅析:网站优化之负面排名的因素有哪些

    每一位站长都希望自己的网站建成之后,能在几个月内冲到百度首页,然后开始赚钱,这是每一位站长的梦想,但是我们有这个目标后,我们也应该多了解一下,如何让一个网站能够健康发展,做到让蜘蛛喜欢,让用户喜欢,这
    古华京:六大做微商的误区

    古华京:六大做微商的误区

    同学们,近来,关于微商售假、微商传销、微商透支信任关系等评论此起彼伏,随着央视等媒体的连篇累牍的报道追踪,微商的负面形象在用户的心目中越积越深,对微商的误解也与日剧增。下面笔者就纠正一下对微商的误解都
    李开复:台湾创业环境需下重药医治

    李开复:台湾创业环境需下重药医治

    李开复:台湾创业环境需下重药医治  新浪科技讯 10月29日中午消息,据台湾《联合报》报道,创新工场CEO李开复近日表示,台湾的创业环境充满困难与危机,台湾创业者不能再以台湾小市场为目标,而是要放眼全
    百度策略对网页质量的压迫,命运堪忧的B2B该何去何从

    百度策略对网页质量的压迫,命运堪忧的B2B该何去何从

    五月将尽,在这个充满黑暗的五月份,百度发布了《百度网页搜索质量白皮书》,虽然白皮书还只是大纲,但已经让很多站长的小心脏承受不住,而且有不少站长因网站索引量大跌和网站权重被降而处于精神崩溃的边缘,尤其是
    只有坚持还不够 为什么你的网站上不了百度首页

    只有坚持还不够 为什么你的网站上不了百度首页

    想上百度首页吗?想,谁不想我也想!可是,有时候你觉得自己明明已经很努力了,每天坚持做的优化也很多,文章外链也发了很多,但是排名却一直上不去。这是为什么呢?其实想让百度排名上去,坚持固然重要,一些细节同
    帮黄瓜贴二维码 千米网杀入农产品市场

    帮黄瓜贴二维码 千米网杀入农产品市场

    3月3日消息,据获悉,国内电商系统及服务提供商千米网日前推出了以二维码为核心的农产品电商解决方案,借此杀入农产品电商市场。    据了解,该二维码可作为农产品的唯一标识,贯穿从生产、采购、流通到销售的
    全球互联网上十大访问量最大的网站

    全球互联网上十大访问量最大的网站

    1.Facebook.com - 8.367亿独立访问者:Facebook创始人兼CEO马克·扎克伯格(Mark Zuckerberg),在哈佛二年级的时候,发布了这一网站。起初这一网站仅向哈佛学生开
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面