当前位置:首页百度站长平台:巧用robots避免蜘蛛黑洞 举报文章

百度站长平台:巧用robots避免蜘蛛黑洞

作者:admin    来源:用户投稿    时间:2015.6.24   

 

  对于百度搜索引擎来说,蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多,及内容雷同但具体参数不同的动态URL ,就像一个无限循环的“黑洞”将spider困住,Baiduspider浪费了大量资源抓取的却是无效网页。

  比如很多网站都有筛选功能,通过筛选功能产生的网页经常会被搜索引擎大量抓取,而这其中很大一部分检索价值不高,如“500-1000之间价格的租房”,首先网站(包括现实中)上基本没有相关资源,其次站内用户和搜索引擎用户都没有这种检索习惯。这种网页被搜索引擎大量抓取,只能是占用网站宝贵的抓取配额。那么该如何避免这种情况呢?

  我们以北京某团购网站为例,看看该网站是如何利用robots巧妙避免这种蜘蛛黑洞的:

  对于普通的筛选结果页,该网站选择使用静态链接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun

  同样是条件筛选结果页,当用户选择不同排序条件后,会生成带有不同参数的动态链接,而且即使是同一种排序条件(如:都是按销量降序排列),生成的参数也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

  http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

  对于该团购网来说,只让搜索引擎抓取筛选结果页就可以了,而各种带参数的结果排序页面则通过robots规则拒绝提供给搜索引擎。

  robots.txt的文件用法中有这样一条规则:Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。该网站恰是通过这种方式,对Baiduspider优先展示高质量页面、屏蔽了低质量页面,为Baiduspider提供了更友好的网站结构,避免了黑洞的形成。

  相关内容讨论请移步【学院同学汇】《巧用robots避免蜘蛛黑洞》讨论帖

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:百度  站长  平台  避免  蜘蛛  黑洞  
  • 相关搜索
图片推荐
    小败局:一个快速销售平台创业失败案例

    小败局:一个快速销售平台创业失败案例

    原标题:【小败局】MD,我创业失败了!  终于还是要说,MD,我创业失败了。我觉得自己被掏空了,当我第一次大声地对我的联合创始人说时,我觉得我终于解脱出来。 其实我们都很清楚,几个月来,公司已经无法运
    24年来马云名片变化,返璞归真

    24年来马云名片变化,返璞归真

    对于我们大部分普通人来说,名片的意义可能就是一张小小的纸片。但对于那些顶级的富豪大佬们来说,名片是一种不可或缺的商业工具,在推杯换盏的顶级酒会,遇到合适的人,拿出一张名片,轻语一声:这是我的名片,就可
    改善三个细节 打造完美的软件下载站

    改善三个细节 打造完美的软件下载站

    随着互联网时代的不断发展,越来越多人开始利用网站来赚取互联网市场的一杯羹。网赚方式多种多样,如常见的广告点击收取费用,网上销售产品等等。其中,软件引导下载也是一个热门的网赚方式,因此越来越多软件下载站
    AB3三足鼎立 谁才是最赚钱的广告联盟

    AB3三足鼎立 谁才是最赚钱的广告联盟

    在北京北苑媒体村的一间三居室内,圈内某知名电影网站的全部人员正在议论着着新入局的广告联盟,360好搜广告联盟。相比于AB(国内某两大广告联盟),360好搜广告联盟的额定收益会更高一些,并且由于广告定位
    匹凸匹连续两年亏损 A股首家P2P公司变身ST股票

    匹凸匹连续两年亏损 A股首家P2P公司变身ST股票

    虽然两次推迟年报发布日期,但互联网金融概念第一股匹凸匹(600969)仍难逃ST的厄运。    3月27日晚间,匹凸匹连发17份公告交出了自己去年巨亏4.6亿元的成绩单,这已经是连续第二年亏损。匹凸匹
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面