当前位置:首页关注百度蜘蛛IP 近距离了解站点收录情况 举报文章

关注百度蜘蛛IP 近距离了解站点收录情况

作者:admin    来源:用户投稿    时间:2015.6.10   

  众所周知,百度蜘蛛,是百度搜索引擎的一个自动程序,它的作用是访问收集整理互联网上的网页、图片、视频 等内容,然后分门别类建立索引数据库, 使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。分析和了解百度蜘蛛你可以很直观的掌握自己站点收录情况,当你了解百度蜘蛛以及其对应蜘 蛛IP的含义后,你再也不必要在不知情的情况因为站点迟迟不为百度收录而烦恼,也不会因为百度短暂的快照不更新而放弃原本一颗坚持建站的心,那么剩下的就 只有肯勤奋的付出,坚持原创,坚持外链,站点可观的收录和理想的排名将成为水到渠成的事,这一切只因为你深刻了解百度蜘蛛。

  那么我们通过什么方式去了解一个个搜索引擎的蜘蛛程序呢?

  其实很简单,每一个蜘蛛程序就犹如一个用户,他对任意站点的访问,都尤其访问的轨迹,linux主机下我们完全可以透过网站主机日志文件去观察和分 析各大搜索引擎的蜘蛛来访情况,并根据来访Ip去分析和判断当前站点具体收录情况,了解和分析站点目前所存在的问题,诸如:URL是否符合蛛蛛抓爬习 惯,robots.txt文件是否设置合理,网站结构是否合理等。本文主要以百度蜘蛛作为分析和介绍对象,从而帮助站长能更好的针对自己的站点进行SEO优化和推广。

  首先,我们先来看看一下具体的日志截图(该截图来源于本博客网站)

  

untitled


  百度蜘蛛IP分析

  透过以上截图可以得知百度蜘蛛来访时以Baiduspider名称显现,并且来访IP存在多个,那么多的百度蜘蛛IP到底分别是代表啥呢?

  在百度站长平台《百度spider介绍》一文中已有相应的解释、并且清楚的说明百度不同的产品使用不同的user-agent

QQ截图20131207094137

  本人在此也不具体分解,有了解必要的朋友可以去参看原文,原文地址:http://zhanzhang.baidu.com/wiki/161

  今天想给大家介绍的主要是百度蜘蛛IP、从本博客的站点日志截图可看出,Baiduspider是多个IP来访的,那么具体分

  为哪几类蜘蛛、具体有代表啥意义呢?

  一、代表性沙盒蜘蛛IP:

  123.125.68.* 这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。

  220.181.68.* 每天这个IP 段只增不减很有可能进沙盒或K站。

  二、代表性正常蜘蛛IP:

  220.181.7.*、123.125.66.* 代表百度蜘蛛IP造访,准备抓取你东西。

  121.14.89.* 这个ip段作为度过新站考察期。

  203.208.60.* 这个ip段出现在新站及站点有不正常现象后。

  210.72.225.* 这个ip段不间断巡逻各站

  125.90.88.* 广东茂名市电信也属于百度蜘蛛IP 主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合

  检测造成的。

  220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,基本来说你的网站会天天隔夜快照,绝对

  错不了的,我保证。

  220.181.108.92 同上98%抓取首页,可能还会抓取其他 (不是指内页)220.181段属于权重IP段此段爬过的文章或首页

  基本24小时放出来。

  123.125.71.106 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.91属于综合的,主要抓取首页和内页或其他,属于权重IP 段,爬过的文章或首页基本24小时放出来。

  220.181.108.75重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP 段,爬过的文章或首页基本24

  小时放出来。

  220.181.108.86专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  123.125.71.95 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  123.125.71.97 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.89专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.94专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.97专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.80专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.77 专用抓首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  123.125.71.117 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.83专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  注:以上IP尾数还有很多,但段位一样的123.125.71.*段IP 代表抓取内页收录的权重比较低.可能由于你采集文章或拼

  文章暂时被收录但不放出来.(意思也就是说待定)。

  220.181.108.*段IP主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照

  在了解蜘蛛IP对应的作用和含义后,我们如何判断百度到底有无收录或抓取站点内容呢?大家可以根据每一行日志后

  抓取返回的状态响应码去分析:

  1、成功抓取 返回代码是 200 0 0;

  2、网站没更新 返回代码是304 0 0;

  3、蜘蛛来过 返回的是200 0 64

  本文由《点滴互动》SEO优化 栏目整理提供,转载须注明出处,谢谢!

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:近距离  关注  百度  蜘蛛  距离  离了  了解  站点  点收  收录  
  • 相关搜索
图片推荐
    江湖微装修系统_装修O2O系统行业的新霸主!

    江湖微装修系统_装修O2O系统行业的新霸主!

    颠覆时代有多可怕,你知道吗?  马云说:我刚搞出淘宝网的时候,我告诉一位做皮具的老板,把你的生意放到网上来做吧。他说:我先看看。几年前我再次告诉他同样的话。他说:有时间再说吧。两年前他找我说:我的生意
    56网创始人周娟:优势互补是并购的最佳动力

    56网创始人周娟:优势互补是并购的最佳动力

    图为56网创始人周娟  被收购两年来,56如何一边深度整合,一边保持独立发展?  文 | 翟文婷  前不久,百度旗下的爱奇艺把视频客户端PPS收入囊中。这是继去年优酷土豆合并之后,视频网站的又一并购案
    70路小报:四个信号说明你的创业公司需要转型了

    70路小报:四个信号说明你的创业公司需要转型了

    [导读]创业者需要一个重要的能力即愿意改变商业模式或者产品形态。大部分成功的创业公司都经历过一个转型的过程,虽然这些都是听上去简单,但要掌握转型的信号,需要注意四点。    腾讯科技 Lois 1月1
    百度排名优化7天上首页是怎么做到的?

    百度排名优化7天上首页是怎么做到的?

    百度排名优化7天上首页1-3名,淘宝交易,排名上来才发货,上来后按天或按月付费,看了后是不是很诱惑人?这纠结是不是真的呢,当然是真的,淘宝交易还有啥担心的,再说了是排名上来了才收费的,所以你不需要担心
    数据营销,未来营销的发展趋势

    数据营销,未来营销的发展趋势

    互联网PC端时代的疲软,导致移动互联网、智能设备软硬件功能的不断完善,从而用户的使用习惯也发生不断的变化,其行为模式从传统的PC端逐渐演变成PC+移动端的并行模式,跨屏时代正式到来。因此数据营销的作用
    你的营销型网站建设输在起跑线上了吗?

    你的营销型网站建设输在起跑线上了吗?

    我们所开展的一切关于营销型网站建设的工作都是以营销为目的,最终面向的对象就是用户。我们都知道,绝大部分的用户都是通过搜索引擎来获取他们想要的信息,这一种习惯似乎已经变成了一种定律。在我国的教育史上很流
    高一度网络:SEO优化行业的就业前景好不好

    高一度网络:SEO优化行业的就业前景好不好

    贵州罗蒙了解现在已然是互联网信息飞速发展的信息化大时代,越来越多的人看到了这个行业未来的发展前景,所以很多的年轻人选择去学习计算机应用领域的相关专业,为了日后谋求一个有发展前途的工作,成为核心技术人才
    百度取消显示快照时间,瓜分了谁的蛋糕?

    百度取消显示快照时间,瓜分了谁的蛋糕?

    百度的一举一动,都会触动站长敏感的神经,在3月5日晚百度悄然取消掉了快照日期的显示。 今日不少站长反应:快照时间不显示,链接都不好交换了,不过换句话来说,百度其实早在之前就给这样一个解释:快照时间不会
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面