当前位置:首页站点流量异常原因之运维篇 举报文章

站点流量异常原因之运维篇

作者:admin    来源:用户投稿    时间:2015.6.26   

  1、CDN

  一些网站会使用CDN加速服务,最近每周站长平台都会接到一两个跟CDN加速问题有关的案例。CDN这里存在一个问题:不同的CDN服务商在全国分布的节点数不同,站点在使用CDN服务时,同一地区CDN给蜘蛛返回的IP地址要和给用户的一致。那么现实情况是,部分CDN服务商出于成本考虑与资源使用率的问题,会在不告知用户的情况下变更IP地址以节约成本,这样就导致蜘蛛在去抓的时候,会遇到新IP和老IP的问题,在站点没有告知更换IP的情况下,蜘蛛会认为站点目前存在问题,首先是减少抓取量,其次会判断是否把不可访问的页面下掉,这时候就出现了用户访问IP与蜘蛛抓取IP不一致的情况。所以建议站点在选择CDN服务时要选择稳定的CDN服务商,其次如果IP更换最好通过站长平台抓取诊断工具抓取测试,如果IP不正确可以点击下图红框“报错”提示给站长平台

  2、Robots

  站长应该对robots都不陌生,但为什么还要提呢?有这样一种情况:站点需要更新robots文件,对站内部分内容禁止或放开抓取。但由于操作后没有检查是否生效,站长会默认为已经生效。同时还有一个生效周期的问题,那么站点需要在百度站长平台提供的robots检测工具中做一个抓取测试来验证是否生效。

  如果看到robots内容和你更改后的内容不一致,有几种可能:第一种可能是网站没有全面布局,因为有的站点服务器可能在很多地方,你需要确认robots是否已全部推送;第二种可能是百度没有及时做更新,可以通过robots检测工具下方的更新按钮来告诉百度Robots有变化。

  3、UA/IP

  UA封禁一般不会是站点主观错误操作,往往是意外情况,站点在程序中过滤误操作UA封禁,而通常却不知道自己封禁了蜘蛛。只有在逐步的排查才会发现这种概率很小的问题。所以在流量异常中我们在运维篇中把这项列进去,让站点注意这些个细节。

  那么当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。禁止所有来自百度的抓取: User-agent: Baiduspider Disallow: /

  IP封禁往往是遇到CC攻击的时候不知道哪些是真百度蜘蛛和仿冒百度蜘蛛而封禁了蜘蛛IP,这里我们建议通过DNS反查方式让站点了解哪些是真实蜘蛛,根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

  A、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  B、在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  C、在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  更多内容请访问:http://zhanzhang.baidu.com/college/articleinfo?id=34

  4、安全/管理不善

  安全问题在站长平台能观察到的绝大多数属于管理问题,站点被黑客钻了漏洞而受到了惩罚等,且惩罚力度与站点漏洞的存在时间成正比。

  A、域名泛解析

  近几个月域名泛解析是一个非常经典的案例,很多网站由于安全意识薄弱、密码简单被黑客钻了空子,解析出了大量非本站内容的低质页面,导致百度搜索引擎对整站采取了临时措施,使得站点流量掉了很多甚至清零。

  B、网站被黑

  网站被黑跟泛解析也有相似之处,网站内有大量的垃圾页面都是黑客创造出来的,导致受到惩罚,给站点带来致命的打击。

  C、网页被挂马

  其实这也是被黑的一种,但比被黑释放垃圾页面更为隐蔽,这类案例主要出现在企业网站或者是一些比较小的网站上,黑客直接在页面上放置展现广告代码,而且会判断来访者是普通用户还是蜘蛛,然后区别对待;或者是仅给某一个地区的用户访问挂马页面,给蜘蛛和其他大部分所在地展现正常页面等,这些其实都是非常隐蔽的行为,没有用户举报站点也很难发现,但百度搜索引擎无法容忍这样的页面出现在搜索结果里,自然这些站点会受到惩罚。

  D、UGC站点被SPAMMER群发

  最后说UGC站点,所有以用户贡献内容的站点在审核机制上一定要加强防范,目前平台能够接到的不少案例都是UGC站点存在监管不利,导致有大量的垃圾内容在线上,当垃圾内容与正常内容的比例达到一定阈值,就有可能整站被百度搜索引擎惩罚。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:站点  流量  异常  原因  
  • 相关搜索
图片推荐
    全国多地网友遭亚马逊单方面取消订单

    全国多地网友遭亚马逊单方面取消订单

    双十一即将到来,相信不少网友都备足弹药准备投入血拼,然而,对于一些商家给出的不合常理的超低价建议需格外提防全球知名电子商务网站亚马逊就因以超低价吸引消费者但无法兑现而被推到了风口浪尖。近日,成都市民李
    机顶盒是家电里待机耗电最多的电器?

    机顶盒是家电里待机耗电最多的电器?

    在我们使用电器的时候,按下遥控器的待机键,电器即进入等待开机的状态,即为待机模式。有的电器虽然没有待机按钮,可如果没有切断电源,也相当于是在待机状态。在日常使用的众多电器中,机顶盒算是一个很不起眼的小
    大学生卧底2个多月 揭开淘宝卖家花钱刷单内幕

    大学生卧底2个多月 揭开淘宝卖家花钱刷单内幕

    图为:张严(化名)刷单后,于2月9日收到一个空包裹  到淘宝网上购物,很多人喜欢看卖家的成交量和买家评论。但是,如果这些成交量和好评不真实,那买家就可能被欺骗。  3个月前,家住武汉的大学生张严(化名
    《病毒式营销的载体——免费营销》

    《病毒式营销的载体——免费营销》

    互联网的最初阶段其实是一个免费性的网上冲浪接口,是并不包含任何商业性目的的,现在的很多人上网,其实也都是隐含着这种意识,那就是:互联网就是免费的。在互联网发展过一段时间后,自然而然的就有些人能够在上面
    怎样把公司卖个好价钱?人脉有时比产品更重要

    怎样把公司卖个好价钱?人脉有时比产品更重要

    移动互联网行业的并购近来层出不穷。一些创业公司以高价嫁入豪门的同时,一些拥有不错产品的新创公司,最终却关门大吉。为何这些公司的命运截然不同?据美国新闻网站BusinessInsider分析,对于希望被
    近期百度数据大幅度更新:收录和反链猛增

    近期百度数据大幅度更新:收录和反链猛增

    百度近期数据可以说一直在进行着更新,从未断过。而据了解就在12.3号,大批网站收录和反链暴涨,波及范围非常广,这肯定不是网站自身的变化,明显百度又抽了,笔者随机查看了3个站,个个命中,如下图:    
    马云:创业的机会就在有人抱怨的地方

    马云:创业的机会就在有人抱怨的地方

    马云在首尔大学演讲时,详细阐述了当今创业的机会点、如何成为一个伟大的公司。创造就业,帮助贫穷地区富起来,改变中国的环境。这是三项抱怨,也是三个机遇,任何人能解决这些问题,便可以长久活下来。在创业邦看来
    陈欧“清嗓”回归 能否重振“腹背受敌”的聚美优品?

    陈欧“清嗓”回归 能否重振“腹背受敌”的聚美优品?

    聚美优品从诞生之初就和假字一直纠缠在一起卖假货、做假账、假背景近日,继3家美国律师事务所宣布对聚美优品财务作假进行调查之后,又有两家律师事务所向聚美发起了攻击。股价连续下跌四个月后,聚美优品市值已经缩
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面