当前位置:首页从网站内因分析影响爬虫抓取 举报文章

从网站内因分析影响爬虫抓取

作者:admin    来源:用户投稿    时间:2015.6.11   

  一个网站只有爬虫抓取了,才能被收录、有快照、有排名。所以搜索引擎爬虫对网站的抓取情况直接决定了一个网站seo的成败。今天笔者就从网站内部本身来分析一下那些因素将影响到搜索引擎爬虫的爬取:

  1、网站速度影响爬虫访问

  机房—DNS服务器—CDN—出口带宽--硬件—操作系统—服务器软件—程序

  机房的位置:最好选择靠近爬虫的线路

  Dns服务器:热门、稳定(推荐dnspod)

  CDN:在做网站日志分析时候记得算进去

  出口带宽:避免与大流量的网站同机房

  硬件:在经济允许下使用配置高的

  操作系统:推荐linux,稳定安全

  程序:安全、效率高、符合w3c标准

  2、nofollow标签的使用控制爬虫抓取

  Nofollow是告诉搜索引擎不追踪不传递权重此链接。

  Nofollow掉每个页面重复出现的链接和对seo无价值的页面,减少爬虫重复抓取每个页面的多余链接,提高爬虫抓取率,增加对重要页面的抓取。

  使用方法 :rel=“nofollow”

  3、其他影响爬虫抓取的因素

  防火墙规则、防攻击设置、防采集规则设置。部分网站为了网站安全,在频频的多次访问后自动断开,可能造成爬虫被拒。

  硬盘转速:很多情况下有的朋友会分割服务器硬盘,分出来的盘做为其他测试之用。如此一来回造成硬盘转速慢,影响爬虫访问速度。

  文章由 @漳州建川网站建设 http://www.0596top.com/ 供稿, 转载请保留链接,分感谢!

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:网站  站内  内因  分析  影响  抓取  
  • 相关搜索
图片推荐
    细节决定SEO技术的优化成败

    细节决定SEO技术的优化成败

    SEO技术说起来容易,但是做起来是十分的难的,尤其是我们在使用特定的SEO技术的时候更是如此,比如说我们使用软文进行优化,这个优化的基础就是必须有大量的软文,而这些大量的软文到底是应当在哪里找到呢?当
    淘宝客的“云图”

    淘宝客的“云图”

    《云图》(Cloud Atlas)是一部佳作,自然值得一看,再看,三看;如同一本好书,细细品味,余香不绝;这部电影是从凌晨时分开始看,影片的长度超乎想像,画面的转换更是挑战思维极限。六个故事轮番叙述铺
    安东胜:创业成功之路,人品不好者难成大事

    安东胜:创业成功之路,人品不好者难成大事

    最近我一直在思考,为何如今的成功者中品行不好的卑鄙者鲜少有呢?当然,我们生活中卑鄙的人可不是少数,尽管卑鄙的人很多,但是成功者里鲜有存在,难道说,成功和卑鄙是互斥的吗?  我的这种想法或许是因为视角的
    微信朋友圈营销:如何寻找潜在客户?

    微信朋友圈营销:如何寻找潜在客户?

    您经常玩微信吧?您经常用微信朋友圈吧?微信的广泛使用,已经让很多人嗅到了商业的气味,比方说,您是不是经常在微信朋友圈看到:如果喜欢此文请转发;或者页尾会备注,欢迎关注某某公众号之类的!这都是微信朋友圈
    傅盛:创业为什么选择北上广深?

    傅盛:创业为什么选择北上广深?

    摘要:看到知乎上的一个问题为什么现在很多年轻人愿意到北上广深打拼,即使过得异常艰苦,远离亲人,仍然义无反顾?,13年时候我也曾经就我为什么要留在北京?有类似的疑问,节选部分知友和我的观点,跟远离家乡在
    万众创业 其实是骗局

    万众创业 其实是骗局

    为什么国家会提倡万众创业?因为社会就业压力变大,只能这样号召,马云曾说:我基本不响应政府的号召,原因是什么?你必须判断这样下去,政府在十年以后一定会做这件事情,所以你现在先把它做起来,等政府一号召,没
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面