当前位置:首页如何让网站页面内容不被抓取? 举报文章

如何让网站页面内容不被抓取?

作者:admin    来源:用户投稿    时间:2015.6.10   

  可能有的朋友会奇怪,网站的页面不是让搜索引擎抓的越多越好吗,怎么还会有怎么让网站页面内容不被抓取的想法。

  首先,一个网站可以分出去的权重是有限,哪怕是Pr10的站,也不可能无限的分权重出去。这权重包括链到别人网站的处链以及自己网站内的内链。

  外链的话,除非是想坑被链的人。否则外链都是需要让搜索引擎所抓取。这不在本文讨论范围之内。

  而内链,因为有些网站有不少重复或冗余的内容。比如一些按条件查询的搜索结果。特别是一些B2C站,在专门查询页或在所有产品页面的某个位置内,都可以按产品类型,型号,颜色,大小等进行分类搜索。这些页面虽然对浏览者来说是极大的方便,但对搜索引擎来说,这可是耗费蜘蛛极大的抓取时间,特别是网站页面较多时。同时也会分散页面权重,对SEO不利。

  另外网站管理登陆页面,备份页面,测试页面等等,也是站长不想让搜索引擎所收录的。

  所以就有需要让网页的某些内容,或某些页面不被搜索引擎所收录。

  下面笔者先介绍一下较为有效的几种方法:

  1.在FLASH展示不想被收录的内容

  众所周知,搜索引擎对FLASH的内容抓取能力有限,不能完全抓取所有FLASH内的所有内容。但遗憾的是,也不能完全保证FLASH的所有内容都不会被抓取。因为谷歌和Adobe正努力的实现FLASH抓取技术。

  2.使用robos文件

  这是暂时最有效的方法,但有个很大的缺点。就是不传出任何的内容及链接。大家知道,在SEO来说比较健康的页面应该是有进有出的。有外链的链入,同时也页面内也需要有链到外部网站的链接,所以robots文件控制,让此页面只进不出,搜索引擎也不知道内容是什么。会把此页定为低质量页面。权重有可能受一定的惩罚。这个多用于网站管理页面,测试页面等。

  3.使用nofollow标签包裹不想被收录的内容

  这个方法也不能完全保证不被收录,因为这并不是严格要求遵守的标签。另外,如果有外部网站链向了有nofollow标签的页面。这样就很有可能会被搜索引擎抓取。

  4.用Meta Noindex标签加上follow标签

  这个方法可以做到防止收录而且还能传递出权重。要不要传递,看网站建设站长自己的需要。这个方法的缺点是,也是会较大的浪费蜘蛛的抓取页面时间。

  5.用robots文件的同时在页面上使用iframe标签展示需要搜索引擎收录的内容

  robots文件可以阻止iframe标签以外的内容被收录。所以,可以把不想收录的内容放到正常页面标签下。而想被收录的内容放在iframe标签内。

  紧接着,再说一下已经失效的方法,大家以后不要用这些方法了。

  1.使用表格

  谷歌和百度早已经能抓取表格用的内容了,无法阻止收录。

  2.使用javascript及Ajax技术

  以现在的技术来说,Ajax和javascript现在的最终运算的结果还是以HTML的形式传给浏览器以作显示,所以这同样无法阻止收录。

  初学者大多着眼于如何收录,但细节决定成败。怎么让网站页面内容不被抓取也是SEO进阶人士需要注意的。

  本文出自云南盈岚科技有限公司(http://www.ynynyn.com/website-process/),尊重作者劳动成果,请在转载时注明出处。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:如何  网站  页面  内容  不被  被抓  抓取  
  • 相关搜索
图片推荐
    浅析:网站优化之负面排名的因素有哪些

    浅析:网站优化之负面排名的因素有哪些

    每一位站长都希望自己的网站建成之后,能在几个月内冲到百度首页,然后开始赚钱,这是每一位站长的梦想,但是我们有这个目标后,我们也应该多了解一下,如何让一个网站能够健康发展,做到让蜘蛛喜欢,让用户喜欢,这
    古华京:六大做微商的误区

    古华京:六大做微商的误区

    同学们,近来,关于微商售假、微商传销、微商透支信任关系等评论此起彼伏,随着央视等媒体的连篇累牍的报道追踪,微商的负面形象在用户的心目中越积越深,对微商的误解也与日剧增。下面笔者就纠正一下对微商的误解都
    李开复:台湾创业环境需下重药医治

    李开复:台湾创业环境需下重药医治

    李开复:台湾创业环境需下重药医治  新浪科技讯 10月29日中午消息,据台湾《联合报》报道,创新工场CEO李开复近日表示,台湾的创业环境充满困难与危机,台湾创业者不能再以台湾小市场为目标,而是要放眼全
    百度策略对网页质量的压迫,命运堪忧的B2B该何去何从

    百度策略对网页质量的压迫,命运堪忧的B2B该何去何从

    五月将尽,在这个充满黑暗的五月份,百度发布了《百度网页搜索质量白皮书》,虽然白皮书还只是大纲,但已经让很多站长的小心脏承受不住,而且有不少站长因网站索引量大跌和网站权重被降而处于精神崩溃的边缘,尤其是
    只有坚持还不够 为什么你的网站上不了百度首页

    只有坚持还不够 为什么你的网站上不了百度首页

    想上百度首页吗?想,谁不想我也想!可是,有时候你觉得自己明明已经很努力了,每天坚持做的优化也很多,文章外链也发了很多,但是排名却一直上不去。这是为什么呢?其实想让百度排名上去,坚持固然重要,一些细节同
    帮黄瓜贴二维码 千米网杀入农产品市场

    帮黄瓜贴二维码 千米网杀入农产品市场

    3月3日消息,据获悉,国内电商系统及服务提供商千米网日前推出了以二维码为核心的农产品电商解决方案,借此杀入农产品电商市场。    据了解,该二维码可作为农产品的唯一标识,贯穿从生产、采购、流通到销售的
    全球互联网上十大访问量最大的网站

    全球互联网上十大访问量最大的网站

    1.Facebook.com - 8.367亿独立访问者:Facebook创始人兼CEO马克·扎克伯格(Mark Zuckerberg),在哈佛二年级的时候,发布了这一网站。起初这一网站仅向哈佛学生开
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面