当前位置:首页谈谈怎么利用服务器日志来分析我们页面为什么不被收录 举报文章

谈谈怎么利用服务器日志来分析我们页面为什么不被收录

作者:admin    来源:用户投稿    时间:2015.6.11   

  很多人都在说原创,每天去采集,然后修改后,重新发到自己的网站上,但是不知道你木有想过一个问题,我们发的文章有没有意义,为什么不被收录,蜘蛛怎么去认为我们发的文章有没有意义。

  在这之前,我们得知道服务器日志在哪里寻找,服务器日志一般存在于FTP空间一个Log的文件夹下,并且是tor后缀结尾。将他下载后,解压后我们得到俩个文件,将有大小文件后缀名更改为域名.txt 然后打开。我们会得到一大串文字字符,不要担心从何看起,我们一条条的分析。但是我们首先得知道那些IP所代表的意思。下面我都列出来了。

  Baiduspider=Baiduspider蜘蛛

  Googlebot=Googlebot蜘蛛

  Sogou=Sogou蜘蛛

  Yahoo=Yahoo蜘蛛

  360Spider=360Spider蜘蛛

  123.125.68.=123.125.68沙盒

  220.181.68.=220.181.68沙盒

  220.181.7.=220.181.7预备抓取

  123.125.66.=123.125.66预备抓取

  121.14.89.=121.14.89新站考察

  203.208.60.=203.208.60网站异常

  210.72.225.=210.72.225巡逻

  123.125.71.106=123.125.71.106低权重

  123.125.71.95=123.125.71.95低权重

  123.125.71.97=123.125.71.97低权重

  123.125.71.117=123.125.71.117低权重

  123.125.71.=123.125.71低权重汇总

  220.181.108.95=220.181.108.95隔日快照

  220.181.108.92=220.181.108.92权重抓取

  220.181.108.91=220.181.108.91综合权重

  220.181.108.75=220.181.108.75内页权重

  220.181.108.86=220.181.108.86权重首页

  220.181.108.89=220.181.108.89权重首页

  220.181.108.94=220.181.108.94权重首页

  220.181.108.97=220.181.108.97权重首页

  220.181.108.80=220.181.108.80权重首页

  220.181.108.77=220.181.108.77权重首页

  220.181.108.83=220.181.108.83权重首页

  220.181.108.=220.181.108权重蜘蛛汇总

  我们就其中一条分析

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) Gecko/20101026 Firefox/3.6.12 QQDownload/1.7'

  根据上面的定义分析:

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html这句话代表的意思是谷歌蜘蛛在2014年6月24号,15:12:04来我的网站抓取了xingyexinwen/129.html 这么一条URL,然后将其放到沙盒中(123.125.68.45 代表沙盒蜘蛛。)

  HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) '至于这个,其中的200是返回码,代表是正常,当然返回码还有301、404、302、304等等一些,可以去查一下代表的意思。其他代表是它访问电脑的属性,swindows操作系统等等。

  不知道看了这些,你晕了没有,当然我们一般习惯用exec表格去分析日志,将txt文件导入表格中,能够帮助我们更直观的去分析日志,知道蜘蛛在我们网站上抓取了哪些内容,然后将内容定义为什么。当然还可以利用日志分析软件来分析。

  关于更多,也可以搜索MOON虫博客www.croelhui.com,需要我介绍什么,欢迎大家给我留言。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:谈谈  怎么  利用  服务  服务器  日志  分析  我们  页面  为什么  
  • 相关搜索
图片推荐
    从用户注册输入验证码来说 用户体验真的很差

    从用户注册输入验证码来说 用户体验真的很差

    不用验证码可不可以?对于老网民来说,曾经有过那么一段黄金岁月,注册任何网站,玩任何网络游戏,根本就没有验证码这一说。不过,好日子并没有享受多久,现在无论注册什么网站、论坛、玩游戏、支付都需要验证码,什
    淘宝客引流/微信引流的思路分析和技巧分享

    淘宝客引流/微信引流的思路分析和技巧分享

    大家好,我是前锋。抱歉,最近都比较忙,没有和大家交流机会。今天跟大家分享一个引流的技巧和关于淘宝客的干货。引流的方法和技术有很多种,只要抓住一个小模块,做精了就很牛!  我最擅长的是淘宝引流和微信淘宝
    如何利用4种参考群体的力量 去影响你的消费者?

    如何利用4种参考群体的力量 去影响你的消费者?

    【Re-think】  群体力量  这篇文章,带你重新思考,营销中很多人忘记使用的一种力量群体。  (内容部分来自之前去唯品会培训的演讲,现在分享给各位。)  我看过很多这种文案:  我的产品,开机快
    世界杯时段全民大热,互联网的各种借势营销

    世界杯时段全民大热,互联网的各种借势营销

    世界杯来了,在北京花两块钱都能游遍全世界了。  能引起全民注意的持久性运动,一直都颇受企业重视,2006年青岛啤酒搭乘德国世界杯、一路青云直上,2010年海尔携手央视大型足球娱乐节目《豪门盛宴》推出我
    今日头条与腾讯缘尽 个性化资讯市场依然充满变数

    今日头条与腾讯缘尽 个性化资讯市场依然充满变数

    腾讯投资今日头条的消息被传得沸沸扬扬。今天凌晨今日头条CEO 张一鸣在头条问答进行了侧面辟谣:最近有同事郑重地跟我说,他加入头条的目的不是为了成为腾讯员工。我当然也不是,多没意思。,几乎封死了今日头条
    谷歌CEO收入过亿 但他曾是个印度穷孩子

    谷歌CEO收入过亿 但他曾是个印度穷孩子

    执掌谷歌第一年的桑达尔皮查伊(昵称劈柴哥)这下可乐了,因为他在2015年的收入已经超过了1亿美元。而他从印度的一个穷孩子变成谷歌的CEO,可谓是最励志的成功故事。    劈柴哥薪酬超过一亿  在谷歌母
    .top域名使用中的困扰

    .top域名使用中的困扰

    说正事。我们最近在搞一个新的网站做在线教育,因为现在好的域名实在不好注册,所以我们选择了比较新的域名.top 。虽然在一开始注册时也想到会不会百度收录有问题。但是还真没想到困扰远不如此啊。  就拿今天
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面