当前位置:首页谈谈怎么利用服务器日志来分析我们页面为什么不被收录 举报文章

谈谈怎么利用服务器日志来分析我们页面为什么不被收录

作者:admin    来源:用户投稿    时间:2015.6.11   

  很多人都在说原创,每天去采集,然后修改后,重新发到自己的网站上,但是不知道你木有想过一个问题,我们发的文章有没有意义,为什么不被收录,蜘蛛怎么去认为我们发的文章有没有意义。

  在这之前,我们得知道服务器日志在哪里寻找,服务器日志一般存在于FTP空间一个Log的文件夹下,并且是tor后缀结尾。将他下载后,解压后我们得到俩个文件,将有大小文件后缀名更改为域名.txt 然后打开。我们会得到一大串文字字符,不要担心从何看起,我们一条条的分析。但是我们首先得知道那些IP所代表的意思。下面我都列出来了。

  Baiduspider=Baiduspider蜘蛛

  Googlebot=Googlebot蜘蛛

  Sogou=Sogou蜘蛛

  Yahoo=Yahoo蜘蛛

  360Spider=360Spider蜘蛛

  123.125.68.=123.125.68沙盒

  220.181.68.=220.181.68沙盒

  220.181.7.=220.181.7预备抓取

  123.125.66.=123.125.66预备抓取

  121.14.89.=121.14.89新站考察

  203.208.60.=203.208.60网站异常

  210.72.225.=210.72.225巡逻

  123.125.71.106=123.125.71.106低权重

  123.125.71.95=123.125.71.95低权重

  123.125.71.97=123.125.71.97低权重

  123.125.71.117=123.125.71.117低权重

  123.125.71.=123.125.71低权重汇总

  220.181.108.95=220.181.108.95隔日快照

  220.181.108.92=220.181.108.92权重抓取

  220.181.108.91=220.181.108.91综合权重

  220.181.108.75=220.181.108.75内页权重

  220.181.108.86=220.181.108.86权重首页

  220.181.108.89=220.181.108.89权重首页

  220.181.108.94=220.181.108.94权重首页

  220.181.108.97=220.181.108.97权重首页

  220.181.108.80=220.181.108.80权重首页

  220.181.108.77=220.181.108.77权重首页

  220.181.108.83=220.181.108.83权重首页

  220.181.108.=220.181.108权重蜘蛛汇总

  我们就其中一条分析

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) Gecko/20101026 Firefox/3.6.12 QQDownload/1.7'

  根据上面的定义分析:

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html这句话代表的意思是谷歌蜘蛛在2014年6月24号,15:12:04来我的网站抓取了xingyexinwen/129.html 这么一条URL,然后将其放到沙盒中(123.125.68.45 代表沙盒蜘蛛。)

  HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) '至于这个,其中的200是返回码,代表是正常,当然返回码还有301、404、302、304等等一些,可以去查一下代表的意思。其他代表是它访问电脑的属性,swindows操作系统等等。

  不知道看了这些,你晕了没有,当然我们一般习惯用exec表格去分析日志,将txt文件导入表格中,能够帮助我们更直观的去分析日志,知道蜘蛛在我们网站上抓取了哪些内容,然后将内容定义为什么。当然还可以利用日志分析软件来分析。

  关于更多,也可以搜索MOON虫博客www.croelhui.com,需要我介绍什么,欢迎大家给我留言。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:谈谈  怎么  利用  服务  服务器  日志  分析  我们  页面  为什么  
  • 相关搜索
图片推荐
    庶民屌丝淘客电商的胜利契机

    庶民屌丝淘客电商的胜利契机

    小舟先来跟大家分享一段数据,就去年,阿里妈妈给淘宝客们的佣金分成高达30亿元RMB,这不是重点,重点是来自移动端(平板,手机等)所提供的佣金分成就高达10亿元RMB,高达总额的3分之1。这是站长淘客们
    卖家提高转化请用友爱方程式

    卖家提高转化请用友爱方程式

    提到转化,百度一下漫天文章飞。我所说的友爱方程式,其实也不是那么的遥远,人人都可触及。    上图是推哈网在跟众多卖家朋友交流时总结出来的,也许你感觉看不懂。其实没有那么高大上,下面我就跟大家一起学习
    SERP中出现图文标志攻略大分析

    SERP中出现图文标志攻略大分析

    近日在界内开始了关于百度搜索结果出现图文标志的讨论,但现在只是止于谈论,未有人深入解析。例如在非凡网赚网 08398.com 就有看到了几篇文章是关于该事件的。  百度鼓励高质量的文章,对图文并茂的文
    传说中《太子妃升职记》的独门营销秘籍,被我们拿到了

    传说中《太子妃升职记》的独门营销秘籍,被我们拿到了

    为了揭秘爆红的《太子妃升职记》的营销路数,我们找到了乐视自制传播及营销负责人花生、《太子妃升职记》的营销团队时趣互动团队谈了谈这部神剧为何成功。  剧组真不穷,监制可是乐视网老板娘啊  全网说烂的剧组
    人性弱点的逆向网络营销思维

    人性弱点的逆向网络营销思维

    我们大都基于搜索引擎中的流量和趋势来分析及研究流量的来源和价值,我们是否研究过整个互联网中网名整体层次及计算机水平呢?做的最好的网站无疑都是最接 地气的,那么,接地气需要具备哪些条件呢?站长之家,非凡
    创新工场联合创始人汪华:2014,创新者去哪儿

    创新工场联合创始人汪华:2014,创新者去哪儿

    新浪科技讯 1月10日晚间消息,2014年极客公园创新大会今天在京举行,创新工场创始人、管理合伙人汪华先生在会上的分享主题为《2014,创新者去哪儿?》。汪华认为,创新是为了满足需求,而所有创新都来自
    批量检测被百度收录的死链的方法

    批量检测被百度收录的死链的方法

    前段时间服务器被入侵,挂了很多博彩之类的黑页,而且全部被百度收录。  现在把漏洞补好了,但删除黑页文件以后成了死链,要怎么让百度删除收录呢?  在网上找了一下,似乎只有检测网址是否被收录的工具,而没有
    创业一年,人人车是怎么躲过“C轮死”的?

    创业一年,人人车是怎么躲过“C轮死”的?

    摘要:创业公司最怕什么?第一,进错了行;第二,遇上了狼。    本文是人人车创始人李健的自述投稿。最近,人人车C轮巨额融资的消息在业内不胫而走,虽然人人车官方未作回应,但是事件本身的影响力却并未因此削
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面