当前位置:首页网站日志分析 新手入门指南 举报文章

网站日志分析 新手入门指南

作者:admin    来源:用户投稿    时间:2015.6.10   

  网站日志分析工作对老站长来说是非常容易的,从日志代码的查看到日志分析出的问题解决是了如指掌。其实网站日志分析不难,只是新手不了解其中的意思,才会觉得有问题。慢慢看多了网站日志你也就懂了其中的意思。这里我以幸运赛车网站的日志为例,交新手如何快速入门这项工作。

  其实代码没大家想象的那么难,当初我刚做彩票网站的优化工作,接触代码,我真觉得那些站长在好牛啊,这么难的幸运赛车http://www.7ien.cn/xysc.aspx网站日志代码都看得懂,崇拜之情无以言表。在看了一段时间网站日志后,才发现原来不是他们牛,是我还是菜鸟。自己摸索的话,对网站日志分析入门时间会比较久,在这里分享些经验,相信对于新手可以快速入门的。

  1、蜘蛛名称介绍

  在网站日志中,蜘蛛名称一般有一下几类:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider 。在日志中,只要搜索以上蜘蛛名称,就可以看到该蜘蛛类型的爬取痕迹。

  2、蜘蛛爬取返回类型

  在蜘蛛爬取后会返回代码,通过查看贷款状态可以看到爬取结果,主要HTTP状态码有一下几类:

  (1)200代码,表示蜘蛛爬取正常。

  (2)304代码,表示自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

  (3)404代码,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

  (4)302代码,表示临时重定向。

  (5)301代码,表示永久重定向。

  (6)500代码,表示程序有错。

  3、日志代码解读

  #Software: Microsoft Internet Information Services 6.0

  #Version: 1.0

  #Date: 2013-12-22 16:00:39

  #Fields: date time s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs-version cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken

  date表示记录访问日期;

  time访问时间;

  s-sitename表示你的虚拟主机的代称。

  s-ip访问者IP;

  cs-method表示访问方法,常见的有两种,一是GET,就是平常我们打开一个 URL访问的动作,二是POST,提交表单时的动作;

  cs-uri-stem就是访问哪一个文件;

  cs-uri-query是指访问地址的附带参数,如asp文件?后面的字符串id=12等等,如果没有参数则用-表示;

  s-port 访问的端口;

  cs-username 访问者名称;

  c-ip 来源ip;

  cs(User-Agent)访问来源;

  sc-status状态,200表示成功,403表示没有权限,404表示打不到该页面,500表示程序有错;

  sc-substatus 服务端传送到客户端的字节大小;

  cs–win32-statu客户端传送到服务端的字节大小;

  具体案例分析:

  2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

  这段日志表示,Baiduspider:表示蜘蛛爬取类型为百度蜘蛛,GET /a.aspx id=2230&TypeId=91表示蜘蛛爬取文件名为a.aspx id=2230&TypeId=91。返回结果为200。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:新手  网站  日志  分析  入门  指南  
  • 相关搜索
图片推荐
    短租分享,尚且大有可为

    短租分享,尚且大有可为

    国内短租公司近期迎来一大波融资潮,数据表明短租分享市场正呈指数级增长,催生出一片中国产Airbnb。针对于此,酒店并没有坐以待毙,酒店已经开始寻找对策,甚至是一起加入到分享经济。可相对于分享经济的鼻祖
    1万元成本:一个草根的互联网创业自白

    1万元成本:一个草根的互联网创业自白

    一个三无互联网草根创业者,以垂直网站为支点撬开O2O实践之路,而创业之初仅为1万元成本差点关闭网站。    很多朋友建议我写一写我的互联网创业史,我也尝试写过几次,但每每写完后都成了创业心得,讲了一堆
    RAKsmart美国服务器国庆优惠三重奏

    RAKsmart美国服务器国庆优惠三重奏

    美国加州RAKsmart服务器是国内中小企业和站长重点关注的美国服务器之一。美国RAKsmart机房运营多年,拥有庞大的用户群体和消费者,针对国内线路进行了专门的优化,并和国内联通、电信等直连,访问速
    如今网站建设技术虽已成熟 但这四个小细节不可忽视

    如今网站建设技术虽已成熟 但这四个小细节不可忽视

    如今的网站建设技术,已经日臻完美,可以说,对于客户来说,提出什么要求都能够满足,不过,想要做的更好,并非一件简单的事情,因为,在成熟技术的背后,超过他人的通常是一些小细节,而在这些细节背后,更能表现出
    百度URL定向投放吗  同属及从属都不重要

    百度URL定向投放吗 同属及从属都不重要

    前言  最近很多朋友开始问百度这个URL定向投放的事情,这个URL定向投放据说目前还是在内测,其对做SEO的也好,百度竞价推广的朋友来说无疑是一个新机遇和新挑战,有很大的冲击力,对在做百度搜索引擎的网
    讲解主域跟子域之间的关系 认清是否降权

    讲解主域跟子域之间的关系 认清是否降权

    上个星期到站长工具里查了一下,首页不在第一位了。当时并没有觉得多大的奇怪,因为这个情况见多了,正常情况下两三天就恢复了。可是这次居然一个多星期还没有恢复,让我感觉到有可能被降权了,因为排名全部往下掉了
    多说一声再见:评论框和分享按钮们的小历史

    多说一声再见:评论框和分享按钮们的小历史

    为独立建站者提供社交评论框服务的多说今天宣布将关闭服务。多说已经成为了目前国内份额最大的所谓社交评论框服务,但是这个行业第一并没有给它带来更多的收益和发展空间。  多说曾经的最大竞争对手是仅仅做了四个
    浅析建站过程中有效的关键词拓展方法

    浅析建站过程中有效的关键词拓展方法

    关键词是一个网站的灵魂,如果没有做好合理的关键词拓展工作,很多关键词即便拥有很好的排名,也很难获得很好的流量,所以关键词拓展的重要性不言而喻。本文针对笔者个人的实战经验浅析关键词的拓展方式。关键词的挖
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面