使用LogParser分析网站运行情况(比较简单)
使用LogParser分析网站运行情况(比较简单)
问题的提出
在经过若干天的辛苦劳动,你的网站终于上线了,虽然你的用户没有任何报怨,似乎你的程序也没有任何Bug。但是它真的像你想的那样运行的这么好吗?每天有多少个IP地址访问你的网站?你的网站经常被访问的页面哪些?这些页面载入需要花费多少时间?哪些页面是最慢的?
IIS日志
幸运的是,如果你使用IIS的话,IIS会为每一次请求记录下日志。查询IIS日志的方法如下(由于我机器是IIS7,图片是Google到的,图片来源见上面的水印,谢谢作者):打开IIS管理,点网站,右键选属性,然后出现下面对话框,选网站属性。
你可以通过上面的方法修改IIS日志的记录时间,记录的内容,保存的路径等信息。默认情况下IIS已经为你记录下了大部分有用的信息。,
LogParser简介
虽然有了IIS日志,但是我们如果在浩如烟海的日志中提取出我们需要的信息呢?幸运的是微软早就为我们准备好了一个不错的工具----LogParser。LogParser功能非常的强大,不但可以分析IIS日志,还可以分析系统事件日志,CSV,XML等格式日志,同时LogParser还支持编程接口,LogParser的帮助文档里自带了一个使用C#查询系统日志的例子。
下面给出LogParser的下载地址
LogParser的使用
下载,安装完成后执行LogPaser,会打开一个类似于命令行的窗口。我们先来执行一个最简单的查询
查找访问量最大的前10个页面
在LogParser的输入窗口输入
LogParser “Select top 10 cs-uri-stem , count(cs-uri-stem) as hits from D:"147"W3SVC1"ex090531.log Where TO_LOWERCASE(EXTRACT_EXTENSION(cs-uri-stem)) =‘aspx’ group by cs-uri-stem Order by hits DESC”
我来解释一下这句话的意思:LogParser的查询语法是一种类型于Sql的语法,和SQL语法很接近,但是不完全一样.
Select Top 10 这个不用解释了,和SQL语法一样,取出前十个符合条件的记录.
cs-uri-stem 是日志中的一列,表示用户请求的URI部分(不包括查询字符串)
Count 和SQL中的意义相同
AS 和SQL中一样,也是取别名
From 后面可以跟一个完整文件名,也可以跟一个 D:"147"W3SVC1"*.log 这样的文件名,甚至还可以一些特定的词 如后跟” System” 表示查询系统日志
Where 同SQL
TO_LOWERCASE 是LogParser提供的函数,用于将字符串转为小写
EXTRACT_EXTENSION 也是LogParser中提供的函数,用于从字符串中提取扩展名(是不是很贴心?)
后面的Group by 和Ordery By 以及 DESC都和SQL一样了
查找网站内运行最慢的10个页面
由于Time-Taken项目在IIS日志里是默认不记录的,你需要在查询之前在IIS里设置记录Time-Taken
LogParser “Select top 10 cs-uri-stem , max(time-taken) as t from D:"147"W3SVC1"ex090531.log Where TO_LOWERCASE(EXTRACT_EXTENSION(cs-uri-stem)) =‘aspx’ group by cs-uri-stem Order by t DESC”
查找所有返回404的请求
LogParser “Select cs-uri-stem ,count(cs-uri-stem) as hits from D:"147"W3SVC1"ex090531.log where sc-status=’404’ group by cs-uri-stem Order by hits DESC”
使用C#调用LogParser