Web 日志分析过程

文章目录

Web 日志分析过程
一、日志格式学习
二、入侵日志分析

2.1 网站被入侵，分析解决思路:

2.1.1 下载日志分析 access.log+error.log
2.1.2 找到攻击者的 IP 地址
2.1.3 攻击者是如何找到网站后台的？
2.1.4 攻击者如何进入后台？
2.1.5 攻击者修改了什么文件来写一句话？
2.1.6攻击者通过一句话后门做了什么？

三、通过 SQL 注入日志分析

3.1 sql 入侵了，你现在需要做的是

3.1.1**下载日志文件之后，发现是都是类似的请求**
3.1.2 攻击者使用的方法属于 sql 注入中的什么方法?
3.1.3攻击者从什么时候开始用脚本跑数据的？
3.1.4攻击者的 payload 格式是怎样的，解译一下。
3.1.5攻击者拿到了什么数据？数据内容是什么？

Web 日志分析过程

日志分析，其实涵盖的面是很广的，什么地方都可以有日志。而本篇文章主要针对 web 日志做一下分析。因为之前去学校里授课的时候有讲过一次，感觉内容挺不错的，就写到了文章里。（可绝不是偷懒什么的呢o(´^｀)o）

相关资料及工具【链接: https://pan.baidu.com/s/1o7FcHui 密码: jpdn】

一、日志格式学习

一条访问信息记录如下：

218.19.140.242 - - [10/Dec/2010:09:31:17 +0800] “GET /query/trendxml/district/todayreturn/month/2009-12-14/2010-12-09/haizhu_tianhe.xml HTTP/1.1” 200 1933 “-” “Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 (.NET CLR 3.5.30729)”

共有九项内容：

218.19.140.242 ：这是一个请求到 apache 服务器的客户端 ip, 默认的情况下,第一项信息只是远程主机的 ip 地址,但我们如果需要apache 查出主机的名字,可以将 HostnameLookups 设置为 on, 但这种做法是不推荐使用,因为它大大的减缓了服务器。另外这里的 ip 地址不一定就是客户主机的 ip 地址，如果客户端使用了代理服务器,那么这里的 ip 就是代理服务器的地址,而不是原机.
-：The “hyphen” in the output indicates that the requested piece of information is not available. In this case, the information that is not available is the RFC 1413 identity of the client determined by identd on the clients machine. This information is highly unreliable and should almost never be used except on tightly controlled internal networks. Apache httpd will not even attempt to determine this information unless IdentityCheck is set to On
-: 这一项又是为空白,不过这项是用户记录用户 HTTP 的身份验证,如果某些网站要求用户进行身份验证,那么这一项就是记录用户的身份信息
[10/Dec/2010:09:31:17 +0800] ：第四项是记录请求的时间,格式为 [day/month/year:hour:minute:second zone], 最后的 +0800 表示服务器所处的时区为东八区
“GET /query/trendxml/district/todayreturn/month/2009-12-14/2010-12-09/haizhu_tianhe.xml HTTP/1.1”：这一项整个记录中最有用的信息,首先,它告诉我们的服务器收到的是一个 GET 请求,其次,是客户端请求的资源路径,第三,客户端使用的协议时 HTTP/1.1, 整个格式为 "%m %U%q %H" ,即"请求方法/访问路径/协议"
200 ：这是一个状态码,由服务器端发送回客户端,它告诉我们客户端的请求是否成功,或者是重定向,或者是碰到了什么样的错误,这项值为 200，表示服务器已经成功的响应了客户端的请求,一般来说,这项值以 2 开头的表示请求成功,以 3 开头的表示重定向,以 4 开头的标示客户端存在某些的错误,以 5 开头的标示服务器端存在某些错误,详细的可以参见 HTTP specification (RFC2616 section 10) http://www.w3.org/Protocols/rfc2616/rfc2616.txt
1933 ：这项表示服务器向客户端发送了多少的字节,在日志分析统计的时侯,把这些字节加起来就可以得知服务器在某点时间内总的发送数据量是多少。
-：HTTP Referer：告诉服务器我是从哪个页面链接过来的,没有值时可能是直接打开网页的原因。
“Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 (.NET CLR 3.5.30729)”： user-agent 这项主要记录客户端的浏览器信息