web应用程序指识别中的指纹收集
web应用程序指纹识别是入侵前的关键步骤,假设通过指纹识别能确定web应用程序的名称及版本号。下一步就可以在网上搜索已公开的漏洞。或网上搜到其源码然后进行白盒的漏洞挖掘。
指纹识别的核心原理是通过正則表達式匹配特征码或匹配文件的md5值。收集指纹的主要原则是程序独有的不会因环境和配置不同而改变的特征。
指纹主要从HTTP数据包中的下面内容提权:
1、指定路径下指定名称的js文件或代码。
2、指定路径下指定名称的css文件或代码。
3、<title>中的内容,有些程序标题中会带有程序标识,但不是非常多。
4、meta标记中带程序标识<meta name="description"/><meta name="keywords"/><meta name="generator"/><meta name="author"/><meta name="copyright"/>中带程序标识。
5、display:none中的版权信息。
6、页面底部版权信息,keyword© Powered by等。
7、readme.txt、License.txt、help.txt等文件。
8、指定路径下指定图片文件。如一些小的图标文件,后台登录页面中的图标文件等,一般管理员不会改动它们。
9、凝视掉的html代码中<!--
10、http头的X-Powered-By中的值。有的应用程序框架会在此值输出。
11、cookie中的keyword
12、robots.txt文件里的keyword
坚持收集各种程序的指纹,然后加入进自己写的扫描器,效果非常强大。